小町研の日常@しん

小町研にきて早1年,自然言語処理を学び始めたとある学生の日記

4月と5月に私が参加した勉強会まとめ

4月と5月にいくつかの勉強会に参加することができたので,まとめて記録する.

本当は勉強会が終わるごとに,分けて記事にしたかったのだが,気づいたら6月になっていたので,ここでまとめて早めに成仏;;(南無南無)

そしてこのブログ,未だに語尾が安定しないのである.(今回はであるにする.)

今回参加した勉強会は以下である.

それぞれについて説明していく.

JustTechTalk#01 「ことば」を扱うサービス・アプリの裏側@ジャストシステム(2015/04/17(金))

新宿のジャストシステムのオフィスで行われた勉強会へ参加. 内容としてはジャストシステムのアプリ・サービスの裏側と、株式会社ぐるなびのサービスの裏側についてで,

の3本立て.それぞれ少しずつ話すと,(1,3番目はスライドあり)

  • ATOKの裏側の話はATOKiOSの実現に至るまでの軌跡で,ATOK EVエンジンを削って圧縮してiOSに乗っけた,という話.自然言語処理の技術的なお話は無かったのでここでは省略.

  • ぐるなびの検索の裏側(仮)は株式会社ぐるなびのプラットフォーム開発グループ・サーチエンジンチームの中村さんによる,ぐるなびの検索における言語処理系の問題点のお話で,実際の検索の精度をはかるのって難しいよね,というもの. 細かなエラーが多いように感じたが,現在の自然言語処理の技術を利用する際には,細かいエラーの修正の繰り返しなんだなと実感(笑)

  • 3つ目はジャストシステム@klmquasiさんによる,形態素解析器 売ってみたというタイトルで,形態素解析器を売る際にどのようなことが問題になり得て,どう改善してしているのかのお話.統計手法によってエラーの数を減らすことが出来ても,深刻なエラーに対処することができなかったり,エラーに一貫性がないとユーザに説明できなかったり,学習の度に結果が変わると困ったりするという,研究とは違い,売るための問題点が数多くある事実を思い知らされたのであった.

勉強会後に行われた懇親会では,運良くジャストの@klmquasiさんとLineの@overlast さんさんと同じテーブルに座ることができ,ジャストのもっと深い話と,現在の形態素解析の問題点と在り方についての深いお話を聞くことができた.なお私は,懇親会が無料だったのでそのお金でATOK iOSを購入した模様.



Recruit Technologies Open Lab #01 テーマ:自然言語処理(2015/04/21(火))

定員が100人でもいっぱいになって最終的に150人まで拡大されるほど多くの方が集まった勉強会.さすがリクルート.発表者はうちの小町先生とリクルート@takahi_iさんでした.

  • 小町先生は自然言語処理の新展開というタイトルで自然言語処理の今後について発表であったが,スライドも小町先生のその日の日記も公開されているのでここでは省略.

  • 伊藤さんはATLにおける自然言語処理関連技術の紹介と題してRedPenパン田一郎についてのお話で,RedPenは文書の品質検査をしてくれるツールなのだが,個人的にはこういうものをあまりうまく使えた記憶がない...PPTで英語の頭文字の小文字を自動で大文字に変えられては直してを日々繰り返している(苦笑).

    しかし,texにも対応させようとしているというお話があり,これは使ってみたいと感じた.小町研では論文を書く時は初めから小町先生に添削をお願いしていたのだが(3月まではDの方が一人もおらず,論文を見てもらえる方が誰もいなかった.), ちょっとした日本語のミスもいちいち小町先生に訂正してもらうのが,とてつもなく申し訳なく,だからといって自分では気付けい間違いだったりする(汗).そのあたりのミスがRedPenでなくなってくれたら,みんなハッピーになれそうな予感.パン田一郎の話は,またそのうちする機会が訪れる気がするので省略.

勉強会が終わった後はピザを食べながらの懇親会.こういった勉強会の懇親会は,学生の料金を無料にしていただける場合が多い.学生にとっては有益な話を聞くことができるだけではなく,ご飯も無料で食べることができる.逆に失うものは,この勉強会に参加していた時間くらいなもので,個人的には参加しない理由がない.

言語処理系の勉強会に参加していると,ニュースキュレーションサービスを提供している会社の方とよくお会いする. この日はグノシーの方と,myndの方とお話しすることができて, グノシーの方は,直接しゃべっているときは気付かなかったのですが,名刺の名前を見ながらよくよく思い出すと,自然言語処理のための深層学習のスライドの先頭に出て来る方で,帰りの電車の中でピンときてフォローさせていただいた. 小町研の学生は皆,この深層学習のスライドをかなりの回数見ているのである(笑).



データ構造と情報検索と言語処理勉強会(DSIRNLP 07) (2015/04/29)

前回記事にしたので全省略.



ウェザーニューズ講演会@TMU(2015/04/30)

年次大会でお会いしたウェザーニューズ@mhangyoさんらが首都大内で講演をしてくださり,プログラムは2本立て.

  • 「気象情報会社に於ける物作り」 @山本雅也さん
  • 「グローバルビジネスを支えるIT技術」@mhangyoさん

講演自体は通信半分・情報半分で,情報と通信が半々であるうちのコースの学生からすると,誰もが興味を持てる構成になっていた. 講演からは,ウェザーニューズのやってきたこと,やっていることだけではなく,mhangyoさんらがいろいろと野望を持っていることが伺えて,楽しむことができた.ウェザーニューズのデータはNLP的に面白そうで,年次大会のyans懇でmhangyoさんとお話をしたときにも,何ができるかを常に考えることが大事で,今も常に考えている,というようなことをおっしゃっていてすごく共感した.私も常に何ができるか考え続けて,チャンスを前髪でつかめるようにしていたい.



学会:第69回人工知能セミナー「音声翻訳技術の現在、未来」(2015/05/11)

前半が機械翻訳で後半になるにつれて音声っぽくなる感じで,プログラムは以下.

  • 「統計的手法に基づく機械翻訳@tarowatanabeさん
  • 「音声翻訳技術」@neubigさん
  • 東芝における音声翻訳技術への取り組み」@釜谷 聡史さん
  • 音声合成の現在と音声翻訳のための新技術」@山岸 順一さん

毎回思うのだが,@tarowatanabeさんのスライドはクスっと笑える小ネタが多く,全く眠たくならないのである.やはりプレゼンは,わかりやすさと同じくらい面白さが大事だなと感じさせられる. 内容は,この本+最新の深層学習の話.

機械翻訳 (自然言語処理シリーズ)

機械翻訳 (自然言語処理シリーズ)

@neubigさんは,音声翻訳に向けた2つの課題として,音声結果を早く聞き手に届ける「同時音声翻訳」と,音声の表現力を維持して翻訳する「音響特徴の翻訳」に焦点を当てて説明してくださった.

あと二つは音声寄りだったのでここでは省略.

今回は,この勉強会で何かを知りたかったというよりは,私自身が機械翻訳をはじめる上で,@tarowatanabeさんと@neubigさんに挨拶しておきたかった,という点が大きく,勉強会がおわった後に@tarowatanabeさんと@neubigさんにくっついて話を聞いていた所,ご飯に連れて行っていただけた(感謝).私は4月まで翻訳に全く関わっていなかったので,お二方とは直接お話しをしたことがなく,一方的に発表を聞いたり,@neubigさんのチュートリアルを解いたりしていただけだったのである.お肉を食べながら,私の研究の話はもちろん,関東で機械翻訳を勉強している人が少ないという話や,@tarowatanabeさん的には誰でも一瞬で入れられるSRILMを,去年の私は小町先生の助けを借りながら数日かけて入れた話などもした(笑). f:id:shinkanouchi:20150608041214j:plain

NHK技術公開2015 @NHK放送技術研究所(2015/05/29)

8Kスーパーハイビジョンを中心にいろいろすごかったのだが,

このあたりについて詳しく聞いてきた.今年度に入ってから小町研では,@moguranosenshi 大先生のおかげで語彙平易化の大ブームが起きており,それに関連する論文を読む読解支援勉強会が週2回開かれている.私もこの勉強会に参加しているのでそれに関連する勉強として,この技術公開2015へ行ったのである.もちろんこの技術公開2015で語彙平易化の勉強にもなったのだが,実際には他に思わぬ大きな収穫があり,「ニュースをやさしい日本語にする自動変換技術」の説明をしてくださったNHKの後藤さんが機械翻訳の事前並び替えについてのスペシャリストで,ブースとは関係のない機械翻訳の事前並び替えについていろいろと教えていただけたのである(感謝).



全体の感想

4,5月は私が個人的にサーベイ期間だったこともあって積極的に勉強会へ参加したが,すべてにおいて行って良かった.勉強会は特に得られる情報がなくても,似た研究をしている外部の方と話すことで,研究をする上でのモチベーション管理に役立つと思っている.しかし今回参加した勉強会は,モチベーションの管理以外にも単純に得られた知識や人とのつながりが多く,大きな収穫が多かった.今後も,東京にいることを生かして,東京周辺で言語処理系の勉強会が開かれている場合には,積極的に参加していきたい. (そしてこの記事を書いている間になぜか外が明るくなってきたので,もっと短くしていきたい.)