小町研の日常@しん

小町研にきて早1年,自然言語処理を学び始めたとある学生の日記

DSIRNLP 07に参加した話

GW中の休日に開かれた,データ構造と情報検索と言語処理勉強会(DSIRNLP 07) に参加してきました.

一応私もLT枠で発表させてもらいました.LTなので発表というよりは報告という感じだったのですが.

今回のDSIRNLPは完全に自然言語処理に寄った内容だったのですが,自然言語処理の中でもほとんどが形態素解析をメインとした発表で,かなり興味深かったです.

DSIRNLは私含めて自然言語処理初心者の方が多数参加する勉強会で,自然言語処理を専門としない人も多いはずなのですが,形態素解析自然言語処理全体の基礎分野なので,誰からしても取っかかりやすい勉強会でした.

 

全体を振り返る

まず@echizen_tm さんがAdamファンタジスタドール イブの有益な情報について発表してくださり,Adamの話は置いておいて,D進するとすごい!ということがわかりました.懇親会で@echizen_tm さんに,ファンタジスタドールを1話しか見ていないことを報告すると,サーベイ不足だというお言葉を頂いたので,次回のDSIRNLPまでに最後まで見て進捗報告します.

2番目は,会場を提供してくださっていたデンソーアイティーラボラトリの@uchumik さんでスライドはこちらです. 年次大会と同じ内容で,教師なしで単語分割と品詞推定の同時学習を行うお話でした.まだ教師ありの形態素解析には勝てなそうですが,半教師ありにすることで精度を向上させることができますし,しょこたんブログが評価のデータセットになれば良い勝負をするんじゃないのかなと感じます.これからは打ち言葉で書かれたデータを解析する機会が増えるはずですし,形態素解析の評価方法とともに,新たなブレイクスルーを@uchumik さんが起こしてくれるみたいです.

3番目はジャストシステム@klmquasi さんで「形態素解析器 売ってみた」というタイトルだったのですが,タイトル通り,形態素解析器を売る側のお話でした.辞書追加>>>>>>>>新しい学習方法 というもっともなお話をされていたのですが,@uchumik さんの 新しい学習方法 の発表の後だったため良い感じに比べながら見ることができました(笑). 個人的には4月にジャストシステムで開催されたJustTechTalkに参加していたのでまたそっちの参加報告ブログを書きたいと思います.

4番目は東工大の奥村・高村研の@cacaho さんのお話で,「最近のJUMANのKNP」というテーマでJUMANの未知語処理のお話や,どういう場面でKNPを使うべきかというお話でした. 実はこの内容,3月の年次大会の招待講習で話されたことと似ていたようなのですが,私はその招待講習中に清水寺へ行っ用事があって聞きそびれていたので,ここで聞けてめちゃくちゃ運が良かったです. JUMANが想像以上に今の打ち言葉に対応していたり,synchaとKNPの使い分けるべき場面などを知ることができて,個人的には一番学ぶことが多かったです. JUMANやKNPの名前の由来も話されていたのですが,名前が付くくらい使われるシステムを作ってみたいものです.

5番目は我らが@moguranosenshi 大先生の発表で,「日本語の語彙平易化システムおよび評価セットの構築」についてでした. 個人的には知っている内容だったのと,自分のLTのPPTが完成していなかったので,内職させてもらいました(反省しています).大先生が後日研究室で言っていて共感したのですが,DSIRNLPやこういった勉強会で発表すると,学会などでいただける質疑などとは違う種類のリアクションがいただけて,すごく学べることが多いです.懇親会でも評価方法などについてもいろいろと意見をいただいていて,さすがDSIRNLPといった感じでした. 私も研究室で語彙平易化の勉強会に参加しているのですが,語彙平易化や言い換えはものすごく応用範囲が広いですし,うまく自分の研究に絡めつつ勉強していきたいところです.

トリを飾ったのはいつもお世話になっているLineの@overlast さんで,DSILNLPを主催してくださっています.内容は「 mecab-ipadic-neologd の現状と今後の展開」で,IPA辞書を使っている際の「新語が辞書に登録されていなくて困る問題」を大幅に軽減できるmecab-ipadic-neologdのお話で,新語や固有名詞をどんな感じで突っ込んでいるかというものでした.IPA辞書を拡張したシステム辞書を公開してくださっているだけではなく,めちゃくちゃマメにアップデートされていて,Twitterでアップデート完了の通知が来るたびに,いつもすごいと感じています.(かつ個人的にもいつも優しく対応してくださって感激しています.)

全体のトークはここまでで,この後にピザとお酒を手に取りながらLTへと突入してサイボウズ・ラボの@shuyoさんと私@shin_kan0が発表させてもらいました(略).@shuyo さんの懇親会でのお話では,tweetの言語判定をするためにすごい数の言語のアノテーションをした,というものが興味深かったのと同時に,自分には無理だと感じました笑.

 

全体を通して感想を言うと,勉強会は(偶然らしいですが)本当に形態素解析に特価した内容で,この日1日で過去最高に形態素解析について勉強できました.形態素解析の評価方法に対する意見や考えも所々で飛んでいて,考えさせられました. さらに懇親会ではいつも以上に貴重なお話を伺うことができて,(最後の方は主に@uchumikさんの貴重な面白いお話でしたが,)終電1本前まで有意義な時間を過ごすことができました.

いつもは勉強会が終わると,ためになった!と感じても,その後の懇親会が終わると,懇親会がメインだった!となるのですが,今回は本当に両方とも勉強になりました.またこのような勉強会があった場合には全力でに参加していきたいです.

以上参加報告でした.