このページの先頭です

メニューを飛ばして本文を読む

ここから本文です

サイト内の現在位置

研究者情報:研究・産学連携

研究室紹介OPAL-RING
松吉 研究室

計算言語学からAIの開発に貢献する

所属 大学院情報理工学研究科
情報学専攻
メンバー 松吉 俊 助教
所属学会 情報処理学会、言語処理学会
研究室HP http://www.cl.inf.uec.ac.jp/
印刷用PDF

掲載情報は2017年3月現在

松吉 俊 Suguru MATSUYOSHI
キーワード

計算言語学、自然言語処理、人工知能、意味処理、テキストコーパス、アノテーション、コンピュータ用の辞書

近年、人工知能(AI)の研究が盛んに進められていますが、コンピュータに人間の「ことば」を理解させるためには、人間がことばを巧みに操る仕組みを言語学の観点からきっちりと解明する必要があります。松吉俊助教は、数学をバックグラウンドとして言語学を専攻する日本では数少ない「計算言語学」の専門家として、こうした研究に取り組んでいます。

コンピュータにことばを解析させる研究というと、理系の情報工学に属する「自然言語処理」分野の研究者が専門にするのが一般的です。これに対して松吉助教は、どちらかと言うと文系の言語学に属する「計算言語学」の観点から研究を進めています。言語を軸にした、文系と理系とを融合させた領域といえるでしょう。

意味解析システム開発に向けたデータを提供

松吉助教が手がけているのは、コンピュータにテキスト(文章)の「意味解析」などを行わせる研究です。日本語テキストの言語解析ツールとしては、“分かち書き”のない日本語の文字列を語句の列に分割する「形態素解析」や、動詞に関係する主語や目的語などの名詞を特定する「構文解析」についての高精度なシステムは開発されていますが、意味解析のシステムはまだ研究の段階です。

意味解析においては、「モダリティ」と呼ばれる、命題に対する情報発信者の“主観的な態度”を分析することが重要です。しかし、従来はモダリティをコンピュータに分析させるための有効なデータがなく、そのため意味解析システムの開発が遅れていました。

松吉助教は、新聞やインターネット上の文章などのテキストデータを言語学の分類法に基づいて分析しラベル付け(アノテーション)を行うことで、モダリティ解析ツールを開発する上で基盤となる約4万2000文のデータ(テキストコーパス)を作成しました。これを既存の機械学習システムへ入力し、解析ツールを試作したところ、約60%の精度で日本語のモダリティを初めて解析できました。これにより図3に示すように、「事実」「伝聞」「推量」といった、多様な文章におけるモダリティを自動で判別可能になりました。

「否定」や「皮肉」も解析させる

また、「否定文」の解析に向けたデータの作成にも取り組んでいます。例えば、既存の枠組みでは、図4のように「力を出し切って敗れたわけではない」という否定の文章を、「敗れなかった」のではなく、「敗れた」と正しくコンピュータに解釈させることは容易ではありません。
そこで松吉助教は、テキストにおける否定の「焦点」をコンピュータに的確に検出させるため、先ほどのようなテキストデータに対して言語学的アノテーションを行い、1327事例の否定文のデータを作成しました。このデータを用いて開発した辞書や知識を搭載したシステムは、73%と高い精度で否定文を正しく理解することができます。
同様にして、「皮肉」の自動検出も目指しています。皮肉文は、表面的な文字列をそのまま解釈しただけではその意図を読み取れないため、コンピュータにとっては非常に難易度の高い問題です。松吉助教は皮肉文を正しく認識させるためのデータ群や辞書を作成し、これによって、従来の枠組みを使った場合よりも、意味解析の精度を約2、3倍向上させました。

そのほか、コンピュータに自動推論や含意認識を促す研究も行っています。ある問いが与えられた時に、その内容を含意する記述をネット上から検索したり、逆に、それと矛盾する記述を検索したりして明確な根拠のある回答を導く試みです。松吉助教は、こうした含意認識の「コンテスト」のためのデータも作成しています。例えば、センター試験の問題をAIで解くなどの応用が期待されています。


人間のことばを理解するAI

このように言語学に基づく良質なデータによって、「テキストの“深い意味”をコンピュータが的確に理解できるようになれば、今後、言語解析システムの改良が一段と進むだろう」と松吉助教は期待しています。それによって、いずれ人間のことばを正確に理解するAIが実現することになるでしょう。

一方で、まだ難しい問題は数多く残っています。例えば、「行間を読む」「空気を読む」といった、人間のような知的判断が今後、AIにも求められるかもしれません。比喩や歌、言葉遊びなどの理解が進めば、AIとのコミュニケーションは一層楽しくなりそうです。真のAIの実現には、理系の知識だけでなく、文系の視点も入れていくことが重要なことは間違いありません。松吉助教は、このような言語処理の分野で「文理の橋渡しができる」と考えています。

【取材・文=藤木信穂】

研究・産学連携