このページの先頭です

メニューを飛ばして本文を読む

国立大学法人 電気通信大学

訪問者別メニュー

ここから本文です

研究者情報:研究・産学連携

研究室紹介OPAL-RING
内海 研究室

人間により近いAI開発に向けた自然言語処理と認知科学の研究

所属 大学院情報理工学研究科
総合情報学専攻
メンバー 内海 彰 教授
所属学会 日本認知科学会、人工知能学会、情報処理学会、言語処理学会、日本語用論学会
研究室HP http://www.utm.se.uec.ac.jp/
印刷用PDF

掲載情報は2021年5月現在

内海 彰 Akira UTSUMI
キーワード

言語情報処理、言語認知科学、Web情報検索支援、情報組織化、認知科学、認知心理学、修辞表現、意味空間

かつて人工知能(AI)の領域では、人間を理解し、人間を模倣することを目指して研究が進められてきました。しかし、次第にAIはさまざまな分野に分かれ、現在ではコンピュータに言語を理解させる「自然言語処理」と、人間の振る舞いを観察してモデル化する「認知科学」の分野はかなり違った道を歩みつつあります。

こうした背景において、内海彰教授は、AI発展の観点から、自然言語処理と認知科学の二つの領域を行き来しながら研究に取り組んでいます。というのは、「今後は人間自身の研究をもっとAIに取り入れていく必要があり、将来は両分野は再び近づくのではないか」と考えているからです。内海教授はとりわけ「ことば」に注目し、工学的なアプローチによって自然言語処理の研究を、科学的なアプローチによって言語認知科学の研究を進めています。

ディープラーニング+自然言語処理

自然言語処理とは、AIがことばを操ることを可能にする技術であり、この「ことばを操る能力」は人間の知的な振る舞いの本質といえます。現在のAIブームは、音声認識や画像処理に深層学習(ディープラーニング)が適用されたことをきっかけに広がりましたが、次にディープラーニングの対象になるのが自然言語処理だといわれているのです。
一方で、音声認識や画像処理は信号とその意味との関係が「規則的」であるのに対して、自然言語処理では、記号と意味との関係が「恣意しい的」であり、そこに固有の難しさがあります。人間は母国語に翻訳すれば意味を理解できますが、コンピュータにはそもそも母国語がなく、言葉の意味を理解することができません。


多種多様な文章の分析や生成

内海教授は自然言語処理の分野では、文章を分類・クラスタリングしたり、生成・要約したりする研究をしています。分類では、例えば参加交流型サイト(SNS)上の発言において、その内容が肯定的か、あるいは否定的かといったように、ある観点から似たような文章を自動的にグループ化します。また、文章生成では、要約や見出しの作成を含む、記事の自動生成などが可能です。一例として、サッカーの試合の見どころを事前に配信するマッチプレビューを自動で生成しました。実際に人間が書いたものと遜色のない記事に仕上がっています。

ほかにもSNS上の発言から感情を分析したり、意見を発掘(マイニング)したりといった研究や、人間と雑談できる「会話エージェント」なども開発しています。また特徴的な研究として、小説や物語など創造的な文章の言語処理も手がけています。これは、文庫本の裏表紙にあるような小説のあらすじの自動生成を目指したもので、物語の全体を見てストーリーの展開に関係する重要な部分を抜き出してまとめます。現在はオンライン小説が数多く発表されており、こうした紹介文の自動生成システムは、今後活用されていくかもしれません。

比喩や皮肉の研究

一方、認知科学とは、人間が知的な処理(認知)を、どのようなメカニズムで行っているかを科学的に探求する学問です。言語を対象とする認知科学を特に言語認知科学と呼び、「自然言語処理の難しさを克服する上でも必要である」ことから、内海教授は言語認知科学の分野でも研究しています。

例えば、比喩や皮肉(アイロニー)といった特殊な言葉の使い方に着目し、心理実験や認知モデリングによって人間がそれをどのように生成したり、理解したりしているのかを解明する研究です。比喩の生成では、典型的な単語を選ぶことが多い"説明的な比喩"に対し、「"詩的な比喩"を作る際には、典型性の低い単語も併せて考える」という仮説を立て、実際に詩的な比喩の場合は、人間は幅広い単語を考慮していることを実験的に示しました。つまり、比喩の生成過程は目的に依存することが分かったのです。

言葉の意味を数値化する

また、人間は単語の意味をどのように獲得するのかを明らかにする研究にも着手しました。単語の意味の分散的な表現を学習したり、解析したりするための意味空間モデルやニューラルネットワークなどを用いて、人間の意味記憶や、語彙ごい・概念の獲得、記号接地を支える認知過程の解明を試みています。言葉の意味を「数値化」し、機械学習の手法などで扱えるようにするのです。
内海教授が目指す研究のゴールは、人間のような知的な振る舞いをする人工物の実現であり、それは現在のAIからは想像もつかない姿になるかもしれません。こうした未来のAIの実現に向けて、「認知科学の知見が、これからAIや自然言語処理の分野にどんどん生かされていく」ことを内海教授は期待しているのです。

【取材・文=藤木信穂】