このページの先頭です

メニューを飛ばして本文を読む

ここから本文です

研究者情報:研究・産学連携

研究室紹介OPAL-RING
南 泰浩 研究室

コンピュータと人間が自然に対話する未来へ

所属 大学院情報理工学研究科 情報・ネットワーク工学専攻
人工知能先端研究センター長
メンバー 南 泰浩 教授
所属学会 情報処理学会、電子情報通信学会、言語処理学会、米電気電子学会(IEEE)、音響学会
メールアドレス minami.yasuhiro@is.uec.ac.jp
印刷用PDF

掲載情報は2024年5月現在

南 泰浩
MINAMI_Yasuhiro
キーワード

言語発達、言語処理、音声認識、意味理解、対話処理、語彙発達、語彙獲得、認知心理、認知科学、音声生成、コミュニケーション科学

人間のように自然に言葉を操るコンピュータはいつ実現するのでしょうか。自ら言葉を覚え、人と柔軟に会話をするコンピュータには、どのような知能を持たせればよいのでしょうか。
南泰浩教授は、そんな未来の実現に向けた研究に取り組んでいます。「コンピュータが人と自然に対話するようになれば、高度なコンピュータを誰もが使いこなせるようになる」と考えているからです。

幼児は休みながら語彙を覚える

これまで複数のアプローチによってこの目標に取り組んできました。一つは、コンピュータに人と同じ機構で言葉を覚えさせるための研究です。その第一歩として、幼児が言葉を獲得する仕組みの解明を目指しています。
幼児はりんごという「言葉」とその「物体」を結びつけることで語彙を獲得します。例えば、1歳で10語程度身についた語彙は、2歳で約300語、3歳になると1,000語以上に増えます。
南教授は「語彙爆発」と呼ばれる、子どもの言語発達においてそれまで定説だった現象が、「一定の速度の語彙獲得と休みの期間からなる」ことを証明しました。子どもは通常、1歳くらいを境に急速に言葉を覚え始めますが、従来はある期間に突然、「言語を獲得する機構」が動き出し、そこから語彙が爆発的に増えると考えられていたのです。
十数人の幼児の言葉の獲得過程を約2年間にわたって継続的に追跡し、1,500人を超える母親らに子どもの語彙についてアンケートしました。こうした実際の言語活動データを統計解析した結果、まず、語彙の獲得の速度は一定であることが分かりました。
その上で、語彙が爆発的に増えるように見えるのは、その途中に語彙を全く覚えない“空白の期間”があるからだということを突き止めました。南教授は「子どもは言葉を休み休み、立ち止まりながら、ゆっくりと獲得しているのではないか」とみています。このほかにも、子どもによって言葉の獲得の時期が早かったり遅かったりするのは、「最初に覚えるほんの20語の言葉の種類に関係がある」という興味深い成果も出しています。

リアルタイム音声認識

これと並行し、新たに始めた音声認識の研究では、米ギットハブが運営するソフトウェア開発プラットフォーム上に公開されている音声認識のソースコード「icefall」を改良し、icefall上で日本語音声をリアルタイムに認識できる商業利用可能な研究用モデルの作成に世界で初めて成功しました。
現在、さまざまな音声認識の研究用プラットフォームが提供されていますが、多くのプラットフォームは「同時変換」ではなく、音声データを一定の長さのセグメントごとに切り取って順に変換しているため、わずかながら遅延が生じます。さらに、今回開発した日本語音声認識モデルは公開されていることから、「世界中の誰もが使え、手を加えるなどして多くのアプリケーションに展開できる」という大きな利点があると南教授は考えています。

提案する音声認識手法

「GPT-4」使い自然な対話が可能に

論文推薦システム

また、長年続けている対話の研究では、コンピュータに人と「雑談させる」際に、人が提示した固有名詞に着目しながら円滑に対話ができるモデルを構築したり、米オープンAI(人工知能)の大規模言語モデル(LLM)「GPT-4」を応用し、アバターを通じてジェスチャーや豊かな表情を交えながら自然な対話を行うシステムを開発したりしています。そのほか、自然言語処理によって研究者の論文執筆を支援する研究などにも取り組んでいます。

コンピュータはまだ、人間の知識レベルには及びません。だからこそ「人はどこまで人に近いコンピュータを作れるのか」という問いが、人類に向けられた“挑戦状”でもあるわけです。こうした研究によって「サイエンスとエンジニアリングをつなげ、知能を統合することで、自ら言葉を紡ぐ、愛着のあるコンピュータを作りたい」と南教授は考えています。

認知症の発作を事前に検知する

さらに最近は、東京都のプロジェクトとして、認知症の患者が発症する徘徊や妄想、大声、不安・不眠といった行動・心理症状(BPSD)をIoT(モノのインターネット)技術を使って各種センサーで測定し、発症の事前予測を目指す研究も進めています。介護施設や家庭において、認知症患者のBPSDは介護者にとってはもちろん、患者自身にも大きな負担になっています。
南教授らは、複数の介護施設に張りめぐらせた環境センサーや、患者に装着したバイタルセンサーが収集した約5カ月間にわたる大規模データを解析し、機械学習の手法であるブースティングや畳み込みニューラルネットワーク(CNN)などを使って、認知症患者のBPSD発症を推定できる可能性を初めて示しました。日本では高齢化によって認知症の患者は増え続けており、さらに昨今、介護人材の不足も叫ばれている中、介護者が患者のBPSDに早めに気づき、適切に対処することができれば、現場の負担軽減につながると期待されています。

認知症予測システム

【取材・文=藤木信穂】