このページの先頭です

メニューを飛ばして本文を読む

ここから本文です

サイト内の現在位置

研究者情報:研究・産学連携

研究室紹介OPAL-RING
保木 研究室

ゲーム情報学 ―― 将棋に勝つ人工知能を作る

所属 大学院情報理工学研究科
情報・通信工学専攻
メンバー 保木 邦仁 准教授
所属学会 情報処理学会、人工知能学会
印刷用PDF

掲載情報は2015年8月現在

保木 邦仁
Kunihito HOKI
キーワード

ヒューリスティック探索、機械学習、ゲーム

近年、日本ではプロ棋士とコンピュータ将棋ソフトによる棋戦が話題になって久しい。「電王戦」などは、将棋ファンでなくとも、一度は耳にしたことがあるのではないでしょうか。その昔、西洋ではチェスが人間の知性の象徴であると考えられていました。人間の存在意義を多少なりとも揺るがすであろう、人とコンピュータの「知恵比べ」の行方は、どの時代であっても人の心をとらえて放さないのでしょう。
保木邦仁准教授は、この世界で知らない人はいない有名な将棋ソフト「Bonanza(ボナンザ)」の開発者です。2005年に開発したBonanzaは、その網羅性、大規模性、自動学習性能の高さから、将棋ソフトの概念を塗り替えたと言われました。それは単なる将棋ソフトながら、一種の「人工知能の誕生」であると見られたのです。

リアルタイムストラテジーゲーム画面の解析の様子

衝撃的デビュー

研究室の一風景

Bonanzaは、06年にノートパソコンだけでコンピュータ将棋選手権に初出場し、いきなり優勝して業界に衝撃を与えました。07年にはプロ棋士の渡辺明竜王と公開対局し、惜しくも破れましたが、情報処理学会が主催した10年の「トッププロ棋士に勝つ将棋プロジェクト(あから)」では、清水市代女流王将(当時)に見事勝利しました。
また、保木准教授がソフトを公開したことで新規参入者が増え、ソフトの改良が一気に進みました。Bonanzaを参考にして作られた、クラスタ並列将棋ソフト「ボンクラーズ」は12年、第1回電王戦で故米長邦雄永世棋聖と対局し、勝利を収めました。今では、将棋の世界でコンピュータは人知を超える存在になりつつあります。
保木准教授は化学の出身ですが、計算機シミュレーションに関する研究に従事していて、何よりプログラミングが得意でした。カナダでの博士研究員(ポスドク)時代、コンピュータチェスに関する論文を偶然手にとってそのプログラムに感動し、今度は自分が将棋のプログラムを作ってみようと思い立ったのだといいます。保木准教授は当時、将棋にはそれほど詳しくなかったようです。

評価関数を自動化

Bonanzaの特徴は、将棋の局面の優劣を数値に変換する「評価関数」をコンピュータに自動で学習させたことです。チェスや将棋において評価関数の自動学習はこれまで研究レベルにとどまっており、実用化したのは保木准教授が初めてでした。保木准教授は、日本将棋連盟のプロ棋士に代表される熟達者の棋譜を使って、人間による将棋の「手」とコンピュータの「手」との誤差を表現する関数を設計し、コンピュータによる大規模自動学習によってそれを最小化できるようにしました。
その結果、約5000万通りもの「王将」を含む三つの駒の位置関係を数値化することに成功したのです。これが、将棋ソフトで“勝利の三角形”と呼ばれている方法です。評価関数はさらに精緻になりました。通常はパラメーターを増やすと計算量が増えて、勝率が落ちる傾向にあります。しかし、「Bonanzaはパラメーターを増やしてもどんどん強くなる」(保木准教授)のだそうです。単純に数値を足していくシンプルな評価関数ですが、それを大規模かつ最適化したことが最大の強みと言えるでしょう。計算機の能力の向上も手伝って、それ以降、この人工知能はどんどん賢くなっています。

知的な機械

「まだ人間には及ばないが、ある程度、知的な判断ができるようになった」と保木准教授はとらえています。すでに、プロ棋士でも対コンピュータ戦略を取らずに勝つことは難しくなっています。また、最近では、コンピュータ囲碁やビデオゲームの研究にも力を入れており、保木准教授は広く「ゲーム情報学」の研究に取り組んでいます。
コンピュータに知能を持たせることは、情報工学の大きな目標の一つです。しかし、知能にはさまざまな側面があるということを考えると、この目標はしばしば曖昧なものになるでしょう。だからこそ、ルールや勝敗が明確に定まっているゲームは、研究対象として都合が良いのだそうです。「ゲームは人工知能の重要な応用の場」だと保木准教授は考えています。

ゲームの可能性

ゲームは古くから、経済活動と関連づけて考えられてきました。ゲーム研究はまだ発展途上であり、経済活動の原理を解明するまでには至っていません。しかし、大規模に機械学習させられる人工知能を使えば、将来、経済競争に勝つ法則などを見つけられるかも知れません。日常生活の課題をゲームの手法で解決する「ゲーミフィケーション」という言葉も普及しつつあり、ゲーム、ひいてはエンターテインメント全体の可能性は大きいと保木准教授は強調します。
人間に勝つ将棋ソフトの開発も、それ以上の波及効果が見込まれると言います。「このような試みは、例えば、人類が初めて月に降り立った、チェスで初めてコンピュータが人間に勝利した――というような、科学技術の発展の指標であり、社会と文化に影響を与える『グランドチャレンジ』になるのではないか」と考えているのです。「これまでできなかったことができるようになる。そんな新しい手法を編み出したい」。ゲームで世界を変える未来に向けて、保木准教授は走り続けています。
【取材・文=藤木信穂】

研究・産学連携