2025.10.23
柳井啓司研究室、原田慧研究室の中溝雄斗さん、宮里龍平さん(情報学専攻博士前期2年)ら情報学専攻デザイン思考・データサイエンス(Dx2(デンツー))プログラムのメンバーを中心に構成されたチーム「y3h2」は、2025年3月から6月にかけて開催された KDD Cup 2025 Meta CRAG-MM Challenge に参加し、総合(全256チーム中)で世界第5位に入賞しました。
本大会は、100か国以上の会員からなるコンピューターサイエンス分野の学会ACMの分科会SIGKDDが主催するデータ分析の国際大会で、1997年から開催されている最も歴史のあるデータ分析競技会です。
Metaが主催した今年のKDD Cupでは、外部情報をうまく活用しながら、画像に関する質問に回答するマルチモーダルなQAシステム(Multi-Modal RAG)の性能が競われました。評価の鍵は、質問に対して有益で正確な情報を提供しつつ、幻覚(hallucination)を含まないことです。
本チームは、回答生成に使用する大規模視覚言語モデル(VLM)の内部表現からハルシネーションを検出する検出器を複数学習して組み合わせることで誤答を有意に減らし、上位のスコアを獲得しました。その結果、3つのタスクにおいてTask1で第4位、Task2で第9位、Task3で第5位を獲得し、総合第5位という成績を収めました。
本成果は、2025年8月4日(月)にカナダ・トロントで開催された KDD Cup 2025 Workshop on Comprehensive RAG for Multi-Modal, Multi-Turn Challenge(KDD 2025併催ワークショップ)にて報告されました。
【チーム名】y3h2
【受賞者】
中溝 雄斗(情報学専攻デザイン思考・データサイエンスプログラム博士前期2年/柳井啓司研究室所属)
宮里 龍平(情報学専攻デザイン思考・データサイエンスプログラム博士前期2年/原田慧研究室所属)
田邊 光(情報学専攻デザイン思考・データサイエンスプログラム博士前期2年/柳井啓司研究室所属)
山倉 隆太(情報学専攻デザイン思考・データサイエンスプログラム博士前期2年/柳井啓司研究室所属)
畑中 希栞(Ⅰ類(情報系)デザイン思考・データサイエンスプログラム4年/原田慧研究室所属)
【発表題目】Ensembling Multiple Hallucination Detectors Trained on VLLM Internal Representations
【発表論文】https://arxiv.org/abs/2510.14330
【著者】Yuto Nakamizo, Ryuhei Miyazato, Hikaru Tanabe, Ryuta Yamakura, Kiori Hatanaka
中溝雄斗さん
学部時代にVLMに関する研究を行っていたこともあり、本コンペティションに参加しましたが、初参加ながら入賞という評価をいただくことができ、大変うれしく思います。一方で、上位解法で用いられていた多くの取り組みはチーム内でも議論に挙がっており、有用性を十分に検証しきれなかった点には悔しさも残りました。KDD2025では、自身の研究分野だけではなかなか触れる機会のない概念にも多く触れることができ、VLMに関する知見を得られただけでなく、研究的にも非常に有意義な時間を過ごせたと感じています。今回得られた知見を糧に、今後も研究やさらなるコンペティションなどに取り組んでいきたいと思います。
宮里龍平さん
画像が得意な柳井研と言語やデータサイエンスの研究をしている原田研とでチームを組んで参加しました。土曜日にも夜遅くまで集まって課題に取り組んだりと、自分たちの持てる知識と資源を注ぎ込んで入賞するに至りました。他研究室と合同で取り組むことで色々と勉強になりましたし、世界的なコンペティションに学生だけのチームで入賞できたことも自信につながりました。現地では自分たちの解法がユニークで面白いというコメントをもらうことができたのも嬉しかったです。