早稲田大学で2025年3月20-22日に開催された第103回人工知能学会 言語・音声理解と対話処理研究会 (SIG-SLUD)に,銭本(D1),津田(B4)の2名が参加しました.今回のSLUDでは,第7回対話システムライブコンペティションの本戦も開催されました.

対話システムライブコンペティション
対話システムライブコンペティションは,大勢の観客の前でライブで対話システムを動作させるイベントです.2018年から毎年開催されており,今年は7回目になります.
今年は,「愚痴を聞きながら決断を後押しする」という設定での対話であるシチュエーショントラックと,「旅行代理店における観光地決定を行う」という対話であるタスクトラックの2種類のトラックが開催されました.
各対話システムはRemdisというマルチモーダル対話システムプラットフォームを用いて開発されました.参加チームはRemdis上で様々な工夫を施した対話システムを開発し,タスク達成能力や対話における自然性を競いました.


シチュエーショントラックで最優秀賞を獲得したチームTabiTocは,システムとユーザが幼馴染であるという設定を活かし,2者間の共有経験に基づく共有信念をプロンプト内に記述したシステムを開発していました.シチュエーショントラックでは,ユーザの発話中にシステムが話し始めてしまうケースが多く見られ,友人同士の雑談のような,頻繁にターンテイキングが起きるような状況への対応の難しさを実感しました.
タスクトラックでもチームTabiTocが最優秀賞を獲得しました.LLMエージェントが状況に応じて自律的にユーザ,他のエージェント,およびツールと連携しながら対話タスクを遂行するLLM設計フレームワークに基づくシステムを開発していました.タスクトラックの各チームのシステムは,提案する旅行先の画像を画面に表示したり,ユーザの発話に応じて画面の画像を動的に変更するなど,視覚情報を効果的に活用する工夫が見られました.
学生・教員の発表について
教員の東中が運営に関わる対話システムライブコンペティションの仕様や予選結果に関する共著の発表がありました.また,東中とD2の山下が取り組んだ共同研究の発表がありました.
佐藤 志貴,佐々木 裕多,岩田 伸治,山崎 天,小室 允人,守屋 彰二,大萩 雅也,菊池 浩史,楊 潔,邊土名 朝飛,斉 志揚,児玉 貴志,李 晃伸,西川 寛之,牧野 遼作,港 隆史,境 くりま,船山 智,船越 孝太郎,宇佐美 まゆみ,稲葉 通将,高橋 哲朗,東中 竜一郎
対話システムライブコンペティション7
第7回目となる対話システムライブコンペティション7について,その仕様や予選結果を報告しました.シチュエーショントラックには14チーム,タスクトラックには8チームが予選に参加し,フェーズ構造を用いた対話管理,実際の対話例に基づくプロンプト制御,逐次応答生成速度を向上させる並列処理など,エントリーチームによる様々な工夫が紹介されました.
福重 茜,井上 昂治,河原 達也(京都大学),山下 紗苗,東中 竜一郎(名古屋大学)
多人数チャットコーパスにおける参加者間の関係性の推定
この研究では,多人数対話コーパスにおいて,対話の特徴量を用いて話者間の関係性を推測する手法を提案しています.提案手法の有効性を検証するためにGPT-4oとの比較を行い,高い精度で関係性を推定できることを示しました.また,GPT-4oの関係性理解における限界を指摘しました.
招待講演
大森幹真先生 (早稲田大学)
発達障害とコミュニケーション
応用行動分析学や発達臨床心理学の知見から,ASD(自閉スペクトラム症)をはじめとする発達障害児のコミュニケーション支援について,多岐にわたる研究・実践事例が紹介されました.また,ASD児と大規模言語モデルは同じような存在である,という仮説が面白く,実際にそれぞれの学習環境や出力される言葉の仕組みの類似性が解説されました.
気になった発表
小野 仁士,倉本 到(福知山公立大学)
発話文の末尾欠損率とLLMによる応答文の適切性との関係
この研究では,大規模言語モデルを利用した音声対話システムの応答速度向上を目的として,ユーザの発話が途中であっても先行して応答を生成する手法を提案・検証しています.具体的には,まだ認識しきれていない文末部分(末尾欠損)のある発話文をLLMに入力し,その応答がどの程度「元の発話の意図」を反映したものになるかを分析しています.井上 昂治,Divesh Lala,Mikey Elmers,越智 景子,
河原 達也
(京都大学)多人数対話における受話者推定のLLMによる試み
この研究では,3人による対面対話・議論を対象とした「鼎談コーパス」を用いて,GPT-4oによる受話者推定の精度を検証しました.その結果,精度はチャンスレベルを僅かに上回る程度にとどまり,現状のLLMが自然な多人数対話に十分対応できていないことを示しました.
おわりに
対話システムライブコンペティションで開発された対話システムは,どのチームのものも着眼点が非常に面白く,様々なアプローチが試みられていました.また以下のポストで書かれているように,ターンテイキングやリアルタイム性など,現状の対話システムが持つ課題も多く見つかり,非常に有意義なイベントでした.
また,今回発表された研究は,対話時における頷きや笑い,特定の発話の意味に関する分析などに取り組んだ研究が多い印象がありました.これらの要素は,現状実装されている対話システムの多くではあまり考慮できていない要素であり,今後より注目していく必要があると思います.SLUDは今後の対話システム研究の動向の把握や,課題の議論ができる貴重な場ですので,今後も参加していきたいと思います.