東京科学大学 蔵前会館(東京都目黒区)で2025年11月10-11日に開催された対話システムシンポジウムに,銭本(D2),江(M1),村雲(B4),村瀬(B4)の4名が参加しました.

対話システムシンポジウム
対話システムシンポジウムは,人工知能学会 言語・音声理解と対話処理研究会 (SIG-SLUD)が年に1回開催しているシンポジウムです.国内の対話システム関係者が一堂に会し,様々な対話システムに関する研究発表が行われます.
今年は全部で48件の発表が行われました.
気になった発表
- 音声対話システムの理解状態を反映した相槌の韻律的変化がユーザーの振る舞いに与える影響
山田 真基、 森 大毅 (宇都宮大学 工学部)
この研究では,システムの相槌の仕方が,ユーザーの会話戦略にどのように影響するのかを検証しました.抽象画当てゲーム(ユーザーからのヒントを頼りに,9枚の抽象画からユーザーが選んだ特定の1枚をシステムに当てさせるゲーム)を対象として,相槌の覚醒度(相槌がどれだけ肯定的,否定的か)を変化させながら対話をするシステムと,全く変化させないシステムで比較しました.それぞれ3人のユーザーで実験をした結果,相槌変化のあるシステムの方が,よりユーザー自身の発言を理解していると思われる傾向があり,かつタスクの達成も早かったことが分かりました. - マルチリンガル相槌予測モデルによる言語間分析
井上 昂治、Mikey Elmers、Yahui Fu、Zi Haur Pang、森 大河、Divesh Lala、越智 景子、河原 達也 (京都大学)
本研究では,日本語,英語,中国語の3言語に対応したマルチリンガル相槌予測モデルを構築し,言語間における相槌タイミングの比較分析を実施しました.相槌区間の人手アノテーションを通じて,文化的背景の違いが各言語の相槌タイミングや頻度に影響を与えることが確認されました.分析の結果,相槌の頻度は日本語が最も高く,次いで英語,中国語の順となっています.タイミングについては,日本語では相手の発話中に相槌が出現することが多いのに対し,中国語では発話終了後にやや遅れて現れる特徴が見られました.モデル構築においては,1つのself-attentionと3つのcross-attentionで構成されるTransformerアーキテクチャを採用し,相槌タイミングの予測を行いました.評価実験の中で特に印象的だったのは,日本語モデルが最も高い性能を示したこと,そして中国語の相槌は文脈への依存性が高いことです.
招待講演
- 有機合成研究に言語モデルはどう使えるか
松原誠二郎(京都大学)
この講演では,有機合成研究に必須であった非常に労力のかかる人手作業を,言語モデルを使用して低コスト化,及び自動化する取り組みについて解説されました.まず,これまでの有機合成研究の歴史の説明から始まり,所望の化合物を生成する困難さや,人手の作業が必要な領域の変遷について詳しく説明されました.その後,「ムーンショット:人と融和して知の創造・越境をするAIロボット牛久プロジェクト」での取り組みについて紹介されました.具体的には,所望の化合物を生成するのに必要なプロセスを提案する対話システムや,自動で化合物を合成する装置に関する研究が紹介されました.
デモ発表
今回の対話システムシンポジウムでは全部で12件のデモセッションがあり,様々な対話システムや対話システムを利用したアプリケーションが展示されていました.興味を持ったものを2件紹介します.
- プロアクティブな声掛けと対話ジェスチャーを実現する自律応対アバター
小栗 賢章、 杉森 健 (AVITA R&D部)、 三上 崇志 (AVITA 開発局)
このデモでは,ユーザーと対話するAIアバターと実際に対話する体験ができました.音声だけでなく,ルールベースでのリアルタイムなジェスチャーが生成されていました.また,指先まで捉えるモーションキャプチャのデモも行われていました.
メタバースにおけるLLMエージェントの自律制御:空間アフォーダンスを活用したNPCインタラクション坂野 純、 吉岡 寛悟、 片岡 敬志郎、 山添 隆文、 德永 陽子、 住谷 哲夫 ((株)NTTドコモ)
このデモでは,メタバースにいるNPCがLLMを用いて行動を決定する様子を見ることができました.NPCから見える世界をテキスト化してLLMに入力することで,軽量かつ高速にキャラクターの振る舞いを決定するアプローチが採られていました.
国際会議報告
対話システムシンポジウムでは,その年の対話システムに関する主要な国際会議の参加報告が行われます.今回は以下の4つの国際会議の参加報告が行われました.
ACL:稲積 駿(NAIST/RIKEN GRP)- ACLは,自然言語処理に関する国際会議で,今年はオーストリアのウィーンで開催されました.論文の著者は約2万人にものぼり,中国からの著者が51.0%と最多だったそうです.発表者の稲積さん自身の研究である「Disambiguating Reference in Visually Grounded Dialogues through Joint Modeling of Textual and Multimodal Semantic Structures」という,テキスト上の言及箇所と画像上の物体の埋め込み情報を組み合わせて,曖昧な参照を解消する仕組みを提案する研究が非常に面白かったです.
SIGDIAL / YRRSDS:橋本 慧海(名古屋工業大学)- SIGDIALは,談話と対話に関する国際会議で,今年はフランスのアヴィニョンで開催されました.Best Paper Award Nomineeに郭さんと,サイバーエージェントの岩田さんの研究が選ばれたそうです.こちらの国際会議は,東中研究室の本ブログでも参加報告を行っていますのでぜひご覧ください.「SIGDIAL 2025・YRRSDS 2025 で 2 件の発表を行いました・Best Paper Nomineeに選ばれました – 名古屋大学情報学研究科 東中研究室」
EMNLP:田尻 愛斗(電気通信大学)- EMNLPは,自然言語処理に関する国際会議で,今年は中国の蘇州で開催されました.Best Paperの「Infini-gram mini: Exact n-gram Search at the Internet Scale with FM-Index」という,従来手法より非常に軽量で高速な検索を可能にするindex構築手法を提案する研究の紹介が非常に興味深かったです.発表者の田尻さんが所属する稲葉研究室に参加報告のブログが掲載されていますので,ぜひこちらもご覧ください.「Inaba Lab. EMNLP 2025 参加報告」
ICMI:長澤 史記(名古屋工業大学)- ICMIは,マルチモーダルインタラクションに関する国際会議で,今年はオーストラリアのキャンベラで開催されました.「SpikEy: Preventing Drink Spiking using Wearables」という,薬物が混入された飲み物を検知できる指輪型デバイスの研究の紹介があったのですが,そのUIの優秀さや,実際にクラブに行って検知できるか検証した点などに感銘を受けました.
終わりに
江です.私は対話システムシンポジウム初参加でした.今回,対話システム分野における様々な研究の方向性について深く理解する機会となりました.各企業による実際の応用事例を体験し,様々な研究成果を聴講することができました.その中で最も貴重だったのは,同世代の研究者たちと直接対面し,議論できたことです.多くの同世代の研究者がそれぞれの分野で成し遂げた進展を目の当たりにすることで,学術研究への理解がさらに深まりました.また,各自の研究が分野全体の中でどのような位置づけと方向性を持つのかがより明確になりました.特にポスターセッションでは,研究者たちと直接顔を合わせてお互いの考えを議論することができました.この方法はオンラインでの議論よりもはるかに直接的で,生き生きとして興味深いものでした.同時に,様々な研究成果とその応用を見学する中で,参加者の皆さんが対話システムという分野に深い理解を持ち,将来の発展に大きな期待を寄せていることが感じられました.今回の学会への参加を通じて,多くのことを学び,大いに励まされる経験となりました.今後は,この学会で学んだ貴重な内容と経験を研究活動に活かしていくとともに,対話システム分野の発展に少しでも貢献できればと考えています.

