SIGDIAL 2025・YRRSDS 2025 で 2 件の発表を行いました・Best Paper Nomineeに選ばれました

🇫🇷フランスのアヴィニョン大学で 2025年8月25〜29日に開催された SIGDIAL2025・YRRSDS2025 にて，郭（研究員），姜（D1）の 2 名が参加しました．

SIGDIAL2025

The Annual Meeting of the Special Interest Group on Discourse and Dialogue (SIGDIAL) は談話と対話に関する国際会議です．

今年は 116 件の投稿に対し，ロング/ショート/デモ論文併せて 58 件が採択されました．全体の採択率は 50.8％です．

自身の発表

郭は，2日目のオーラルセッションにて，Teleco ロボットを用いた実験を通じて，モバイルロボット案内におけるホスピタリティを高める要因を，マルチモーダルおよび時系列的特徴の観点から分析した研究について発表しました．本研究は，Best Paper Nomineeにも選ばれました（全投稿の中から5件）．

Ao Guo, Shota Mochizuki, Sanae Yamashita, Saya Nikaido, Tomoko Isomura, Ryuichiro Higashinaka

Exploring Factors Influencing Hospitality in Mobile Robot Guidance: A Wizard-of-Oz Study with a Teleoperated Humanoid Robot Proceedings Article

In: Proceedings of the 26th Annual Meeting of the Special Interest Group on Discourse and Dialogue (SIGDIAL) , 2025, (Best Paper Award Nominee).

BibTeX

姜は，2日目のポスターセッションにて，マルチモーダル対話データを用いたテキスト，音声，生体信号による感情分類モデルの構築と単一入力との比較・分析について発表しました．

Jingjing Jiang, Ao Guo, Ryuichiro Higashinaka

Integrating Physiological, Speech, and Textual Information Toward Real-Time Recognition of Emotional Valence in Dialogue Proceedings Article

In: Proceedings of the 26th Annual Meeting of the Special Interest Group on Discourse and Dialogue (SIGDIAL) , 2025.

BibTeX

基調講演

Are There Purely Multi-Turn ‘Dialog Failures’?
by Dr. Chris Welty, Research Scientist at Google (New York)
従来の AI の対話研究は，個別のターンの分析に重点を置いてきましたが，適切な対話評価には，単一のターンではなく全体的な「会話性」の視点が必要である．しかし，複数ターンを含む対話の評価は極めて複雑で，良い対話とは単に間違いを犯さないことではなく，全体として意味のある会話を築くことが重要であるとの主張がなされました．本講演では，個々のターンに対する細やかな分析と，全ターンに対する統合的な分析を組み合わせる必要性が説明されました．
Interactive Task Learning
by Prof. Alex Lascarides, University of Edinburgh
ロボットやエージェントが，あらかじめ知らない概念やラベルをユーザとのやりとりを通じて学習する仕組みが紹介されました．従来の学習ではアノテータがすべてのラベルを付与するのは困難ですが，対話を通じてユーザが誤りを指摘したり質問に答えたりすることで，エージェントは新しい概念を理解し，ラベルを自動的に獲得していきます．具体的な方法としては，観察から得られる少数ショットの分類（positive/negative例）とシンボリックなルール推論を組み合わせ，さらに「これはXですか？」「Xを見せてください」といった質問戦略を用いることで，知識状態を逐次的に更新していくアプローチが示されました．
Ecological Study Language Acquisition: The Role of Natural Conversation
by Dr. Abdellah Fourtassi, Aix-Msrseille University
子どもは言葉を完全に話せるようになる前から，親や養育者とのやりとりを通じて「順番を守る」「相手に応じる」といった対話の基本的な仕組みを身につけています．この講演では，こうした対話の仕組みが単なる会話の補助ではなく，言語を学ぶための重要な力であることが紹介されました．また，小規模なデータしか持たない言語モデルでも，人間からのフィードバックによって上達する事例が示され，人間と同じように「対話を通じて学ぶ」AI の可能性が語られました．

気になった発表

Multi-Lingual Implicit Discourse Relation Recognition with Multi-Label Hierarchical Learning (Best Paper)
Nelson Filipe Costa and Leila Kosseim
暗黙的談話関係（implicit discourse relation）の認識を対象に，多言語・多ラベルに対応した階層型学習モデル HArch を提案した研究です．HArch は，談話関係を階層的に学習できる多言語対応のマルチラベル分類モデルであり，新しく公開された DiscoGeM 2.0 コーパスを用いた評価で高い性能を示しました．談話関係の階層的な依存関係を活用することで精度を向上させ，さらに RoBERTa や XLM-RoBERTa をベースとした HArch は，GPT-4o や Llama 系 LLM の few-shot 利用を上回る一貫した性能を達成し，特定タスクにおけるファインチューニングの有効性を示しています．

Panel Discussion

Dialogue in the Age of LLMs: A Paradigm Shift?
教員の東中がパネルディスカッションに参加し，LLM の登場が対話研究にもたらす影響について議論しました．東中は，対話の重要な分かり合うプロセスにもっと着目すべきであると主張し，氷山を例に，誰かが行った対話のみから学ぶのではなく，その背後にあるやり取りの過程からも学ぶべきであると述べました．その他，パネルではブラックボックスとしてLLMを扱うのではなく，対話理解をどう深めるかについて活発な討論が行われました．

ソーシャルイベント

イベントとして Palace of the Popes のガイド付き見学と Avignon’s Bridge でのバンケットが開催されました．

YRRSDS2025

Young Researchers’ Roundtable on Spoken Dialogue Systems (YRRSDS) は，若手の対話システム研究者が自身の研究成果や研究関心を共有し，議論するためのオープンフォーラムです．

基調講演

Making Your Way as a Researcher in Spoken Dialogue Systems
(Prof. Casey Kennington)
ChatGPTの登場以降，音声対話システムの将来性のある研究領域と研究者としての貴重なキャリアアドバイスをいただきました．
Shared Understanding, Shared Responsibility: Towards Grounded GenAI Models for More Reliable Human-Robot Interactions
(Prof. Kristiina Jokinen)
生成 AI 時代の HRI (Human-Robot Interaction) における課題に焦点を当て，知識グラフと基盤化，共有コンテキストの構築などの技術的な側面から，安全かつ信頼性の高い HRI システムの実現に向けた AI 開発について議論されました．
Keeping it Real: The Role of Humans in Spoken Dialogue System Research
(Prof. David Traum)
LLM のハルシネーションやバイアスといった問題を踏まえ，人間を研究開発プロセスに適切に組み込むことで，より良いシステムと科学の実現が可能であることが示されました．

Round Table

“Social Intelligent and Affective Spoken Dialogue System”, “Multimodality and Environment Integration”, “Evaluation, Ethics, and Transparency” の 3 つの話題について議論を行いました．

イベント

ローヌ川辺のレストランでのディナーやアヴィニョンの観光を楽しみました．

DSTC12

DSTC12 Workshop では，対話システムの評価や制御可能なテーマ検出などに関する発表が行われ，Milica Gašić 氏や Verena Rieser 氏による招待講演がありました．基調講演では，対話評価の多次元性や文化的要因の重要性が取り上げられました．教員の東中もパネルディスカッションに参加し，今後の対話研究の方向性について議論しました．東中は，LLMを用いた対話システムの評価が難しくなってきていることを念頭に，アプリケーションレベルでの評価を行ってはどうかと提案しました．

終わりに

今回の会議への参加を通じて，音声対話システム分野の最新動向を把握し，多くの研究者との有意義な交流を深めることができました．研究発表や議論だけでなく，アヴィニョンの歴史ある街並みや法王庁宮殿での特別な体験も含め，非常に充実した出張となりました！