IWSDS2024で発表を行いました

D1の山下が,2024年3月4日(月)~6日(水)に札幌で開催されたThe 14th International Workshop on Spoken Dialogue Systems Technology (IWSDS2024) で発表を行いました.IWSDSは,音声対話システムに関する国際ワークショップです.

発表について

発表件数は,口頭発表が22件,ポスター発表が17件でした.採択率は76.9%でした.参加者は58名で,多くが日本の方でしたが,バングラデシュ,中国,フィンランド,フランス,イタリア,マレーシア,スペイン,台湾,イギリス,アメリカなど様々な地域から研究者が集まりました.

今年は3件のKeynoteがありました.

  • Conversational AI to Benefit Individuals (Giuseppe Riccardi, University of Trento Italy)
    よりパーソナルな対話システムの構築を目指す試みとして,ヘルスケアのための対話システムが紹介されました.そのようなシステムとの対話は一般的にlong-termになるため,それに合わせた評価も行っていく必要があるとのことでした.
  • Semi-autonomous Dialogue for Cybernetic Avatars and Ainu Speech Processing (Tatsuya Kawahara, Kyoto University)
    サイバネティックアバターのための音声対話システムと,アイヌ語の資料をアノテーションするための自動音声認識と音声合成に関する話を聞くことができました.音声合成については,一文くらいの長さなら違和感なく合成できるが,アイヌ民謡のように長く続く文はまだ難しいとのことでした.
  • Modeling Multimodal Interactions to Enhance the User Understanding in Dialogue Systems (Yukiko Nakano, Seikei University)
    対話におけるマルチモーダル情報の検出と理解について紹介されました.研究にはマルチモーダル対話コーパスが必要ですが,コーパスの構築には大量のセンサが必要であり,特に3人以上からなるマルチパーティー対話の収集にはコスト面での課題があるようでした.

山下は,対話評価のセッションで口頭発表を行いました.内容は対話要約生成に関するもので,GPT-4で対話形式の要約を自動生成し,その品質を人手で多面的に評価しました.評価の結果,GPT-4による要約は,内容理解や流暢さの項目では人間による要約と同じレベルに達していましたが,文体の一貫性に課題があることが分かりました.質疑応答では,要約作成時のインストラクション,生成例などについて質問やコメントを受けました.

Sanae Yamashita, Ryuichiro Higashinaka

Multifaceted Evaluation of Automatically Generated Dialogue Format Summary Proceedings Article

In: The 14th International Workshop on Spoken Dialogue Systems Technology, 2024.

BibTeX

同セッションでは,教員の東中が,対話システムライブコンペティションについて口頭発表を行いました.

Ryuichiro Higashinaka, Michimasa Inaba, Zhiyang Qi, Yuta Sasaki, Kotrao Funakoshi, Shoji Moriya, Shiki Sato, Takashi Minato, Kurima Sakai, Tomo Funayama, Masato Komuro, Hiroyuki Nishikawa, Ryosaku Makino, Hirofumi Kikuchi, Mayumi Usami

Dialogue System Live Competition Goes Multimodal: Analyzing the Effects of Multimodal Information in Situated Dialogue Systems Proceedings Article

In: The 14th International Workshop on Spoken Dialogue Systems Technology, 2024.

BibTeX

参加してみて

東中研究室でも取り組んでいる内容に関連する発表が多くあり,研究のモチベーションが向上しました.特に,マルチモーダル対話の収集,ペルソナを反映した発話の生成,ユーザの性格に合わせた発話の生成といった発表には,今後の研究に活かせる部分がありました.また,テキスト対話の収集にLINEを使っている研究がいくつかあり,我々も試してみようと思いました.

会議の合間には,会議公式のExcursionとしてウポポイに行きました.ウポポイはアイヌをテーマとした展示・体験施設です.ここでは,文様が施された着物やマキリ(小刀),民俗学者がアイヌ語の収集に用いた単語カードなどの展示を見たほか,アイヌ古式舞踊やムックリ(口琴)の演奏を鑑賞しました.ゴールデンカムイでアイヌの文化や言葉を予習していたこともあり,非常に楽しめました.

また,会議の前にはノーザンホースパークへ足を伸ばしました.ここでは,引退競走馬の見学や乗馬体験,ポニーショーを楽しみ,北海道の自然を肌で感じることができました.

来年度のIWSDSは,3月下旬にスペインで開催されるそうです.