埼玉大学で2025年3月17~19日に開催された日本音響学会第153回(2024年春季)研究発表会に,佐藤(M2)が参加しました.
学会について
約300件の発表がありました.音声のみならず,音に関するさまざまな分野の研究発表が行われました.
自身の発表について
佐藤は,YouTube上に公開されている動画の中から,主に対話が行われている動画を選定し,そのうち対話が行われている区間を抽出することで,大規模な音声対話データセットを構築する方法を提案しました.質疑では,対話動画の定義や,合成音声は含まれていないのか,公開の予定はあるのかなど,多くの質問が挙がりました.
YouTube 上の対話動画に基づく音声対話データセットの構築 Proceedings Article
In: 日本音響学会第153回(2025年春季)研究発表会 講演論文集, 2025.
招待講演
多数の招待講演がありましたが,佐藤が聴講したものについて紹介します.
- 親子間における共感的コミュニケーションの脳内機構と言語獲得
皆川 泰代(慶應義塾大)
子供が音声言語を獲得するうえで重要な現象である親子愛着を中心に,子供が言語を獲得する際に起こっている脳の反応についての紹介がありました.定型発達児とASDリスク児の脳活動を比較すると,ASDリスク児は人の声や社会性といった刺激と脳内の報酬が結びつきづらく,このことがASDの言語社会性を弱めているという内容でした. - 会話のできるロボットと身体を持った会話システム
小林 哲則(早大・理工学術院)
会話の利点として,簡易な表現の交換で共同構築によって情報伝達が可能であり,情報を整理できていない場合にも有用であるという点があります.しかし,従来の対話システムは文を処理単位としており,対話の良さを発揮できていません.そこで,今後の対話システムには,文より短いフラグメントの交換を行い,会話のリズムを生むことが必要とのことでした.また,そのためには,投機実行と発話タイミングの制御機能を実装する必要があるとのことでした.
おわりに
音響学会は,言語処理や人工知能を中心とした学会ではないため,音声情報処理や対話システムに限らない,普段聞くことのできない幅広い分野の研究を聴講することができ,知見が広がりました.また,自身の研究に対しては多くの質問,活発な議論をいただき,有意義な参加となりました.

