IJCNLP-AACL 2025で発表を行いました

インドのムンバイで2025年12月20~24日に開催された International Joint Conference on Natural Language Processing & Asia-Pacific Chapter of the Association for Computational Linguistics, 2025 (IJCNLP-AACL 2025) に,郭(研究員),廣田(M1)と教員の東中の3名が参加しました.

基本情報

AACLは,計算言語学と自然言語処理に関する国際会議です.今回は,インドのムンバイにあるインド工科大学で開催されました.

会場の様子

今年の投稿数は1,251件で,このうちMain conferenceに232件(18.5%),Findingsに146件(11.7%)が採択されました.

自身の発表

郭は,2日目のオーラルセッションにて,移動型対話ロボットのTeleco を用いた実証実験に基づき,人間操作による案内と LLM による AI 操作案内を比較し,移動型対話ロボットの案内におけるホスピタリティの特徴と人間操作との差異について発表しました.

Ao Guo, Shota Mochizuki, Sanae Yamashita, Kenya Hoshimure, Jun Baba, Ryuichiro Higashinaka

A Comparative Study of Human-operated and AI-driven Guidance with a Teleoperated Mobile Robot Proceedings Article

In: International Joint Conference on Natural Language Processing & Asia-Pacific Chapter of the Association for Computational Linguistics, 2025, 2025.

Links | BibTeX

郭の発表の様子

廣田は,2日目のオーラルセッションにて,Minecraft におけるエージェントの共同作業の可能性について検討した研究について発表しました.シミュレーションおよび人間評価実験を通して,エージェントが一定の品質の成果物を作成可能である一方で,共通基盤の形成に課題があることを示しました.

Yuki Hirota, Ryuichiro Higashinaka

Investigating Feasibility of Large Language Model Agent Collaboration in Minecraft and Comparison with Human-Human Collaboration Proceedings Article

In: International Joint Conference on Natural Language Processing & Asia-Pacific Chapter of the Association for Computational Linguistics, 2025, 2025.

Links | BibTeX

廣田の発表の様子

基調講演

  • LLM-jp: Building a Sovereign LLM Ecosystem through Open and Team Science (Sadao Kurohashi, National Institute of Informatics)
    透明性が高くオープンなAIエコシステムを構築するための日本の取り組みである「LLM-jp」プロジェクトについての講演でした.特定の企業による閉鎖的な開発とは対照的に,データやモデルだけでなく,開発過程における議論や失敗までもすべて公開していることが紹介されました.
  • Human–AI Collaboration in the Age of Large Language Models (Diyi Yang, Stanford University)
    大規模言語モデル(LLM)の能力が飛躍的に向上している現代において,AIを単なるツールとしてではなく,人間と意味のある協力関係を築くパートナーとしてどのように捉えるべきかについての講演でした.単にタスクを自動化するのではなく,人間の能力を拡張することの重要性が説かれており,労働者は実際にはAIによる完全な代替ではなく,面倒な作業の自動化と自身のスキルを活かすことを望んでいるという調査結果が印象的でした.
  • Beyond Correctness: Evaluating the Social Intelligence of LLMs and Re-Evaluating their Role as Evaluators (Chenghua Lin, Manchester University)
    この講演は,LLMが数学やコーディングなどの形式的な知能テストで高い性能を示す一方で,社会的な知能テストにおいては限界があることを手がかりに,AIの評価のあり方を根本的に問い直す内容でした.実際の社会的なインタラクションはテキストだけでなく視覚や聴覚を含むマルチモーダルな情報を前提としているため,シミュレーションやマルチモーダルな情報を用いた新たな評価が必要であるという主張が展開されました.

Plenary Talk

  • Bridging the Digital Language Divide: Building NLP Solutions for the Four Billion Left Behind (Milena Haykowska, Clear Global / Translators without Borders)
    この講演では,世界人口の約半数が直面しているデジタル「デジタル言語格差(Digital Language Divide)」を解消し,低リソース言語の話者でも情報にアクセスできるようにするための NLP 技術について議論がされました.既存のLLMは,実験環境では高い性能を示しても,データ不足や文化的背景の違いにより,実際の現場では十分に機能しない場合が多いことが指摘され,また,バングラデシュやケニアでの事例を通して,ベンチマークなどの自動評価だけに頼るのではなく,開発の初期段階から現地コミュニティと協力することの重要性が紹介されました.技術の正確さだけでなく,実際にその言語を使う人々による評価を通して信頼を築くことが,本当の意味での支援やエンパワーメントにつながるという考え方が示されました.
  • Capturing the spoken language landscape of India for an inclusive digital India (Prasanta Kumar Ghosh, Indian Institute of Science)
    本講演では,インドにおける言語の壁(デジタル・ディバイド)を解消し,すべての人が AI 技術を利用できる社会を目指す大規模なデータ収集プロジェクトが紹介されました.インドでは地域ごとに言語やアクセントが少しずつ変化するため,「言語」単位だけでなく,「地区(District)」単位でデータを集めることの重要性が強調されました.また,音声認識や音声合成のためのプロジェクト「Syspin」「Respin」に加え,画像を見ながら自由に話してもらうことで自然な発話を収集する「Project Vani」の取り組みも紹介されました.地域ごとのデータでモデルを調整することで,従来は認識が難しかった方言も正確に理解できるようになり,地域の言語や文化を守るうえでも重要であることが示されました.

Special Session on Diversity & Inclusivity + Panel Discussion

  • Keynote Talk: Diversity and Inclusivity of Language Models (Sunayana Sitaram, Microsoft Research)
    本講演では,現在のLLMはベンチマークでは高い性能を示していますが,パンジャブ語のような言語では基本的な翻訳が十分に機能しないなど,実際の利用環境との間に大きな差があることが紹介されました.また,「データの多様性(Diversity)」と,当事者が開発や評価に参加する「インクルージョン(Inclusivity)」の重要性が説明されました.現在のモデルは地域の文化や生活習慣を十分に理解できず,宗教やカーストに関して誤った出力が生じる例も紹介されました.こうした課題への取り組みとして,農村部のデータワーカーや市民団体が評価基準の作成段階から参加する「Pariksha」や「Samiksha」といったコミュニティ主導の評価プロジェクトが紹介され,現地の人々と協力しながらモデルを改善していくことの重要性が示されました.
  • Panel Discussion: Inclusive NLP in the Generative AI Era: Language, Culture, and Fairness
    教員の東中がパネルディスカッションに参加し,生成AI時代におけるインクルーシブなNLPのあり方について議論しました.東中は,インクルージョンを「システムの中に多様な価値観を取り入れること」と説明し,日本語の会話データ不足といった課題を指摘しました.また,現在のAI開発が西洋中心の価値観を強めてしまう可能性への懸念や,文化の多様性を理解し適応できるAIの必要性についても議論されました.さらに,ユーザ参加型の評価やHCIなど他分野との連携の重要性についても活発な意見交換が行われました.
パネルディスカッションの様子

Workshop & Tutorial

4日目と5日目はワークショップ・チュートリアルデーでした.郭,廣田は以下のワークショップに参加しました.

  • The 12th Workshop on Asian Translation (WAT2025)
    アジア言語に焦点を当てた機械翻訳のタスクと研究に関するワークショップです.このワークショップでは,特許の翻訳タスク,文書レベルのニュース翻訳,画像を用いたマルチモーダル翻訳,ヒンディー語の方言に対する音声翻訳といった幅広い発表がありました.画像とテキストを組み合わせた翻訳タスクでは,視覚情報の有効性について議論があり,強力なテキストのみのベースラインと比較して,視覚情報の追加が必ずしも性能向上につながらないケースが報告されました.ただし,視覚的に曖昧な用語の解消には有効である可能性が示唆されました.
  • NLP for Affective Science: Exploring Fundamental Questions on Emotions through Language and Computation (Krishnapriya Vishnubhotla and Saif M. Mohammad, National Research Council Canada)
    このチュートリアルでは,言語と計算技術を用いて感情や情動の仕組みを理解する学問分野「計算情動科学(CAS)」が解説され,単なる感情分類にとどまらず,言語を通して「心・身体・社会」の関係を理解するという視点が紹介されました.内容は,情動理論や VAD(Valence・Arousal・Dominance)といった基礎から,単語や文レベルの感情データの構築方法,さらに物語における感情の流れや個人ごとの感情表現の違いを分析する手法にまで及びました.また,LLMが抱える文化的バイアスや,AIを対話エージェントとして利用する際の倫理的課題についても議論されました.

気になった発表

  • What Are They Talking About? A Benchmark of Knowledge-Grounded Discussion Summarization (Weixiao Zhou, Junnan Zhu, Gengyao Li, Xianfu Cheng, Xinnian Liang, Feifei Zhai, Zhoujun Li)
    暗黙的な背景知識に基づくニュース議論を外部読者にも分かる形で要約するため,背景要約で文脈を補い,意見要約で指示語等の暗黙参照を解消する新タスクKnowledge-Grounded Discussion Summarization(KGDS)を提案した研究です.12種類のLLMを評価した結果,背景要約で重要事実の欠落や無関係な情報の混入が発生し,意見要約でも暗黙参照の解決に失敗しやすいことが示されました.
  • Uncovering Cultural Representation Disparities in Vision-Language Models (Ram Mohan Rao Kadiyala, Siddhant Gupta, Jebish Purbey, Srishti Yadav, Suman Debnath, Alejandro Salamanca, Desmond Elliott)
    画像と言語情報を処理するVLM(Vision-Language Model)がどの国・地域の文化をどれだけ公平に表現できているかを,画像からどの国を表す画像なのか当てるタスクで検証した研究です.211か国のデータセットを用いて評価した結果,国・地域ごとに精度差が大きく,特定の国への過剰な予測など学習データ分布由来の偏りが示されました.
  • Observing Micromotives and Macrobehavior
    of Large Language Models
    (Yuyang Cheng, Xingwei Qu, Tomas Goldsack, Chenghua Lin, Chung-Chi Chen)
    本発表では,LLMの個々の判断傾向が社会全体の行動にどのような影響を与えるかが紹介されました.シミュレーションの結果,人々がLLMの助言に従う割合が増えると,わずかな偏りでも社会全体の分断が進む可能性があることが示され,LLMは個々の性能だけでなく社会的影響の観点から評価する必要性が指摘されました.

ソーシャルイベント

イベントとして,インドの古典舞踊であるオディッシー(Odissi)の公演がありました.公演では,華やかな衣装や表情の豊かな所作が印象的で,普段あまり触れる機会のないインドの伝統文化を間近で体験できました.会場全体が盛り上がり,学会の合間の良いリフレッシュにもなりました.また,公演の後にはディナーが用意されており,同じテーブルになった参加者の方々と研究の話や滞在中の話題で交流することができました.

おわりに

今回の会議への参加を通じて,LLM の社会的影響や言語的包摂性,低リソース言語支援など,自然言語処理研究が社会や文化との関係をより重視する方向へ広がっていることを実感しました.特に,単なる性能向上にとどまらず,多様な言語・文化背景を持つユーザにどのように技術を届けるかという視点が,今後の研究においてますます重要になると感じました.さらに,オディッシー舞踊の公演や現地のカレー料理などを通してインド文化にも触れることができ,研究面のみならず文化的な理解も深めることができ,非常に実りの多い出張となりました.

投稿日:
カテゴリー: 発表