NLP2023で3件の発表を行いました・若手奨励賞を受賞しました

沖縄コンベンションセンターで2023年3月13~17日に開催された言語処理学会第29回年次大会(NLP2023)にて,大橋(M2),山下(M2),市川(M1),平井(M1)の4名が参加し,発表を行いました.

学会について

発表件数は579件で,これは昨年比1.5倍でした.口頭発表のほとんどは現地から,ポスター発表のうち1割程度はオンラインからでした.口頭発表の場合,質疑やコメントは主にSlack上で行われました.

自身の発表について

大橋と平井は,日本語におけるタスク指向型対話データセットJMultiWOZ構築の取り組みについてポスター発表を行いました.また,筆頭著者である大橋は若手奨励賞を受賞しました.

大橋厚元, 平井龍, 飯塚慎也, 東中竜一郎

JMultiWOZ: 日本語タスク指向型対話データセットの構築 Proceedings Article

In: 言語処理学会 第29回年次大会 発表論文集, pp. 3093-3098, 2023, (若手奨励賞).

Links | BibTeX

大橋が発表する様子
平井が発表する様子

山下は,3月14日(火)の「H5:要約」のセッションで,「対話形式の対話要約の提案とその特徴の明確化」という題目で口頭発表を行いました.この研究では,コールセンタなどで行われる対話の引継ぎの場面で有用だと思われる対話要約の形式を提案し,その要約形式の有用性を明らかにしました.

山下紗苗, 東中竜一郎

対話形式の対話要約の提案とその特徴の明確化 Proceedings Article

In: 言語処理学会 第29回年次大会 発表論文集, pp. 1250-1255, 2023.

Links | BibTeX

山下が発表する様子

市川は,3月15日(水)の「H6:対話(3)」のセッションで,「マルチエージェント強化学習に基づく共同作業を自律的に行う対話システムの最適化」という題目で口頭発表を行いました.この研究では,相手の反応が得られないような状況でも共通の目的を達成するために最適な発話を行う対話エージェントの獲得を目指して,マルチエージェント強化学習を用いた学習手法を提案しました.

市川拓茉, 東中竜一郎

マルチエージェント強化学習に基づく共同作業を自律的に行う対話システムの最適化 Proceedings Article

In: 言語処理学会 第29回年次大会 発表論文集, pp. 1383-1387, 2023.

Links | BibTeX

市川が発表する様子

また,指導教員の東中先生は大会のプログラム委員長を担当されていました.

オープニングで東中先生が登壇している様子
クロージングで東中先生が登壇している様子

チュートリアル

高道先生のチュートリアル「音声合成は次にどこに向かうのか」では,これまでの音声合成の研究の歴史を踏まえて,長文の Text to Speech や非言語音声の表現など,近年新たに解かれはじめている問題の紹介がありました.特に,笑い声などの非言語音声は対話中に多く出現するので,その表現方法や音声合成方法に関する研究には今後注目すべきだと思いました.

近藤先生のチュートリアル「自然言語処理から見た古典語と現代語」では,古文がN-gramや有限オートマトンの観点から説明されました.古文を大規模言語モデルで翻訳する試みなど,面白いタスクがある一方で,コーパスの作成に手間がかかることが大きな課題であると感じました.

荒牧先生,中村先生のチュートリアル「医療言語処理ことはじめ」では,医療分野におけるNLPの活用について紹介がありました.医療分野においてエビデンスのあるNLPの論文を出すことの重要性や,医療関係のデータを公開することの難しさを認識しました.

大谷先生の「構文文法の基本的な考え方:言語使用から創発する言語知識のありようを探る」では,構文文法の基本的な考え方や構文文法への自然言語処理の応用可能性についての紹介がありました.普段あまり考えることのない,認知言語学の視点から見た言語処理についてを学ぶことができました.

招待講演

谷口先生の「社会における分散的ベイズ推論としての記号創発 ~集合的予測符号化としての言語観~」では,記号創発ロボティクスにおけるこれまでの研究や,大規模言語モデルを用いたこれからの取り組みについての紹介がありました.命名ゲームなど記号創発という分野に関する基礎的な知識が得られたほか,ロボティクスにおける言語処理といったより実践的なお話を聞くことができました.

田窪先生の「危機言語の記録・維持・再生の諸問題:琉球諸語を中心に」では,琉球諸語にまつわるこれまでの研究や,琉球諸語が含まれる映像や音声を記録する取り組みが紹介されました.また,危機言語の危機度の算定に用いることができる相互理解性テストの紹介もありました.危機言語の記録・維持・再活性化のアプローチについて知ることができ大変勉強になりました.

気になった発表

以下は参加した我々が気になった発表です.

  • 稲葉 達郎, 清丸 寛一, Fei Cheng, 黒橋 禎夫 (京大)
    大規模言語モデルに基づく複数の外部ツールを利用した推論フレームワーク
    Chain of Thought Promptingにおいて複数の外部ツールを扱うための機構を導入することで,GPT-3の数値推論能力を向上させる研究です.個人的にも,今後巨大言語モデルが外部ツールを活用することは重要だと思っているので,非常に勉強になりました.
  • 渡邉研斗, 後藤真孝 (産総研)
    入力文章の内容に沿った新たな歌詞を生成する作詞支援システムと剽窃リスクを下げる歌詞生成手法
    短い要素を入力することで,それらを考慮して歌詞を生成してくれる支援システムの構築及び剽窃リスクの少ない生成手法の提案を行った研究です.歌詞生成時に入力文と出力文が異なる表層表現となるように中間表現として画像を用いている点はとても興味深かったです.我々が取り組んでいる共同作業型対話システムにおいて,システムの提案する作品(キャッチコピー等)を得る手段として活用できればと思いました.
  • 吉原大智 (理研/筑波大), 湯口彰重 (理研/NAIST), 河野誠也 (理研), 飯尾尊優 (理研/同志社大), 吉野幸一郎 (理研/NAIST)
    自律移動型ロボットにおける経験由来の情報量からの発話内容選択
    自律移動ロボットにおいてシステムの内部状態をユーザに提示する際,提示する文の選択に言語モデルを使用した研究です.言語モデルにおける尤度が閾値以下の文をユーザに提示することで,システム発話の必要十分性が向上することが分かったそうです.
  • 西田光甫, 西田京介, 斉藤いつみ, 齋藤邦子 (NTT)
    InstructSum: 自然言語の指示による要約の生成制御
    ChatGPTなどで用いられているInstruction Tuningを要約生成に適用した研究です.著者らは,指示文・原文・要約文からなるデータセットを構築していて今後の進展が楽しみに感じました.

NL・NLC 合同研究会

NLP2023の翌日 3月18日に,沖縄科学技術大学院大学(OIST)で開催された,NLC・NL 合同研究会にも参加しました.

本研究会でも招待講演があり,各先生方の経験や考え方を知ることができました.

  • 颯々野先生(ヤフー株式会社)の講演では,企業ならではの言語処理技術の面白さ(データの豊富さ等)や難しさ(処理速度等),ノウハウ(サービス開発のための良い循環を作りましょう等)を知ることができました.
  • 山田先生(Studio Ousia)の講演では,質問応答技術の開発事例から,スタートアップ企業における論文化と実用化の両立に関する取り組みを学ぶことができました.
  • 金山先生(日本IBM 東京基礎研究所)の講演では,「最近の巨大言語モデルは本当の言語処理をしているのか」という刺激的な内容でした.

フライト時間の関係から全てのセッションを聴講することはできませんでしたが,OISTのキャンパスを見学するなど,貴重な経験ができました.

おわりに

今年のNLPは沖縄でのハイブリッド開催ということもあり,例年を大きく上回る参加者数で,現地会場も大変賑わっていました.また,緊急パネル:ChatGPTで自然言語処理は終わるのか?をはじめとした,巨大言語モデルに関する議論も活発になされていました.特に「ChatGPTなどのサービスを自身の研究に積極的に取り入れていけば良い」という意見は印象的で,今後の自身の研究の進め方を考える上で参考になりました.

NLPの現地参加は初めてで緊張もありましたが,発表や懇親会などをきっかけに同世代の知り合いもたくさんできて,非常に充実した参加となりました.神戸で開催されている来年の年次大会にもぜひ参加したいと思います.

投稿日:
カテゴリー: 発表