JSAI 2024で発表を行いました

アクトシティ浜松(静岡県浜松市)で2024年5月28~31日に開催された第38回人工知能学会全国大会(JSAI2024)にて,郭(研究員),銭本(D1),姜(M2)の3名が参加しました.

学会について

約3,790名(内現地参加約2,900名,社会人約3,010名,学生約780名)が参加し,国際/一般/ポスター/OSでの発表件数は合計946件でした.

自身の発表について

姜は,異種センサを用いたマルチモーダル対話データについて発表しました.この対話データには,話者の対話中の映像,音声,ジェスチャ,視線,生体信号などのマルチモーダルデータが網羅的に含まれています.また,話者本人によるアンケートや心的状態に関する主観評価も含まれています.発表では,対話データの収集方法や,対話中の生体信号と主観評価の関係分析の結果について報告しました.

姜菁菁,郭傲,東中竜一郎

異種センサを用いたマルチモーダル対話データの収集とセンサ情報 と主観評価の関係分析 Proceedings Article

In: 2024年度人工知能学会全国大会(第38回), pp. 4Xin278-4Xin278, 2024.

Links | BibTeX

発表する様子

チュートリアル

合計で4件のチュートリアルがありました:

  • 大規模言語モデルの開発
    岡崎 直観 (東京工業大学)
    大規模言語モデルの開発プロセスと応用について詳しく解説されました.事前学習や継続事前学習,指示チューニング,アライメント,評価といった各ステップを通じて,モデルの基礎から高度な応用までの方法論が詳細に説明され,具体的な実装例や注意点も示されました.また,日本国内外での大規模言語モデルの事例紹介や,最新の技術動向に関する情報も提供されました.これにより,参加者は大規模言語モデルの開発における実践的な知識を深め,現場での課題解決に役立つスキルを習得することができます.
  • 機械学習と科学モデル
    武石 直也 (東京大学)
    機械学習と科学研究で使用されるモデルについて,手法の観点から最近の話題を紹介するチュートリアルでした.具体的には,機械学習が科学モデルの順問題と逆問題の解決にどのように利用されているかが説明されました.順問題では,Physics-informed Neural NetworksやDeep Galerkin Method を用いた微分方程式の解法が取り上げられ,その高速性などの利点が強調されました.逆問題では,Simulation Based Inferenceを使用してモデルパラメータを推定する方法が議論され,深層学習生成モデルを用いた近似ベイズ推論が紹介されました.
  • 医療情報と人工知能
    香川璃奈 先生 (産業技術総合研究所),小林和馬 先生 (国立がん研究センター研究所),鈴木晋 先生 (株式会社CureAppp)
    医療情報を用いた人工知能学分野の研究開発を始めたい人を主な対象として,研究リソースの紹介,技術動向と研究課題の整理,研究倫理審査に対する疑問との向き合い方などを紹介されました.
  • スポーツデータとAI:スポーツをシステムとして捉えて楽しむ
    神武 直彦 (慶應義塾大学)
    スポーツにおけるAIとデータ分析の具体的な活用事例が紹介されました.フェンシングやアーティスティックスイミング,ラグビーなどで,高速カメラやセンサー,AIを用いて選手の動きや技術点,フィジカルの向上と怪我の予防を行います.BIツールやChatGPTを活用して自己分析も可能にし,データ分析による戦略立案や健康管理など,スポーツ全体をシステムとして捉える新しい視点が提供されました.

基調講演・招待講演・特別講演

合計で4名の方からの講演がありました:

  • 現場の問題から始めるAIシステム
    山口高平 先生 (神奈川大学/人工知能学会 元会長)
    実装されるAIシステムが増えてきた一方,現場でのAIシステムの効果が低いケースも発生しています.AI 技術全体を俯瞰し,現場の問題を分析して,どの場面でどのAI技術をどのように活用すれば効果があがるのかを深く考え,現場で役立つAIシステムを設計することが重要です.このことから,そのような業務を担えるAI人材育成の重要性を指摘されました.
  • AIは『鉄腕アトム』の夢をみるか?~生成AIによるコンテンツ制作の可能性と問題
    手塚 眞 (有限会社ネオンテトラ)
    AIがクリエイティブな作業にどのように関与できるかについて議論する招待講演でした.特に,AIの限界と可能性,映画や漫画制作における具体的な利用例,そしてAIとプロフェッショナルなクリエイターの共生について詳しく説明されました.また,手塚治虫の先見性とその作品の評価についても触れられ,AIがクリエイティブな作業を支援する未来の展望が示されました.
  • 進化する大規模言語モデル
    相澤 彰子 (国立情報学研究所)
    自然言語処理(NLP)における大規模言語モデル(LLM)の進化と現状を紹介しました.LLMの進化の系譜は,word2vec,GPT,LLaMAの三つの主要な系統に分けられ,分布仮説と文脈類似度に基づくベクトル表現の発展や未知語および語義の曖昧性への対処方法の変遷が説明されました.さらに,2020年以降の大規模化と生成モデルの進化,コーパス整備やモデルのチューニング,タスクの多様化と評価手法の確立, 透明性と安全性の課題が取り上げられました.また,LLMが新しいビッグサイエンスとなり,モデル自体が研究対象となっている現状も示されました.
  • AIとXRを活用した少子高齢社会の学びとケアのイノベーション
    竹林 洋一 (みんなのケア情報学会理事長,創造する心代表取締役)
    AIとXR(VR,AR,MR)を活用した少子高齢社会における学びとケアのイノベーションについて述べます.2017年に設立された「みんなの認知症情報学会」は,認知症や発達障害を「個性」として捉え,専門を超えた交流を通じてケアの高度化や地域づくりに取り組んできました.2023年には「みんなのケア情報学会」に改名し,静岡大学のプロジェクトと連携してAIとメタバースを活用したセルフケアと学びの活動を展開しています.講演では,ミンスキーのコモンセンス理論によるケアのモデル化,XRを用いた学びのプラットフォームの開発とその応用事例を紹介し,超少子高齢社会におけるケアと学びの未来の展望が示されました.

気になった発表

以下は我々が気になった発表です.

  • 対話型 AI の共感性向上へのアプローチ
    笠井 有華,白石 梨華,早瀬 光浩 (椙山女学園大学)
    対話型AIシステムの共感性を向上させるための学習モデルを提案しています.具体的には、「日本語共感音声対話コーパス」を使用し,LoRAを用いた学習を行うことで,AIが人間の感情や社会的相互作用を深く理解し,模倣できるようにすることを目指しています.このアプローチにより,ユーザーの感情や状況に応じた自然で共感的な応答を生成する対話システムの開発を目指しています.
  • 対話中の能動的発話を含む発話タイミングの学習の検討
    中西 惇也 (大阪大学),三好 遼 (中京大学),岡藤 勇希,馬場 惇 (サイバーエージェント),吉川 雄一郎,石黒 浩 (大阪大学)
    ユーザの要求に応答する受動的な対話システムと異なり,ユーザの要求行為を必要とせずに積極的にサービスを提供する「能動的な対話サービス」を実現するための研究です.実験では,対話中の発話タイミングを判断する推定モデルを提案し,評価しました.結果として,発話禁止,発話可能,発話必要の3つの区間において,8割強の精度で推定できることが分かりました.
  • インタビューロボット対話システムにおける発話意欲認識に基づく適応的対話戦略
    長澤 史記,岡田 将吾 (北陸先端科学技術大学院大学)
    インタビューにおいて,インタビュー相手が現在の対話を続けたいと考えているかを予測する発話意欲推定は重要な課題です.本研究では,インタビュー相手の音声や姿勢,心拍数や表情から,インタビュー相手の発話意欲推定を行う手法を提案しています.実験の結果,72%の精度で推定できることが分かりました.

女性向けランチ交流会

今年の全国大会では,人工知能分野におけるマイノリティとしての女性参加者がキャリアや研究などを相談できるコミュニティを作るために,初めての女性向けランチ交流会が開催され,姜が参加しました.今後は,他のマイノリティ向けの交流会も開催されることを期待しています.

おわりに

多くの研究で大規模言語モデルが使われており,これまでになくチャレンジングな課題に取り組んでいる研究も多く非常に興味深かったです.スポンサーブースでも活発な議論と採用活動が行われており,就活を目前に控えた学生たちにとっても大変有意義な場だと思いました.

オーガナイズドセッションのオーガナイザー主催の懇親会や突発的な有志の懇親会なども多く開催されており,様々な人と交流をすることができました.来年もぜひ参加したいです.

人気な炭焼きレストラン「さわやか」

学会会場近くのクラフトビール屋さん

投稿日:
カテゴリー: 発表