こんにちは、グループデータ本部データサイエンスグループの清田です。
昨年のDEIM 2023に引き続き、「第16回データ工学と情報マネジメントに関するフォーラム(通称DEIM 2024)」に参加・登壇してきましたので、その様子を報告いたします。
※昨年の様子はこちら www.lifull.blog
昨年に引き続いての「直列ハイブリッド」開催
コロナ禍の影響が徐々に薄れ、対面形式でのイベントが再開される中、DEIMでは昨年に引き続き「直列ハイブリッド」というユニークな形式で開催されました。
2月28日から3月1日までの3日間はオンライン開催、土日をはさんで3月4日・5日は兵庫県姫路市の会場での現地開催でした。
ハイブリッド開催のイベントは今や一般的になりましたが、どうしてもオンライン参加者と現地参加者の間のコミュニケーションが難しくなってしまうという課題があります。
オンライン開催中には多くの発表を集中して聴講し、現地開催中には多くの参加者との交流をもつことができる開催形態は、参加者としても利点が多いと思います。
開催にご尽力いただいた関係者の方々に、心からの敬意を表したいと思います。
大規模言語モデル(LLM)のインパクト
2022年11月にリリースされたChatGPT、およびその技術的基盤となる大規模言語モデル(LLM)は、AI、情報処理に関する研究にも大きな影響を与えています。
とくに自然言語処理分野でなされてきた研究課題のうちかなりの部分は、LLMによって解けるようになったこともあり、研究のテーマ設定自体が大きく変わりつつあります。
DEIM 2024でも、40件以上のLLMに関する研究発表が行われており、トレンドの大きな変化を実感しました。
また、3月4日に開催されたチュートリアルセッションでも、LLMに関する以下のチュートリアルが企画され、いずれも多くの参加者を集めていました。
- クラウド環境で駆動する生成系AIの最先端
- LLMと音声理解・生成の最新動向
- 大規模言語モデルに基づく検索モデル
- LLMの嘘:ハルシネーション解説
共有データ資源のこれから
LLMなどの生成AI技術が飛躍的に発展する中、生成AIが必要とするデータ資源の存在が、あらためて注目されています。
LIFULLでも、国立情報学研究所(NII)のご協力のもと、LIFULL HOME’Sデータセットを2015年11月より学術研究用途に提供しています。
現時点で170件を超える研究成果が発表されていて、LIFULL HOME’S 3D間取りなどの新たなサービスの実現にもつながっています。
AIや情報処理に関する研究は、多くの研究者がアクセスできる共有データ資源の存在に支えられて発展してきました。
Webに蓄積された大量のデータ資源が、自然言語処理や画像処理などの研究の発展を促すとともに、Webを活用したビジネスの発展の基盤となり、さらにWeb上のデータ蓄積を加速するという「好循環」が、AIなどの発展を支えてきました。
一方で、生成AI技術の隆盛は、「データを独占的に保有すること自体が巨大な利益につながる」という状況も生み出しています。
こうした状況で、「好循環」が滞ってしまうのではという懸念も出てきています。
2023年には、Twitter社(現X社)が、これまで学術研究者向けに認めてきたAPIの利用を停止するという出来事もありました。
こうした流れの中、今後のAI研究を支えるためのデータ資源のあり方を、改めて振り返ることが必要ではないかと考えています。
DEIM 2024では、LIFULLからの技術報告として、「不動産情報サービスの研究開発における研究データ資源」についてのプレゼンテーションを行いました。
この発表では、LIFULLにおけるデータセットの共有と活用の取り組みを紹介するとともに、Webが出現するより前の1990年代からの共有データ資源をとりまく環境の変化を俯瞰した上で、今後の共有データ資源の健全な発展を図るための方策についての考察を行いました。
もしよろしければ、ぜひ発表資料をご覧ください。
LIFULLでは、Webインテリジェンスとインタラクション(WI2)研究会や、2024年5月に浜松で開催される人工知能学会全国大会(JSAI 2024)など、複数の学会イベントをこれからもサポートしてまいります。
また、LIFULLでは、共に成長しながら働く仲間を募っております。
現在、以下の職種を募集しております。LIFULL HOME’Sデータセットなど、豊富な研究開発資源を活かしながら、多様な社会課題の解決に向けた研究開発やプロダクト創出に取り組んでみませんか?
ご興味をお持ちの方は、ぜひお問い合わせください!