E2-05

11.21(木) 14:30-15:10 | 展示会場内 RoomE

×

テーマ別セミナー

映像認識AI×LLM
~人物行動理解:見えるものから見えないもの、そして生成へ~

本講演では、多角的な視点から人物の行動を感知・理解するための、産業フレームワークについて紹介する。このフレームワークは、固定カメラや360度カメラといった従来の可視光カメラに加え、ミリ波センサーのような「見えない」技術を用いて、映像から得られる人物行動を分析する。さらに、大規模言語モデル(LLM)を活用し、情報量豊かな要約文章や報告書、短縮動画を自動生成する機能も備えている。本講演では、学術界と産業界の両方に大きく貢献してきた、このフレームワーク内の様々な研究成果を紹介する。本フレームワークは、実世界で生成されるデータを感知し、それを読みやすく、視覚化可能なデジタル形式に変換し、最終的にそのデータを解析して人物の行動を理解する、一連の最先端技術で構成されている。具体的には、従来のカメラ[MM'16, SIGGRAPH'16]、360度カメラ[MM'19, WACV'20, ICIP'21]、ミリ波センサー[MM'20]を用いたセンシング技術から、行動認識、物体追跡、人と物体の相互作用、シーン認識、行動パターン分析[ICMR'18]といった行動解析まで、幅広い領域における研究成果が含まれる。これらの技術により、人物行動を詳細に解釈するために必要なデータの抽出、可視化、要約が実現されている[MM'22, NarSUM'23, ICMR'24]。また、本講演では、インタラクティブなデモと興味深い洞察を交えながら、効果的な処理技術と効率的なアルゴリズムを採用した人物行動の感知と理解に関する概要を、一般の方にも分かりやすく紹介する。最後に、生成AI時代のさらなる行動理解に向けた課題と展望について聴講者の皆様に共有する。
  • 生成AI
  • 画像認識 AI Expo
Speaker

NEC

ビジュアルインテリジェンス研究所
ディレクター & 主幹研究員

劉 健全

劉健全,博士(工学).2012年NEC入社.入社後は映像解析技術とデータベース技術の融合に関する研究開発に従事し,継続的に研究成果の製品化を実現.現在,マルチメディア(MM)やデータベース(DB)・データマイニング(DM)・コンピュータビジョン(CV)・ヒューマンコンピュータインタラクション(HCI)の学際分野で広範囲に活動し,ディレクター(研究部長)・主幹研究員として世界初の「映像認識AI×LLM」の企画・設計・開発を主導,NECのマルチモーダル生成AIの研究開発と実用化をけん引.難関学会を含む国内外の主要会議にて70本以上の論文発表,意匠・特許出願100件以上.ACM MM 2024とIEEE ICIP 2023の産業委員長やIEEE MIPR 2021の実行委員長を含む多数の国際会議のプログラム委員長を歴任.情報処理学会2018年度業績賞・2020年度情報処理技術研究開発賞,令和3年度(2021年度)関東地方発明表彰発明奨励賞,第69回(2021年度)電気科学技術奨励賞並びに文部科学大臣賞,2023年度映像情報メディア学会丹羽高柳賞業績賞,2023年度電子情報通信学会業績賞など計30以上の賞を受賞.名古屋大学客員教授,法政大学兼任講師.ITE MTA,IEEE TMM, ACM TOMM各編集委員.IEEE及びACMシニア会員,IEICE,IPSJ,ITE,DBSJ,APSIPA各会員.

閉じる