Ultra Ethernet最新動向
~大規模AIデータセンターネットワーク~

生成AIの急速な発展からエージェンティックAIの普及により、大規模AI計算基盤に注目が集まっています。大規模AI計算基盤では、規模対応性や仮想化・マルチテナンシーへの対応、運用性等の観点からEthernetやInternet Protocol (IP)をベースとした技術が広く採用されています。特に、エージェンティックAI時代においては、インターネットやクラウドをはじめとする既存の情報通信基盤と一体になって機能することが求められるため、Ethernetエコシステムの応用が盛んに行われています。一方で、LLM(Large Language Model)などの大規模基盤モデルを複数の演算装置で分散して学習・推論するスケーリング技術(スケールアップネットワーク)では、従来のEthernetとは異なる要件も含まれています。 本セッションでは、生成AI時代の大規模分散学習から推論までのAIライフサイクルを支える大規模AI計算基盤におけるデータセンターネットワーク技術を紹介します。あわせて、Ultra Ethernet Consortium (UEC)におけるスケールアップネットワーク、スケールアウトネットワークを含めた最新動向も紹介します。
<要旨>

●生成AIの大規模分散学習と推論(分散アルゴリズムと通信) ●AI計算基盤を支えるデータセンターネットワーク技術 ●Ultra Ethernet Consortiumにおけるスケールアップ、スケールアウトネットワークの最新動向

Speaker

Arrcus, Inc.

プリンシパル エンジニア

海老澤 健太郎

インターネット黎明期より、ネットワーク技術や製品の検証、サービス導入支援に携わる。その後、国内外のスタートアップ企業において、顧客サポート、製品デザイン、開発マネジメントなど幅広い領域を担当。ASIC・FPGAを活用した高性能フロールータ、OpenFlowスイッチの開発などに従事。また、大手自動車メーカーおよび通信事業者の嘱託研究員として、P4やSONiCなど、オープンネットワーキング技術のコミュニティ活動にも取り組む。現在は北米スタートアップ企業にて、AI向け機能を中心にネットワーク機器の研究開発に従事している。

Speaker

(株)Preferred Networks

エンジニア

上野 裕一郎

2019年に東京工業大学工学部情報工学科(現 東京科学大学)を卒業後、2021年に同大学情報理工学院情報工学系修士課程を修了。大学院では高性能計算分野、とくに分散深層学習の高速化・省メモリ化・省I/O化に関する研究に従事。2021年より株式会社Preferred Networksに入社し、GPU・MN-Core・RDMAネットワークのパフォーマンス改善、深層学習のための分散キャッシュシステムの開発、Software-Defined Storageの運用、サーバプロビジョニング自動化など、低レイヤーの技術を主軸として機械学習プラットフォームの開発・運用に取り組んでいる。

Chair

さくらインターネット(株)

プリンシパルエンジニア

小林 正幸

国内のサービスプロバイダにて、インターネットおよびデータセンターネットワークの設計・構築・運用に長年従事。近年はAIワークロードの拡大を背景に、GPUを中心としたデータセンターネットワークの設計・最適化に取り組む。現在は将来導入を見据え、ネットワークに加えサーバ内部アーキテクチャや光接続も含めたエンドツーエンドのデータパス全体を対象に、新技術・新製品の調査、選定、検証を担当している。

タイムテーブルに戻る 閉じる