Ultra Ethernet最新動向
~大規模AIデータセンターネットワーク~
生成AIの急速な発展からエージェンティックAIの普及により、大規模AI計算基盤に注目が集まっています。大規模AI計算基盤では、規模対応性や仮想化・マルチテナンシーへの対応、運用性等の観点からEthernetやInternet Protocol (IP)をベースとした技術が広く採用されています。特に、エージェンティックAI時代においては、インターネットやクラウドをはじめとする既存の情報通信基盤と一体になって機能することが求められるため、Ethernetエコシステムの応用が盛んに行われています。一方で、LLM(Large Language Model)などの大規模基盤モデルを複数の演算装置で分散して学習・推論するスケーリング技術(スケールアップネットワーク)では、従来のEthernetとは異なる要件も含まれています。
本セッションでは、生成AI時代の大規模分散学習から推論までのAIライフサイクルを支える大規模AI計算基盤におけるデータセンターネットワーク技術を紹介します。あわせて、Ultra Ethernet Consortium (UEC)におけるスケールアップネットワーク、スケールアウトネットワークを含めた最新動向も紹介します。
<要旨>
●生成AIの大規模分散学習と推論(分散アルゴリズムと通信)
●AI計算基盤を支えるデータセンターネットワーク技術
●Ultra Ethernet Consortiumにおけるスケールアップ、スケールアウトネットワークの最新動向