banner

ブログ

Sep 02, 2023

MGX: Nvidia がマルチを標準化

MGX 仕様を追加して更新:コンピューティング エンジン メーカーがシステム設計だけでなくマザーボードも手がけると、マザーボードを製造し (製造している企業は数十社あります)、システム設計を作成する企業 (元の設計メーカーとオリジナルのメーカー) は、少し安心すると同時に少し緊張します。コンポーネントの標準化は、コンポーネントが行うべき作業が少なくなることを意味しますが、同時に、料金を請求する必要も少なくなります。

Nvidia は、MGX の多世代サーバー プラットフォーム設計を台湾の Computex 見本市で今週発表しました。台湾はコンポーネントおよびシステム製造の世界の主要拠点の 1 つであり、コンピューティング エンジンの製造と組み立ての誰もが認める中心地でもあります。は、自社と世界中の OEM および ODM の業務を容易にし、自社と彼らにより良い利益を提供したいと考えています。

Nvidia は、2016 年 4 月に「Pascal」 P100 GPU アクセラレータをベースにした DGX-1 システムがデビューして以来、独自のサーバーを製造してきました。 Nvidia は、市場投入までの時間を短縮し、コンポーネントとマザーボードの設計にフィードバック ループを作成するためにこれを行うことにしました。 Nvidia が大規模な AI ワークロードを実行するために独自のスーパーコンピューターを構築する必要があり、OEM や ODM に依頼するよりも安価であったという事実も、この決定の要因となりました。 当時、Nvidia が製造できた Pascal GPU のほとんどは、ハイパースケーラーやクラウド ビルダー、さらにはいくつかの HPC センターに出荷されており、DGX-1 は研究者や科学者が入手できるように Nvidia によって優先的に販売されていました。彼らはこれらの GPU アクセラレーション システムを手に入れました。 これは、2 か月前に発表された「Volta」V100 GPU アクセラレータで DGX-1 マシンが更新された 2017 年 5 月にも当てはまりました。 2020 年 5 月には、「Ampere」 A100 GPU を使用した DGX-A100 システムが続き、もちろん、NVLink スイッチ ファブリックでさらにスケールアウトした DGX-H100 設計も、「Hopper」 H100 GPU アクセラレータと同時に展開されました。昨年、DGX-GH200 システムのハイブリッド CPU-GPU 設計で今週更新されたばかりです。

最新の DGX-H100 および DGX-GH200 マシンで使用されている H100 SXM5 または NVSwitch 3 ASIC は購入できません。 CPU、GPU、および NVSwitch インターコネクト用のシステム ボードは、すべてのコンポーネントが製造およびテストされた状態でユニットとしてハイパースケーラー、クラウド ビルダー、およびその ODM サプライヤーに販売されます。また、事前に組み立てられたコンポーネントとしても OEM に販売され、OEM はそれらのコンポーネントを組み立てて出荷します。彼らのシステムに。 独自のシステムを構築したい場合は、PCI-Express バージョンの GPU アクセラレータ、Quantum InfiniBand、または Spectrum Ethernet ASIC を Nvidia から購入できますが、NVSwitch メモリ ファブリック上で実行されるハイエンドのものについては、これらを事前に組み立てる必要があります。 HGX と呼ばれるコンポーネント。

HGX/DGX によってシステムの内部コンポーネントをある程度標準化した Nvidia は、現在、これらのコンポーネントを包むシェルを標準化して、すべての ODM および OEM の市場投入までの時間を短縮し、結果として得られるシステムが将来的にアーキテクチャに変更が加えられることを考慮して、可能な限り現場でアップグレードする必要があります。

一言で言えば、これが MGX の取り組みのすべてです。

昨年 5 月にプロトタイプの HGX Grace および HGX Grace-Hopper システム設計が Nvidia によって公開されたとき、私たちは初期の MGX 設計がどのようなものかを少しだけ知ることができました。 これらは単なるシステム ボードではなく、完全なラックマウント サーバー設計でした。

MGX 標準化の取り組みは、DGX/HGX データセンター コンピューティング プラットフォーム、OVX メタバース ホスティング プラットフォーム、CGX クラウド グラフィックスおよびゲーム プラットフォームに及びます。Nvidia は、Grace CPU とさまざまな GPU アクセラレータがこれら 3 つの鉄のラインでどのように構成されるかについて説明しています。 :

今週の Computex で披露された MGX デザインは次のとおりです。

左側のものは、4 つの GPU アクセラレータと組み合わせた Grace-Grace スーパーチップです。 中央のシステムには 2 つの X86 CPU、2 つの ConnectX ネットワーク インターフェイス、および 8 つの GPU アクセラレータが搭載されており、右側のシステムには 2 つの水冷コンピューティング エンジン (Grace-Hopper スーパーチップと推測されます) と 2 つのネットワーク インターフェイス カードが搭載されています。

共有