系統送電網を停止させるほど強力なテスラのスーパーコンピュータ「Dojo」

ExaPod-01 TESLA News
Credit:Tesla
スポンサーリンク

テスラは、先日のAIデー2022で同社のスーパーコンピュータ「Dojo」の最新バージョンを発表しましたが、その性能はパロアルトの送電網を停止させるほど強力なものだったようです。

Dojoは、AI機械学習のために一から作られたテスラ独自のカスタムスーパーコンピュータプラットフォームで、より具体的には、同社の車両から送られてくる映像データを使ったビデオトレーニングのために作られたものです。

テスラはすでに、世界でも有数の性能を誇るNVIDIA GPUベースの大型スパコンを保有していますが、今回発表されたDojoのカスタムビルドコンピューターは、チップとインフラ全体をテスラが設計したものを使用しているとのことです。

この特注スパコンは、テスラの自動運転に必要なコンピュータビジョン技術に不可欠な、ビデオデータを使ったニューラルネットのトレーニング能力を高めると期待されています。昨年のテスラのAIデーで、同社はスパコン「Dojo」を公開しましたが、当時はまだこの取り組みを強化している段階でした。最初のチップとトレーニングタイルがあるだけで、Dojoのフルキャビネットとクラスタ「エクサポッド」(ExaPod:Exaは10の18乗を意味する)の構築に取り組んでいる最中でした。

テスラは、昨夜のAIデー2022で、この1年間のDojoプログラムの進捗を公開しました。

Credit:Tesla

同社は、チップとタイルから、システムトレイと完全なキャビネットに至るまで、ある程度完成したことを報告いしています。テスラは、6つのGPUボックスを1つのDojoタイルで置き換えることができるとし、そのコストはGPUボックス1つ分より少ないとのことで、そのタイルは、1つのトレイに6つあるという構成です。

Credit:Tesla

テスラは、1つのトレイが「フルロードのスーパーコンピュータラック3~4台分」に相当するとし、システムトレイに直接ホストインターフェイスを統合して、大きなフルホストアセンブリを実現しています。このホストアセンブリを搭載したこのシステムトレイを、1台のDojoキャビネットに2台収めることができるようです。

Dojoのキャビネットを閉じた状態と開いた状態は写真のような感じです。

Credit:Tesla
ExaPod-01
Credit:Tesla

テスラは現在、キャビネットをいくつか組み合わせて最初の「Dojoエクサポッド」を作るために必要なインフラを開発・テストしているところです。テスラのDojo担当プリンシパルシステムエンジニアであるビル・チャン氏は、次のように語っています。

「私たちは、これまでにない冷却と電力密度をサポートするために、データセンターのインフラをあらゆる側面から見直す必要があることを理解していました。Dojoのキャビネットに電力を供給するために、独自の高出力冷却・電力システムを開発する必要があったのです。」

ビル・チャン氏によると、テスラは今年初め、インフラをテストする際に、地元の電力系統の変電所をトリップさせる事態になったということです。

「今年の初め、私たちは電力と冷却インフラの負荷テストを開始し、2MW以上の負荷をかけることができたのですが、変電所に負荷がかかり、市から電話がかかってきました。」

テスラDojoエクサポッドを開いた状態、閉じた状態の様子です。

テスラはDojo Exapodの主なスペックを発表しました。1.1EFLOP、1.3TB SRAM、13TB高帯域DRAMです。同社はこのイベントを利用して、より多くの人材を確保しようとしているのですが、2023年第1四半期に完全な最初のクラスタ(エクサポッド)を用意する予定であることも共有しました。

なぜテスラはDojoスパコンを必要とするのか。
それは当然の疑問で、なぜ、自動車メーカーが世界最強のスパコンを開発する必要があるのか、についてはテスラは、単なる自動車メーカーではなく、持続可能な経済への移行を加速させる製品を開発するテクノロジー企業だから、と主張するのでしょう。

マスク氏は、Dojo をクラウドサービスとして提供することは意味があると述べ、おそらく彼の友人ジェフ・ベゾス氏の Amazon AWS に対抗するようなサービスを目指した「オンラインで利用可能な、より速く、より安価にモデルを訓練できるサービス」と称しています。

しかし、より具体的に言えば、テスラは、自動運転システムを構築するために、同社の車両からのトレーニング用映像を自動ラベル付けし、ニューラルネットを訓練するために Dojo を必要としているのです。テスラは、顧客から送られてくる数百万本のビデオ映像をもとにニューラルネットに学習させて自動運転システムを開発するアプローチには、多くの計算能力が必要であることに気づき、その能力を提供するスーパーコンピュータを独自に開発することにしたということです。

これは短期的な目標ですが、テスラは今後、他の人工知能プログラムの開発にも大きな野心を抱いているので、スパコンを十分に活用することができると考えられます。

この記事はこのサイトを引用・翻訳・抜粋・編集して作成しています。

テスラ関連の最新ニュースをほぼ毎日アップしていますのでこちらを参照ください。

 グーグルニュースでフォローする
タイトルとURLをコピーしました