テスラFSD vs Nvidiaコスモス、自動運転実現の成否を握る現実データと合成データの戦い

TESLA News
スポンサーリンク

2025年のコンシューマー・エレクトロニクス・ショー(CES2025)で、Nvidiaは新しいコンシューマー向けグラフィックカード、エンドユーザー用コンピューティングマシン、商用AI製品を披露しました。これらの製品の一つに、新しいNvidiaコスモストレーニングシステムが含まれていました。

Nvidiaはテスラの緊密なパートナー社であり、実際、テスラがFSDのトレーニングに使用するGPUを生産・供給しています。そのGPUとは、ギガ・テキサスに新設されたCortexスーパーコンピューター・クラスターに設置されているH100と、まもなく設置されるH200です。Nvidiaは、テスラがすでに着手している自動運転システム用の合成トレーニングデータの開発と展開でも、テスラに挑戦する構えです。

これは他の自動車メーカーにとってはるかに重要なことです。Nvidiaが提供しようとしているもの、そしてテスラがすでに実施しているものと比較してどうなのかを見ていきましょう。テスラのFSDの仕組み、テスラがFSDをどのように合理化しているか、そして最近のFSDの最適化について、私たちはいくつかの詳細な調査を行いました。専門用語や背景知識について少し理解を深めたい方は、先にそれらの記事をお読みいただくことをお勧めしますが、私たちは、この合成データの仕組みについてできる限り説明したいと思います。

Nvidiaコスモス

Nvidiaのコスモスは、ロボットや自動運転車などの物理的なAIシステムの開発を加速するために開発された生成型AIモデルです。 テスラのFSDも、同社のヒト型ロボット「オプティマス」を実現しているのと同じソフトウェアであることを覚えておいてください。 Nvidiaは、テスラと同様に、家庭、街中、職場など、どこでも物理的な現実世界のAI展開に取り組むことを目指しています。

コスモスは物理法則を認識するエンジンで、実世界のビデオから学習し、シミュレーションされたビデオ入力データを構築します。AIシステムがより早く学習できるよう、システムに入力されたビデオに基づいてデータをトークン化します。聞き覚えがありますか?FSDもまったく同じ方法で学習します。

コスモスには、センサー融合シミュレーションを行う機能もあります。つまり、ビデオ、LiDAR、音声など、ユーザーが意図する複数の入力ソースを統合し、AIモデルが学習するための単一世界のシミュレーションデータにまとめることができるのです。これにより、自動運転車の挙動を安全な統合形式で訓練、テスト、検証しながら、膨大な量のデータを生成・取得することができます。

データ拡張

もちろん、コスモス自体にはビデオ入力が必要です。より多くのビデオをコスモスに与えれば、より多くのシミュレーションを生成し実行することができます。AIアプリケーションにはデータ拡張が不可欠です。AIが自らを訓練するために無限のシナリオを構築するには、無限の量のデータをAIに与える必要があるからです。

また、合成データにも問題があります。それは現実的でしょうか?現実世界の状況を予測できるでしょうか?2024年初頭、イーロン・マスク氏はこの問題についてコメントし、現実世界でもシミュレーションデータでも、データ規模は無限に拡大すると述べました。テストデータを収集するより良い方法は、現実世界のデータを使用することです。結局のところ、現実世界を予測できるAIはまだ存在しません。実際、これは優秀な頭脳を持つ人々が取り組んでいる量子コンピューティングの非常に大きな課題になっています。

テスラのAIチームのエンジニアであるユン・タ・サイ氏も、コードを書いたりシナリオを生成したりしても、AIの最も突飛な妄想でさえカバーできないと述べています。AIが開発する厳格なトレーニングセットでは、必ずしも意味をなさない光学現象や現実世界の状況がたくさんあるため、実際に役立つ現実世界のAIをトレーニングできるシステムを構築するには、現実世界のデータが絶対に不可欠です。

テスラのソーシャルメディアチームリーダーのヴィヴによると、テスラには以前はトレーニングに使用されていた何十億マイルもの実世界のビデオがあります。今日でも、FSDは誤解を招いたり、処理速度を低下させたり、処理を継続できなくしたりする「エッジケース」に遭遇することがあり、ユーザーに操作を引き継ぐよう指示する恐ろしい赤いハンドサインが表示されることがあります。そのため、これだけのデータは不可欠です。

コスモスは、歩行や物体の操作などの人間の行動を含む約2000万時間の映像でトレーニングされました。一方、テスラの車両群は、1分あたり約2380分の実世界のビデオを記録しています。つまりテスラの車両群が140時間、6日間弱で集める映像は、2000万時間分に相当します。これは、平均速度を時速60マイルとして計算した、概算の数字です。

生成された世界

テスラのFSDとNvidiaのコスモスは、いずれも非常に現実的で物理法則に基づいた世界を生成することができます。これらの世界は、現実の環境を模したもので、人や交通の流れ、縁石、フェンス、建物、その他の障害物や物体の位置を現実と同じようにシミュレートします。

テスラは実世界のデータと合成データの組み合わせを使用していますが、データの組み合わせは実世界のデータに大きく偏っています。一方、コスモスを使用する企業は、データを合成的に作成された状況に大きく偏らせることになり、トレーニングデータセットでどのようなケースが見られるかを大幅に制限することになります。

そのため、生成された世界はAIを迅速に検証するのに役立つかもしれませんが、AIのトレーニングには現実世界のデータほど有用ではないと私たちは考えます。

全体として、コスモスはエキサイティングな一歩です。他の企業は明らかにテスラの足跡を追っていますが、現実世界のデータに関しては大きく遅れをとっています。テスラはAIと自動運転において圧倒的な先行者利益を築いており、他の企業は現在、その遅れを取り戻そうとしています。

テスラが今後、データラベル付け用のスーパーコンピューター「Dojo」をどのように展開し、既存のリードをさらに広げていくのか、また、Cortexがどのように拡大していくのか、そして競合他社がどのような製品を投入してくるのか、非常に楽しみです。結局のところ、競争がイノベーションを生み出すのです。そして、テスラが電気自動車の分野でイノベーションを起こしたのも、まさにその方法でした。

この記事はこのサイトを引用・翻訳・編集して作成しています。

テスラ関連の最新記事を毎日随時アップしていますので、過去のニュースはこちらを参照ください。

この記事に関するあなたのご意見を、下のコメント欄にお寄せください。

※免責事項:この記事は主にテクノロジーの動向を紹介するものであり、投資勧誘や法律の助言などではありません。また、記事の正確性を保証するものでもありません。掲載情報によって起きたいかなる直接的及び間接的損害に対しても、筆者・編集者・運営者は一切責任を負いません。また、運営者はテスラ株式のホルダーです。

コメント

タイトルとURLをコピーしました