話題のDeepSeekの論点まとめ。DeepSeekのR1公開がもたらす波紋とは?OpenAIと米中のAI戦争は今後どうなっていくのか?

Higtyのシステムの作り方

1. 「OpenAIも勝手に他人のデータを使ってきたのに、中国がやると盗んだと批判する皮肉」

ChatGPTを提供するOpenAIは、もともと「世界中のさまざまな文章や会話データを使って学習を行った」とされています。しかし、その過程には著作権のあるコンテンツも含まれていた可能性があり、一部メディアから「勝手にデータを使ったのではないか」と訴えられている状況です。


一方、最近登場した中国企業のDeepSeekは、独自の大規模言語モデル「R1」を開発し、さらにオープンソースとして公開しました。OpenAIに批判的な人々の中には、「自分たちも他人のデータを使ってきたのに、中国企業には『盗んだ』と言うのは皮肉だ」という声もあります。


2. DeepSeekとは?――米中競争とオープンソース化という2つの特徴

DeepSeekが注目を集めている理由は大きく2つあります。


1つ目は、中国の企業であるという点です。AIは米中の技術競争の重要分野とされており、中国がアメリカにどの程度迫っているかは大きな関心事です。以前は「中国のAIはアメリカから6〜12か月遅れている」と言われていましたが、今では「3〜6か月ほどの差かもしれない」と見られはじめています。


2つ目は、R1モデルをオープンソースとして公開したという点です。ChatGPTのような強力なモデルは通常、企業の機密としてクローズドソース(非公開)にされます。しかしDeepSeekはこれをオープンにし、「誰でも使える」状態にしました。この動きに「OpenAIに反感を持つ人」や「オープンソースを応援したい人」が飛びつき、盛り上がっているのです。


3. 「600万ドルで作った」は本当か?――実は莫大なコンピューター資源

DeepSeekは「R1の開発にかかった最終トレーニングコストは600万ドル(約8億円)だ」と公表しています。一部メディアでは「アメリカの企業は10億ドル規模の投資をしているのに、中国企業は600万ドルとは驚き」と伝えられました。


しかし専門家によると、DeepSeekがいう600万ドルはあくまで“最終トレーニングラン”のコストだけであり、実際には大量のNvidia製高性能GPU(H100やH800など)を数万枚所有している可能性が高いとのこと。もし本当にそれだけのGPUを保有しているなら、総投資額は10億ドルを大きく超えるともいわれています。


つまり「小さなベンチャーが低コストで凄いモデルを作った」というイメージにはかなり誇張が含まれており、実際には巨額の資金や設備投資を裏付けとした開発である可能性が高いわけです。


4. 新たな手法と「PTX」の活用――制約が生むイノベーション

DeepSeekにはもう一つ注目すべき点があります。それは、通常はNvidiaが提供する「CUDA」という仕組みを使ってAIモデルを動かすところを、DeepSeekはあえて使わず、PTXというアセンブラ言語に近いレイヤーを使っている点です。PTXはよりチップに近いレベルの制御が可能ですが、その分高度な専門知識が必要です。


なぜそんな面倒な方法を取ったのかは定かではありませんが、「中国企業は最新のGPUを自由に買いづらい」「ソフトウェア面でも制約がある」という環境ゆえに、制約がイノベーションを生んだという見方もあります。

一方、西側の企業は資金に余裕があるため、わざわざアセンブラレベルに近い工夫をしなくても、高価な高性能GPUを大量に購入すれば問題が解決できるというわけです。


5. AIモデルはやがてコモディティ化する――価値はアプリケーション層へ

DeepSeekのR1がオープンソースで無料公開されたことで、「高性能なAIモデルが誰でも使えるようになっていく」流れが加速すると予想されています。実際、MicrosoftもR1を自社サーバーで動かしているとの話があります。


こうした流れの先にあるのは、AIモデルのコモディティ化(一般化)です。いまや、クラウドストレージのように「安くて当たり前」のインフラに近い扱いになりつつあります。かつて電力が普及した際も、電気そのものよりも電気を使ってビジネスを生み出す会社が儲けました。AIも同じように、モデルそのものよりも、それを活用するアプリケーションやサービスが主戦場になると考えられています。


6. OpenAI vs DeepSeek――データ流用と蒸留(蒸留学習)をめぐる攻防

AIモデルの開発では、既存モデルの出力を学習データに取り込む「蒸留(蒸留学習)」と呼ばれる方法が一般的です。実は多くのAI系スタートアップがOpenAIのChatGPTを使ってデータを集め、自社モデルに反映しているとも言われています。

これに対してOpenAIは「DeepSeekが不正に蒸留した証拠を掴んだ」と主張しているようです。こうしたトラブルを防ぐため、APIの利用制限や新たなセキュリティ対策が検討されていますが、規制を強めすぎるとイノベーションが停滞してしまう可能性も指摘されています。


7. 皮肉な構図――OpenAIが目指したオープンソース化を中国が実現?

OpenAIのCEOであるサム・アルトマン氏は当初、「オープンソース」を掲げていました。しかしいざChatGPTが成功を収めると、現在はクローズドソース化して「商用利用重視」に大きく舵を切っています。ニューヨーク・タイムズなどのメディアからは「著作権のある記事を勝手に学習データとして使った」として訴えられるなど、批判の矢面にも立たされています。


結果的に「OpenAIが集めたデータを中国のDeepSeekがさらに利用し、オープンソースを推進している」という皮肉な構図になっており、「本来OpenAIが目指したことを、今は中国企業がやっているようにも見える」という声もあります。


8. これからのAI競争――アプリ層への移行と米中の地政学リスク

AIモデルが安価に高性能化していくと、最終的に大きな付加価値は「モデル」自体ではなく、その上で動くアプリケーションやサービスに移る可能性が高いと見られています。たとえば、業務効率化ツールやマーケティング支援システム、あるいはロボティクスなど、実際にAIを使う現場やハードウェアが次の大きなビジネスチャンスを生むかもしれません。


一方で、米中の地政学的な要素もAI競争に影響を与えます。たとえばNvidia製GPUの輸出規制が話題になりますが、実際にはシンガポール経由などで多くのGPUが中国に流れている可能性があり、規制の実効性には疑問がつきまといます。また中国政府のバックアップによって大企業がAIに巨額投資を行うなど、国の方針と密接に連動する点が、民間主導のアメリカ企業とは異なる部分です。


9. データ独占や訴訟リスク――今後のシナリオ

今後予想されるシナリオとしては、アメリカ企業や中国企業がコンテンツメディア(例:Redditや新聞社、ディズニーなど)を買収し、「自分たちだけが使える専用データを独占」する動きが進むかもしれません。また、「勝手に学習データを使われた」と主張するコンテンツホルダーが、いわゆる特許トロールのような形で訴訟を起こす展開も想定されます。


いずれにしても、大規模言語モデルをめぐる技術競争は、単にモデルの性能だけでなく法的リスクや規制、データの管理、地政学的背景など、多角的な争いになりつつあります。


10. まとめ――AIモデルの価値は陳腐化が速い。次のチャンスはどこに?

DeepSeekのR1モデルは中国がAI分野でアメリカに急速に迫っていることを印象づけました。

「600万ドルで作った」という宣伝は誇張が含まれ、実際には膨大なGPU資源と投資があったと考えられています。

AIモデルのコモディティ化が進むと、本当の付加価値はアプリケーションやサービス層に移る可能性があります。

米中の輸出規制やデータ利用をめぐる争いは激化する見込みですが、一方で規制を強めるとイノベーションが停滞するリスクもあります。

今後AIを活用する上では、単に大規模言語モデルを導入するだけでなく、それをどう自社の業務やプロダクトに組み込むかが鍵になってきます。「電気をどう使うか」がビジネスの成否を分けた歴史と同じように、安価になったAIをどう活用するかが競争力の差となるでしょう。


経営者やビジネスパーソンにとっては、「どのAIモデルを選ぶか」よりも「AIを使って何を実現し、どのように差別化するのか」を考えることが、これからますます重要になってくるはずです。