DeepSeek

中国のDeepSeek、その低コストAIモデルの全て―QuickTake
以下は、記事の抜粋。


創業1年余りの中国のAI新興企業であるDeepSeekは、世界トップクラスのチャットボットに匹敵する性能を、その数分の1程度のコストで実現する画期的なAIモデルを披露し、シリコンバレーを感心させると同時に慌てさせている。

DeepSeekの登場は、未来のAI開発には際限ない電力とエネルギーが必要だという一般的な考えを覆すものとなるかもしれない。

DeepSeekの革新性に対する期待が膨らみ、投資家が米国のライバル企業やそのハードウエアサプライヤーへの影響について考え始めたことで、世界のテクノロジー株は1月27日に急落した。

DeepSeekは2023年に、梁文峰氏によって設立された。同社はオープンソースのAIモデルを開発しており、これは開発者コミュニティーの誰もがソフトウエアを検査し、改善することができることを意味する。同社のモバイルアプリは1月上旬にリリースされると、米国のiPhoneダウンロードチャートでトップに躍り出た。

同社は、リリースされた「R1」はオープンAIの最新バージョンと同等の性能を提供すると主張。この技術を使用したチャットボット開発に興味のある個人に対して、その上に構築するためのライセンスを付与していると説明している。

DeepSeekからの詳細な説明は出ていないが、DeepSeekのモデルのトレーニングと開発にかかる費用は、オープンAIやメタの最上位製品に比べるとほんのわずかに過ぎないようだ。

このモデルの優れた効率性は、AI開発各社がエヌビディアのような企業から最新かつ最も強力なAIアクセラレーターの入手に多額の資本を投じる必要があるのかという疑問を生じさせる。

DeepSeekによると、R1は数学的タスクのAIME 2024、一般知識のMMLU、質問応答性能のAlpacaEval 2.0など幾つかの主要なベンチマークにおいて、ライバルモデルと同等か、それ以上の性能を発揮しているという。また、カリフォルニア大学バークレー校が運営する「Chatbot Arena」というランキングでも、トップクラスの性能を誇っている。

米政府は米国と中国の技術覇権争いの要となるAI分野で中国が優位に立つことを阻止しようと、GPUなどのハイエンド技術の中国への輸出を禁止した。しかし、DeepSeekの進歩は、中国のAIエンジニアが限られたリソースで効率性の向上を追求し、規制の影響を回避できていることを示唆する。

DeepSeekは昨年11月には、人間の思考を模倣するように設計された推論モデル「DeepSeek R1」を世界に披露した。このモデルは、今年1月にリリースされたウェブインターフェースと併せて、オープンAIの代替となるはるかに安価な製品として世界的に注目を集めた。

投資家のマーク・アンドリーセン氏はこれを、「AIの『スプートニク的瞬間』」と呼んだ。市場調査会社アップ・フィギュアズのデータによると、DeepSeekのモバイルアプリは1月25日までに160万回ダウンロードされ、オーストラリア、カナダ、中国、シンガポール、米国、英国のiPhoneアプリストアで1位を獲得した。

DeepSeekの創設者の梁氏は、1985年に広東省で生まれ、浙江大学で電子工学および情報工学の学士号と修士号を取得した。梁氏は1000万元(約2億1000万円)の登録資本金でDeepSeekを設立した。梁氏は、さらなる進歩へのボトルネックは資金調達ではなく、米国による最先端チップへのアクセス制限だと、中国メディア36krとのインタビューで語った。同氏によると、DeepSeekのトップ研究者のほとんどは中国の一流大学を卒業したばかりの学生だという。

中国テクノロジー業界のリーダーであるアリババ、百度、テンセントなどは、AI事業におけるハードウエアと顧客の獲得競争に多額の資金とリソースを投入している。DeepSeekはオープンソースのアプローチで際立っている。

DeepSeekの成功により、オープンAI社などは、確立された優位性を維持するために価格を引き下げざるを得なくなるかもしれない。また、より効率的なモデルがはるかに少ない支出で開発できるのであれば、メタやマイクロソフトなどの企業による巨額の支出にも疑問が投げかけられる。

AIサービスへの需要の高まりから恩恵を受けてきたエヌビディアなどの株が売られ、27日には世界の株式市場が混乱した一方、DeepSeekと関連のある中国企業の株価は上昇した。

既に世界中の開発者がDeepSeekのソフトウエアを試用し、それを用いたツールの構築を検討している。これにより、高度なAI推論モデルの採用が加速する可能性がある。

他の中国製AIモデルと同様に、DeepSeekは中国でセンシティブと見なされるトピックについては自主検閲を行っている。

DeepSeekのクラウドインフラは、突然の人気によって試されることになるだろう。同社は27日、一時的に大規模なサービス停止を経験した。新規ユーザーや復帰したユーザーがチャットボットにさらに多くの問いを投げ掛けることで、同社はさらに多くのトラフィックを管理しなければならなくなる。


エヌビディアの株価が1日で約17%下がったので、DeepSeekについて詳しい記事を紹介しました。パソコンのCPUがそうなってインテルがヤバくなったように、高性能の生成AIを作るために高速のGPUが必要とされ、次々と開発される時代が終わったということでしょうか?

さっそく、スマホにDeepSeekをダウンロードして使ってみました。アプリサイズもChatGPT系よりも圧倒的に小さく、なかなか使い良さそうです。

コメント

タイトルとURLをコピーしました