[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

このページの本文へ

ChatGPT超えの中国AI「DeepSeek-R1」の衝撃

2025年01月27日 20時00分更新

文● 田口和裕

 中国のAIスタートアップ「DeepSeek」は2025年1月20日、数学的推論やコーディング能力でOpenAIの最新モデル「o1」と同等性能を持つ大規模言語モデル「DeepSeek-R1」を公開した。

 使用・複製・改変・再配布を自由に許可する寛容なMITライセンス下でのオープンソース提供および従来比95〜97%のコスト減となるAPI価格が特徴で、AI業界に激震が起きている。

強化学習を重視、コールドスタート問題にも対応

実際の推論過程を見ることができる

 論文によると、DeepSeek-R1の特筆すべき点は、強化学習(RL:Reinforcement Learning)を駆使し、従来の教師あり学習(SFT:Supervised Fine-Tuning)に頼らず、自律的に思考連鎖(CoT:Chain-of-Thought)を学習する点だ。このアプローチにより、モデルは複雑な問題を解決するための思考の連鎖を探索し、自己検証や振り返り、長い思考の連鎖の生成などの能力を実証しているという。

 また、AIが新しい状況やデータに直面したとき、過去の情報がないために適切な判断が難しくなる「コールドスタート問題」を解決するため、AIの学習段階で、あらかじめ新しい状況に関するデータを組み込むことで、AIが初めての状況でも適切に対応できるようにしており、AIの判断や推論の過程がユーザーにとっても理解しやすくなっている。

OpenAIのo1に匹敵

 DeepSeek-R1は、さまざまなベンチマークテストで非常に高いパフォーマンスを発揮している。

 たとえば、高度な数学の問題を扱う「AIME 2024」では79.8%、さらに、より専門的な数学問題を扱う「MATH-500」では97.3%、ソフトウェア工学関連の「SWE-bench Verified」では49.2%と多くのベンチマークでOpenAIのo1モデルを上回る数値を出している。

 また、プログラミングスキルを評価する「Codeforces」では96.3%、一般知識を問う「MMLU」では90.8%とほぼ同等、多段階推論を必要とする「GPQA Diamond」のみ71.5%(o1は75.7%)と下回っているが、総じて多様なタスクにおいてo1モデルに匹敵する汎用性と性能の高さを持っていると言える。

 

豊富な利用方法

Webインターフェイス

 現在、DeepSeek-R1は個人ユーザー向けに公式ウェブサイト上で無料のWebインターフェースを提供しており、アカウント登録後一定回数まで無料で利用可能になっている。

 また、iOSおよびAndroid向けのスマートフォンアプリも無料でダウンロードでき、利用制限があるものの、基本的な機能を試すことができる。

Android版

APIも激安

 一方、開発者や企業向けにはAPIが提供されており、入力トークン数と出力トークン数に基づく従量課金制となっている。

 入力トークンの料金は、キャッシュヒット(必要なデータがキャッシュ内に存在する状態)時には100万トークンあたり0.14ドル、キャッシュミス(必要なデータがキャッシュ内に存在しない状態)時には100万トークンあたり0.55ドル。

 一方、出力トークンの料金は、100万トークンあたり2.19ドルとなっている。OpenAIのo1モデルと比較して大幅に低い価格設定で、AIモデルの利用コストを大きく削減することになる。

OpenAI o1との価格比較

蒸留モデルも提供

 また、主力モデルであるDeepSeek-R1から知識を抽出し、より小型化した6つの蒸留モデル(パラメータが1.5B、7B、8B、14B、32B、70B)も公開しており、特に32Bおよび70Bのモデルは、OpenAIのo1-miniと同等の性能を持つとされている。

オープンソースの衝撃

 以上のようにDeepSeek-R1は、AI業界全体に大きな衝撃を与えている。特に注目すべきは、同モデルがMITライセンスの下でオープンソースとして提供されている点だ。商用利用などが自由にできるため、従来のビッグテック企業のビジネスモデルを根本から揺るがす可能性がある。

 従来、AIモデルの多くはオープンソースでは公開されず、高額なAPI利用料金が設定されていた。一方で、DeepSeek-R1は高性能でありながら、API利用料金が競合と比べて非常に低コストで提供されている。また、従来よりも少ない計算資源(GPUパワー)でも動作する複数の蒸留モデルも提供されている。これにより、計算資源の制約から高性能なAIモデルの開発や利用が難しかった研究者や開発者にも新たなチャンスが生まれると期待されている。

 さらに、MITライセンスの下でモデルの重み付き基盤モデルが公開されていることは、AIコミュニティ全体にとって大きなインパクトを持つ。

 メタのチーフAIサイエンティストヤン・ルカン氏も、「中国が米国をAIで凌駕しているのではなく、オープンソースモデルがプロプライエタリモデル(独自モデル:ソースコードが公開されず、使用や改変に制約がある)を凌駕しているのです(出典:BUSINESS INSIDER)」と指摘している。

 ただし、中国製のオープンソースモデルの普及にはリスクも伴うのは事実。一部の専門家は、国家の影響や情報セキュリティの観点から慎重な検討が必要だと指摘している。

 総じて、DeepSeek-R1の登場は、AI業界における競争と革新の新たな局面を象徴しており、今後の動向から目が離せない。

※追記:誤解を避けるため、一部の表現を変更しました。(1月28日11時42分)

カテゴリートップへ

ピックアップ