DeepSeekのインパクト
- tokuhata
- 2月1日
- 読了時間: 3分

話題のDeepSeekについて注目すべき点をまとめました。DeepSeekは米企業のモデルよりはるかに低コストで、より少ないデータを使用するとされています。他のモデルとの特徴比較、なぜ安くできたか、を整理します。
1.DeepSeekの特徴
DeepSeek自身の発表によれば、ChatGPT, Gemini, Llama などのAIと比較して十分の一以下のコストで同等のAIを開発したと主張しています。DeepSeekとChatGPTの違いをDeepSeek自身に聞いてみました。かなり率直な回答でそのまま使えそうですので以下に回答のコピーを示します。
*** DeepSeek回答ここから ***
ChatGPTとDeepseekの主な特徴比較は以下の通りです:
開発元:
ChatGPT: OpenAIが開発。
Deepseek: 中国の深度求索(DeepSeek)公司が開発。
言語モデル:
ChatGPT: GPT-3.5やGPT-4を基にし、大規模なデータで訓練。
Deepseek: 独自のモデルを使用し、中国市場向けに最適化。
対応言語:
ChatGPT: 多言語対応、特に英語に強い。
Deepseek: 中国語に特化し、ローカルコンテキストに精通。
応用分野:
ChatGPT: 汎用AI、カスタマーサポート、コンテンツ生成など。
Deepseek: 中国市場向けのビジネスソリューション、金融、医療など。
データプライバシー:
ChatGPT: 国際的なデータ保護基準に準拠。
Deepseek: 中国のデータ規制に準拠。
カスタマイズ性:
ChatGPT: 高いカスタマイズ性、API提供。
Deepseek: 中国市場向けに特化したカスタマイズ。
ユーザーインターフェース:
ChatGPT: シンプルで直感的なUI。
Deepseek: 中国ユーザー向けにローカライズされたUI。
これらの特徴から、ChatGPTは国際的な汎用AI、Deepseekは中国市場に特化したAIとして区別されます。
*** DeepSeek回答ここまで ***
補足ですが、アカウント登録時、JPドメインのメールアドレスが拒否されたのでgmailで登録しました。日本がお嫌いのようです。利用規約は詳細には読んでいませんが違反すると中国の法律で罰せられるようです。ご注意ください。中国市場向けに最適化、と言っていますが逆説的に解釈するのがよさそうです。中国に関するきわどい質問をしたら急に機嫌が悪くなり、server busyしか返ってこなくなりました。
一言でいえば「中国にとって都合の悪いことは一切出力しないAI」ということになりそうです。その点を除けばChatGPTとそん色ないというのが第一印象です。
2.なぜ安くできたか
DeepSeekが開発費を抑えるために適用したと思われる技術を以下に示します。各技術の詳細については専門的なサイトがあるので省略しここでは要点のみ列挙します。
(1) Moe: Mixture of Experts:MoEは、複数の「専門家(expert)モデル」と、入力プロンプトなどを基に各モデルへ仕事を割り振るルーティング機構からなる。学習・推論時に特定の専門家モデルのみを稼働させ、他の大部分の箇所は稼働させないことで、学習・演算に要する計算コストを大幅に削減できる。
(2) Distillation 学習データの蒸留:大規模かつ高度なAIモデルが出力した結果を使って、より小型のモデルを訓練・改善する技術。高度なAIモデル(教師モデル)の出力を使って、より小型のモデル(生徒モデル)を訓練する。生徒モデルがより少ない計算資源で教師モデルに近い性能を獲得することができる。
(3)Quantization データの量子化:データの精度を落とすことでそのサイズを小さくする技術。量子化により、メモリ使用量が削減、計算速度が向上、消費電力を削減、等により効率的な計算を可能になる。ただし、量子化は精度の低下を招くため、適切なバランスが求められる。
3.市場に受け入れられるか
オープンAIは自社の技術が不当に利用されたとして調査を開始しました。前述の「蒸留」が違法かどうかは微妙ですが専門家はDeepSeekがChatGPTやLlamaを流用したとみているようです。利用料金は既存の生成AIの10分の一以下なので中国向けのバイアスがかかっている点を考慮しながら使えば格安で利用可能です。一方、米英情報機関を中心に世界各国でその“正体”について調査が続いている状況なので今後の展開が注目されます。
参考サイト:
Comments