本日、新シリーズモデル「DeepSeek-V4」のプレビュー版が正式にリリースされ、同時にオープンソース化されました。

DeepSeek-V4 は 100 万トークンという超長文脈を処理可能であり、エージェント能力、世界知識、推論性能のすべてにおいて、中国国内およびオープンソースの分野でトップクラスの実績を達成しました。モデルはサイズに応じて 2 つのバージョンに分類されます。

本日より、公式サイト chat.deepseek.com または公式アプリにログインするだけで、最新の DeepSeek-V4 と対話し、100 万トークンの超長文脈記憶という新たな体験を探求できます。API サービスも同時に更新されており、model_name を「deepseek-v4-pro」または「deepseek-v4-flash」に変更するだけで调用可能です。

DeepSeek-V4-Pro：トップクラスのクローズドソースモデルに匹敵する性能

エージェント能力の飛躍的向上： 前世代モデルと比較し、DeepSeek-V4-Pro のエージェント能力は顕著に強化されました。Agentic Coding の評価において、V4-Pro は現在のオープンソースモデルの中で最高水準に達しており、その他のエージェント関連評価でも優れた成果を収めています。現在、DeepSeek-V4 は社内で活用される Agentic Coding モデルとなっており、評価フィードバックによると、その使用感は Sonnet 4.5 を上回り、提供品質は Opus 4.6 の非思考モードに肉薄していますが、Opus 4.6 の思考モードとは依然として一定の差があります。
豊富な世界知識： 世界知識の評価測定において、DeepSeek-V4-Pro は他のあらゆるオープンソースモデルを大きく凌駕し、トップクラスのクローズドソースモデルである Gemini-Pro-3.1 にわずかに劣るのみです。
世界トップクラスの推論性能： 数学、STEM（科学・技術・工学・数学）、競技プログラミングの評価において、DeepSeek-V4-Pro は現在までに公開評価されたすべてのオープンソースモデルを凌駕し、世界最高峰のクローズドソースモデルに匹敵する優秀な成績を収めました。

DeepSeek-V4-Flash：より迅速で効率的な経済的選択肢

DeepSeek-V4-Pro と比較し、DeepSeek-V4-Flash は世界知識の蓄積量においてやや劣りますが、推論能力においては同等のパフォーマンスを発揮します。モデルパラメータとアクティベーションが小さく抑えられているため、V4-Flash はより迅速かつ経済的な API サービスを提供可能です。
エージェント評価において、DeepSeek-V4-Flash は単純なタスクでは DeepSeek-V4-Pro と互角ですが、高難易度のタスクでは依然として差が見られます。

構造の革新と超高効率な長文脈処理

DeepSeek-V4 は、トークン次元での圧縮を実現する新たなアテンションメカニズムを創出しました。DSA 疎アテンション（DeepSeek Sparse Attention）と組み合わせることで、世界をリードする長文脈処理能力を実現し、かつ従来の手法と比較して計算リソースと GPU メモリ需要を大幅に削減しました。今より、100 万（1M）トークンの文脈長さは、DeepSeek 公式サービスの標準仕様となります。

DeepSeek-V4 と DeepSeek-V3.2 における、文脈長さに伴う計算量と GPU メモリ容量の変化

エージェント能力に特化した最適化

DeepSeek-V4 は、Claude Code、OpenClaw、OpenCode、CodeBuddy などの主要なエージェント製品向けに適応・最適化が行われており、コード作成タスクやドキュメント生成タスクなどで性能が向上しています。下図は、V4-Pro があるエージェントフレームワーク下で生成した PPT のページ例です。

上下にスライドするか、クリックして拡大してご覧ください

API アクセスについて

現在、DeepSeek API では V4-Pro および V4-Flash が同時に利用可能となっており、OpenAI ChatCompletions インターフェースと Anthropic インターフェースの両方をサポートしています。新モデルを利用する際、base_url は変更不要ですが、model パラメータを「deepseek-v4-pro」または「deepseek-v4-flash」に変更する必要があります。

V4-Pro と V4-Flash の最大文脈長さはともに 100 万トークン（1M）で、非思考モードと思考モードの両方をサポートしています。思考モードでは、思考の強度を設定する reasoning_effort パラメータ（high/max）が利用可能です。複雑なエージェントシナリオでは思考モードの使用を推奨し、強度は max に設定してください。モデルの呼び出し方やパラメータ調整方法については、以下の API ドキュメントをご参照ください。

https://api-docs.deepseek.com/zh-cn/guides/thinking_mode

重要なお知らせ：既存の API インターフェースにある 2 つのモデル名「deepseek-chat」と「deepseek-reasoner」は、3 ヶ月後（2026 年 7 月 24 日）に使用停止となります。現段階では、これら 2 つのモデル名はそれぞれdeepseek-v4-flash の非思考モードおよび思考モードを指すようになっています。