Gemini 3.5 Proが世界初公開、コーディング性能はGPT-5.5に匹敵！グーグルがついに本気を出した

新智元報道

編集：好困

【新智元特集】Gemini 3.5、コードネーム「カプチーノ」が事前リーク。バージョン番号は3.2から一気に飛び級！新たな24時間対応エージェント「Spark」は、メール管理やタスク実行を代行し、あなたに断りなく買い物や支払いを行う可能性も。

つい先ほど、Gemini 3.5の情報が事前に流出しました！

ユーザーLentils氏が最新情報を公開し、コードネーム「Cappuccino」ことGemini 3.5 Proのチェックポイントが既に生成されていることを明らかにしました。

スワイプして表示

ほんの数時間前まではGemini 3.2と噂されていましたが、まさかのGemini 3.5に差し替えられました。

3.2から3.5への飛び級のネーミングは、グーグルが来たるI/Oで、より大きなストーリーを語ろうとしていることは明らかです。

Gemini大幅アップデート、グーグルが必殺技を投入

前日、著名リーカーのcan氏が最初の出力結果を公開しました。

1つはDualShock 4コントローラーのインタラクティブな分解図、もう1つはペリカンが自転車に乗るベクターイラストで、フレームカラー、ライティング、ヘッドアクセサリー、バスケットの中身、ペダリング速度をリアルタイムに切り替えられる7次元のカスタマイズパネルが付属しています。

スクリーンショットから判断すると、これはもはや単純なSVGではなく、プロンプトで生成された完全なインタラクティブWebアプリケーションです！

Abacus.AIのCEO、Bindu Reddy氏がその後公開したデータはさらに衝撃的でした。

3.2 Flashはコーディングと推論においてGPT-5.5の92%の性能に達しながら、コストは15倍から20倍も安いとのことです。

それだけでなく、グーグルの新型常時稼働エージェント「Gemini Spark」も発掘されました。

ご覧の通り、24時間待機してメール管理やタスク実行を支援するだけでなく、あなたに尋ねることなく注文を代行する可能性すらあります。

しかし、そんな中、Alex Heath氏の独占スクープが冷水を浴びせることになりました。

新型Geminiの性能は、せいぜいOpenAIのGPT-5.5に追いつくのが精一杯だというのです……

1つのプロンプトで4案、Geminiの「怠け癖」が治った

まずは良いニュースから。

以前のGeminiは、SVG生成においてコミュニティで最もよく使われた批判の言葉は「怠け者」でした。1つのプロンプトに対し、おざなりな結果しか返さなかったのです。

しかし、今回は違います。

ユーザーLentils氏が簡単なプロンプトを1つ入力しただけで、Geminiはスタイルも細部も異なる、4つのロボットSVGを直接生成しました。

スワイプして表示

同時期にリークされた3.5 Flashも、この傾向を裏付けています。

LM Arenaの匿名スコアによると、FlashはSVG生成、インタラクティブな3Dコーディング、アニメーション処理において、既に3.1 Proを上回っていることが示されています。

言い換えれば、グーグルの蒸留とスパース化技術が成果を挙げており、最先端モデルを軽量版に圧縮しても品質の大幅な低下が見られないということです。

メール管理から買い物代行まで、グーグルのエージェントは大胆不敵

同じ日に出たもう一つの大きなリークは「Gemini Spark BETA」です。

リーク情報によると、Sparkの位置付けは「あなたの日常AIエージェント、24時間待機」。文字通り四六時中稼働するAIエージェントで、受信トレイの処理、オンラインタスクの実行、複数ステップのワークフロー管理を支援します。

Sparkのアクセスするデータソースのリストを見て、思わず息を呑みました。

接続済みのGoogleアプリ、スキルモジュール、チャット履歴、スケジュールされたタスク、ログイン中のWebサイト、パーソナルインテリジェンス、位置情報が含まれています。Geminiはタスクを完了するために、あなたの名前、連絡先、ファイル、好みなどの情報を第三者と共有します。さらに、セッションの連続性を維持するため、システムはログイン認証情報やリモートコード実行データを含むリモートブラウザデータを保存します。注目すべきは、Sparkは機密性の高い操作の前に許可を求める設計ですが、「あなたの許可なく情報を共有したり、購入を完了したりする可能性がある」という点です。

つまり、あなたに断りなく注文したり、情報を共有したりする可能性があるということです。

Sparkの前身は、グーグルが内部で「Remy」と呼んでいたエージェントのアップグレード版で、以前はAI Ultraサブスクリプションユーザー限定でした。RemyからSparkへと、Geminiのエージェントは「1つの機能」から一気に「24時間365日のデジタルライフコンシェルジュ」へと昇格したのです。これは、AnthropicがまもなくリリースするマネージドエージェントConwayや、OpenAIが既に開始している24時間365日対応のエージェントプラットフォームに真っ向から対抗するものです。

半年前の王者、半年後には最前線にすら届かず

良いニュースはここまでです。Alex Heath氏が複数の情報源から確認したところによると、来週火曜日にリリースされる新型Geminiは、おおよそGPT-5.5のレベルに位置し、Mythosとはまだ明確な差があるとのことです。

思い起こせば、リリースされたばかりのGemini 3はLMArenaで1501 Eloを記録し、主要なランキングのほぼ全てで首位を獲得しました。あれから半年、GPT-5.5、Opus 4.7、Mythosが相次いでリリースされたことで、勢力図は完全に塗り替えられました。英国AI安全研究所（AISI）の評価によると、Mythosは同研究所の2つのサイバーセキュリティテスト範囲を同時に通過した最初のモデルであり、GPT-5.5は1つしか通過できませんでした。AISIは、評価フレームワークがMythosの能力に追いつけなくなりつつあるとさえ認めています。

グーグルに話を戻すと、ユーザーFandu氏が発掘したモデルセレクターの最新インターフェースによれば、新型GeminiはMCP（Model Context Protocol）によるサードパーティツールのネイティブ接続をサポートし、Thinkingモードも全面的に再構築される可能性が高いです。

よく知られている3.1 Flash-Lite、3 Flash、3.1 Proといったモデルに加えて、「MCP Tool Testing」という見慣れないカテゴリー、つまり「MCPツールテストに利用可能なモデル」が追加されているのが確認できます。

思考モードも、これまでの独立したThinkingモデルから、Standard（ほとんどの問題に適切）とExtended（複雑な問題を解決）の2段階を備えたグローバルスイッチへと変わりました。

コーディング、DeepMindが最も焦る戦場

Heath氏のリークの中で、コーディングに関する部分の表現が最も辛辣でした。彼によると、DeepMind内部は現実的なプレッシャーに直面しており、特にコーディング能力において遅れを取り戻す必要があるとのことです。追いかける目標は明確で、Anthropicです。この1年、Claudeは開発者コミュニティにおいてデフォルトの選択肢として定着しました。新型Geminiにはコーディングの改善が含まれますが、Heath氏の情報源の中で、それが質的な変化をもたらすと考えている人は誰もいませんでした。

グーグルのAIコーディングプラットフォームAntigravityは、社内では多用されていますが、外部市場ではいまだにブレイクスルーを達成できていません。4ヶ月で6%の開発者採用率は、IDEとしては遅くないものの、Claude CodeやCodexの勢いと比較すると、明らかに差があります。

問題はどこにあるのでしょうか？

XDAのある月例レビューでは、3つのツールで同じタスクをテストしました。Claude Codeは複雑で創造的なプロンプトを初回で正確に理解しました。一方、Antigravityの出力は「Microsoft Paint」で描いた落書きのようでした。

スワイプして表示

さらに、Antigravityの価格戦略も開発者を悩ませています。グーグルは無料プレビューからクレジット制度へと、価格モデルを何度も調整しており、コミュニティフォーラムではクレジットの残量が通知なく尽きることへの不満が絶えません。

しかし最も重要なのは、今やAIコーディングは完全に専門家の枠を超えたということです。Claude Coworkであれ、OpenAIのCodexであれ、コードを書けない人でも使いこなせるようになっています。プロダクトマネージャーは自然言語で要件を説明するだけで、動作するプロトタイプを直接入手できます。デザイナーはFigmaのデザインデータを投入するだけで、フロントエンドのコードを取得できます。しかし、今のところ、この議論に参入できているグーグルのプロダクトは1つもありません。

とはいえ、著名な大物Haider氏のコメントは別の視点を提供しています。グーグルは他者と同じトラックを走って勝つつもりはないかもしれず、彼らのより大きな焦点は、より強力なマルチモーダルシステムの構築にあり、それには時間が必要だというのです。

ASIへのフライホイール、三つ巴が同時にアクセルを踏む

モデル自体の性能では追いつけていなくとも、グーグルには10億人規模の配信チャネルと常時稼働エージェントがあります。Sparkが展開されれば、ユーザーのメール、スケジュール、ショッピング、ブラウジングデータがGeminiの次世代トレーニングにフィードバックされるでしょう。これはOpenAIやAnthropicが複製するのが難しい戦略です。

しかし、競合他社も手をこまねいているわけではありません。ちょうど昨日、OpenAIはCodexに超高速モードを追加し、速度を2～3倍に向上させた上、乗り換え補助金合戦を仕掛け、30日以内に切り替えた企業は2ヶ月間無料としました。3時間で2000人の開発者が反応しました。Anthropicも同時にOpus 4.7 Fastモードをリリースし、Claude Codeの利用枠を50%増加させました。この補助金合戦は表面的には開発者の争奪戦ですが、その根底にあるロジックははるかに深いものです。GPT-5.6の開発は、ほぼ間違いなくGPT-5.5の深い関与のもとで行われています。AIが書いたコードがAIのトレーニングにフィードバックされるという循環において、プログラミングツールのユーザーを掌握した者が、この循環の加速装置を掌握するのです。

三つ巴は、それぞれ異なるレーンで同時にアクセルを踏んでいます。OpenAIは反復速度で圧倒し、3週間ごとに新バージョンをリリースします。Anthropicはモデル品質で王者の座を極め、Mythosが最前線を再定義しました。グーグルは配信とエージェントで側面から包囲し、AIを10億人のスマートフォンに送り込みます。誰も減速していません。ASIへのフライホイールは、既に自走を始めています。

そして、これらのツールを日常的に使う私たちにとって、この三つ巴の軍拡競争は、2026年で最もお得な話かもしれません。補助金は増額され、利用枠は拡大され、モデルは進化し、価格は下落しています。

唯一の問題は、あなたのワークフローは正しいレーンに賭けているか、ということです。

参考資料：

https://x.com/alexeheath/status/2054747125616169229

https://www.testingcatalog.com/google-prepares-gemini-spark-ai-agent-ahead-of-i-o-launch/

https://x.com/Lentils80/status/2054628116094501377

Gemini 3.5 Proが世界初公開、コーディング性能はGPT-5.5に匹敵！グーグルがついに本気を出した

関連記事

分享網址

Gemini 3.5 Proが世界初公開、コーディング性能はGPT-5.5に匹敵！ グーグルがついに本気を出した

関連記事

分享網址

Gemini 3.5 Proが世界初公開、コーディング性能はGPT-5.5に匹敵！グーグルがついに本気を出した