Xiaomi MiMo-V2.5 シリーズ大規模モデルがパブリックベータを正式開始

Xiaomi MiMo-V2.5 ロゴイメージ

本日、Xiaomi MiMo-V2.5 シリーズモデルのパブリックベータテストが正式に開始されました。

MiMo-V2.5 シリーズには、MiMo-V2.5、V2.5-Pro、V2.5-TTS シリーズ、V2.5-ASR が含まれます。

より強力な推論能力、さらに安定したエージェント機能、より長いコンテキストウィンドウ、高度な指示従順性と曖昧な指示の理解力、そして向上したマルチモーダル知覚・理解能力――これは「使える」から「使いやすい」への飛躍的な進化を意味します。

同時に、Token Plan の価格設定も最適化し、世界最高峰のモデルを誰もが手の届く場所に提供することを目指します。

MiMo-V2.5-Pro:より強力なエージェント、より長い集中力

MiMo-V2.5-Pro は、これまでに当社が構築した中で最も強力なモデルです。汎用エージェント機能複雑なソフトウェアエンジニアリング長期的タスクなどの次元において、Claude Opus 4.6 や GPT-5.4 といった世界のトップクラスのエージェントモデルと互角に渡り合え、前世代の MiMo-V2-Pro から全体的に大幅な向上を遂げています。

社内テストでは、MiMo-V2.5-Pro の知能レベルは人間とモデルの協働のあり方を再考させるほどのものでした。適切な実行フレームワークと組み合わせることで、1 回のタスクでほぼ 1,000 回ものツール呼び出しを伴う長期的な作業も安定して完遂可能です。エージェントシナリオにおける指示従順性も顕著に向上し、コンテキスト中の暗黙の要件を正確に捉えつつ、超長期的なスパンでも論理的一貫性を保ち続けます。これにより、MiMo-V2.5-Pro は、より高い信頼性をもって真に重大な専門業務を担えるようになりました。

MiMo-V2.5-Pro のパフォーマンス比較チャート

より複雑なタスクのために設計

MiMo-V2.5-Pro は、より難易度が高く、より複雑なタスク目標のために生み出されました。人間なら専門家でも数日、場合によっては数週間を要するようなタスクを任せ、長期的なプロセスを自律的に完走させつつ、極めて高い品質を維持することが可能です。以下にその成果を示します。

  • Rust による完全な SysY コンパイラの実装

このタスクは北京大学の「コンパイラ原理」コースのプロジェクトに由来し、モデルに対し Rust を用いてゼロから完全な SysY コンパイラ(字句解析、構文解析、AST 生成、Koopa IR コード生成、RISC-V アセンブリバックエンド、パフォーマンス最適化を含む)を実装するよう求めるものです。参考までに、北京大学の学部生がこのプロジェクトを完了するには通常「数週間」を要しますが、MiMo-V2.5-Pro はわずか「4.3 時間」、672 回のツール呼び出しですべての作業を完遂し、隠蔽テストセットで233/233 の満点を記録。極めて高い生産性価値を実証しました。

SysY コンパイラ実装のスコア詳細

モデルは無駄な試行錯誤を繰り返すのではなく、コンパイラ全体を段階的に構築しました。まず完全なパイプラインの骨格を組み、その後各層を攻略。Koopa IR は満点(110/110)、RISC-V バックエンドも満点(103/103)、パフォーマンス最適化も満点(20/20)を達成しました。初回コンパイルで137/233を通過。これは全テスト実行前の時点で、すでにアーキテクチャが正しかったことを意味します。512 ラウンド目で、あるリファクタリングにより lv9/riscv の 2 テストポイントが後退しましたが、モデルは自ら診断・回復し、進行を継続しました。

長期的タスクにおいて報われるのは、まさにこのような構造化され、自己修正可能な作業規律なのです。

  • ビデオエディタの開発

「ビデオエディタの Web アプリを構築せよ」という短い指示のみで、MiMo-V2.5-Pro はマルチトラックタイムライン、クリップトリミング、クロスフェード、オーディオミキシング、エクスポートフローなどの機能を備えた動作可能な Web アプリを提供しました。最終的に生成されたコード量は 8,192 行、1,868 回のツール呼び出しを経て、11.5 時間の自律作業で完成しました。

若影片無法播放,請改看 來源頁

Xiaomi MiMo-V2.5 シリーズ大規模モデルがパブリックベータを正式開始

MiMo-V2.5:クラスを超えたフルモーダル・エージェント、100 万トークンのコンテキスト

MiMo-V2.5 は、エージェントシナリオのために設計されたネイティブ・フルモーダル大規模モデルであり、視覚・聴覚・読解を同時に行い、理解を実行に移すことができます。

今回の MiMo-V2.5 における主要なアップグレードは以下の通りです。

エージェント機能が MiMo-V2-Pro を完全に凌駕

Claw-Eval などの権威あるエージェント評価ベンチマークにおいて、MiMo-V2.5 は MiMo-V2-Pro の水準を超越。日常的な単純タスクもこなせる一方、API コストは約 50% 削減されました。

マルチモーダル知覚が MiMo-V2-Omni を完全に凌駕

クロスモーダル推論、動画理解、チャート分析などの能力が向上。VideoMME、CharXiv、MMMU-Pro などの評価において、業界トップクラスのクローズドソースモデルに迫るか、それを上回る性能を発揮しています。

MiMo-V2.5 のマルチモーダル機能比較

MiMo-V2.5 シリーズ全体:トークン効率の向上

MiMo-V2.5 シリーズ全体でトークン効率が最適化され、より少ないトークンでより多くの処理が可能になりました。

同じエージェント基準ベンチマーク(ClawEval)のスコアを達成した場合:

  • MiMo-V2.5-Pro は Kimi K2.6 と比較して 42% のトークンを節約

  • MiMo-V2.5 は Muse Spark と比較して 50% のトークンを節約

トークン効率比較グラフ

MiMo-V2.5 シリーズ:使い分けのガイド

  • MiMo-V2.5-Pro は長期的かつ困難なエージェントタスク向け。MiMo-V2.5 はほとんどの汎用エージェントシナリオをカバー

  • MiMo-V2.5 は画像・音声・動画を網羅するネイティブ・フルモーダル・エージェント機能を搭載

  • MiMo-V2.5 は平均推論速度が高速で、レイテンシに敏感なタスクにも迅速に対応可能

MiMo-V2.5 シリーズの使い分けチャート

Token Plan の刷新とアップグレード

Token Plan において、ユーザーの皆様に役立つ実質的な最適化を複数実施しました。

Credits 消費レートの更新、さらにお得に

  • MiMo-V2.5:1x(1 トークン消費 = 1 クレジット)

  • MiMo-V2.5-Pro:2x(1 トークン消費 = 2 クレジット)

1 トークン = 4 クレジットという課金方式を廃止。これより、Token Plan において 256k および 1M のコンテキストウィンドウによるクレジット倍率の区別はなくなります。

夜間限定割引レート

北京時間 00:00〜08:00 の間、全モデルのクレジット消費レートが既存レートからさらに 2 割引となります。

自動更新で割引特典

新たに「連続月額サブスクリプション」モードを追加。既存ユーザーは自動更新を有効にすると翌月分が 30% オフ、新規ユーザーは翌月分が 23% オフ(いずれも 1 回限り)。

さらに「年間サブスクリプション」も新設。1 回の契約で年間 12% オフ(初回購入特典や自動更新特典との併用不可)。

ローンチ特典:Token Plan ユーザーのクレジット全量リセット

Token Plan をご購入済みの方(北京時間 4 月 22 日 22:00 まで)のクレジット枠はすべてリセット・ゼロから再計算されます。

Xiaomi MiMo と共に、ゼロから創造力を解放しましょう!

注:今回のローンチ特典はクレジット枠のみのリセットであり、サブスクリプションの有効期間は変更されません。

Token Plan 価格改定イメージ

まもなくオープンソース化

MiMo-V2.5-Pro および MiMo-V2.5 モデルは、間もなくグローバルにオープンソース化される予定です。ご期待ください。

公式 API 連携
Xiaomi MiMo オープンプラットフォーム:https://platform.xiaomimimo.com
Token Plan サブスクリプション:https://platform.xiaomimimo.com/#/token-plan
製品体験
Xiaomi MiMo Studio:https://aistudio.xiaomimimo.com/#/c
オープンソース化予定のお知らせ
関連記事

分享網址
AINews·AI 新聞聚合平台
© 2026 AINews. All rights reserved.