本日、我々は最初のハイブリッド線形アーキテクチャの trillion パラメータ思考モデル Ring-2.5-1T をリリースし、オープンソース化しました。
汎用エージェント時代への重要なステップとして、我々はハイブリッド線形アテンションアーキテクチャをプリトレーニングと強化学習の両方で大規模に拡張しました。一方で、効率的な 1:7 MLA + Lightning Linear Attention アーキテクチャを活用してモデルの思考効率と探索空間を向上させ、他方で強化学習とエージェント環境のスケールを拡張することでモデルの思考深度と長期実行能力を向上させました。
以前にリリースした Ring-1T と比較して、Ring-2.5-1T は生成効率、思考深度、長期実行において大幅に向上しています:
効率的な生成:線形アテンション機構の高い割合により、32K を超える生成長度においてメモリアクセススケールを 10 倍以上削減し、生成スループットを 3 倍以上向上させ、深度思考と長期実行を必要とするタスクに特に適しています。
深い思考:RLVR ベースで dense reward を導入し、思考プロセスの厳密性をフィードバックすることで、Ring-2.5-1T が IMO 2025 と CMO 2025 でメダルレベルを同時に達成しました(自己テスト)。
長期実行:大規模な fully-async agentic RL トレーニングにより、複雑なタスクの長期自律実行能力を大幅に向上させ、Ring-2.5-1T が Claude Code などのエージェントプログラミングフレームワークや OpenClaw パーソナル AI アシスタントに容易に適応できるようにしました。
深い思考と長期実行
Ring-2.5-1T の深い思考と長期実行能力を評価するために、代表性的なオープンソース思考モデル(DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking)とクローズドソース API(GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking)を参考として選択しました。Ring-2.5-1T は、数学、コード、ロジックなどの高難易度推論タスク(IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench、ARC-AGI-V2)と、エージェント検索、ソフトウェアエンジニアリング、ツール呼び出しなどの長期タスク実行(Gaia2-search、Tau2-bench、SWE-Bench Verified)の両方でオープンソースリードレベルを達成しました。
また、重い思考モード(heavy thinking mode)をテストし、推論中に並列思考とサマリを拡張することでテスト時スケーリングを実現し、推論の深度と广度を効果的に向上させました。
IMO 2025(満点 42 点)では、Ring-2.5-1T は 35 点を獲得し、メダルレベルに到達しました。CMO 2025(満点 126 点)では 105 点を取得し、メダルライン(78 点)および国家集训隊選考ライン(87 点)を大幅に上回りました。Ring-2.5-1T と Ring-1T の回答結果を比較すると、前者は推論ロジックの厳密性、高度な数学証明テクニックの使用、および回答表述の完全性において明確な向上が見られました。我々は現在、Ring-2.5-1T の IMO 2025 と CMO 2025 の詳細な解答を公開しています。完全なコンテンツは以下のリンクから確認できます:https://github.com/inclusionAI/Ring-V2.5/tree/main/examples
さらに、挑戦的なエージェント検索 GAIA2-search タスクでは、Ring-2.5-1T はオープンソース SOTA レベルを達成しました。GAIA2 環境はクロスアプリケーションツール協調と複雑なタスク実行能力を強調し、Ring-2.5-1T はプラン生成とマルチステップツール呼び出しの効率と正確性の両方で優れた性能を示しました。
trillion スケールのハイブリッド線形アテンションアーキテクチャ
汎用エージェント時代において、深い思考(deep thinking)と長期実行(long-horizon agent)は言語基盤の基本ワークパラダイムとなりつつあります。この転換は、基盤モデルに長期推論デコーディング効率におけるアーキテクチャ能力の極めて高い要求を課します。エージェントモデル(agentic model)アーキテクチャへの重要なステップとして、Ling 2.5 アーキテクチャは Ling 2.0 アーキテクチャベースにハイブリッド線形アテンションアーキテクチャを導入しました。インクリメンタルトレーニングを通じて、Ling 2.0 アーキテクチャの GQA を1:7 の MLA + Lightning Linear構造にアップグレードしました。具体的には、以前にリリースした Ring-flash-linear-2.0 技術ルートに基づき、一部の GQA レイヤーを Lightning Linear Attention に変換し、長期推論シナリオにおけるスループットを大幅に向上させました。さらに KV Cache を圧縮するために、残りの GQA レイヤーを MLA に概変変換し、QK Norm や Partial RoPE などの特性に対する適応を実施して、Ling 2.5 アーキテクチャのハイブリッドアテンションアーキテクチャ下での表达能力を強化しました。
1T スケール下的 Ling 2.5 アーキテクチャ
改造後、Ring-2.5-1T のアクティブ化パラメータ数は 51B から 63B に増加しました。しかし、ハイブリッド線形アテンションアーキテクチャのサポートにより、その推論効率は Ling 2.0 と比較して大幅に向上しました。アクティブパラメータがわずか 32B の KIMI K2 アーキテクチャと比較しても、1T スケール下的な Ling 2.5 アーキテクチャは長期推論シナリオにおいてスループットで有意な優位性を持ち、生成长度が長いほど、スループット優位性がより顕著です。
単一マシン 8 カード H20-3e、batch size = 64、異なる生成长度下的デコードスループット(decode throughput)比較
単一マシン 8 カード H200、batch size = 64、異なる生成长度下的デコードスループット(decode throughput)比較
ハンドクラフティッドケース
我々は Ring-2.5-1T を Claude Code に統合しました。その長期ソフトウェア開発能力をテストするために、以下のプロンプトで微型オペレーティングシステム(TinyOS)を自動開発するように促しました。
1. システムブートプロセス:
- GRUB をブートローダーとして使用し、Multiboot 標準に従う
- boot.asm アセンブリファイルを記述し、基本的な CPU モード(32 ビット保護モード)を設定
- アセンブリから main.c の kernel_main 関数にジャンプ
2. コア機能実装:
- スクリーン出力:簡単な文字表示機能(例:クリアスクリーン、文字列印刷)を実装
- 割り込み処理:基本的な GDT と IDT を設定し、キーボード入力割り込みを処理
- メモリ管理:最も基本的なメモリページング初期化を実装
- キーボードサポート:キーボード入力を受信し、スクリーンにエコー可能
3. コード構造:
- 完全な linker.ld リンクスクリプトを提供
- コンパイルと ISO イメージ生成のための Makefile を提供
- 各キー関数に明確なコメントを付ける
4. コード要件:
- コードが簡潔でモジュラーであることを保証し、不要な複雑性を避ける
- 動作する最小機能セットの実装を優先
- 将来の拡張のためにインターフェースを予約
まず、完全なコードファイルリストと簡単な説明を出力し、次に各ファイルの完全なコードを提供してください。
生成されたすべてのコードは直接コンパイルして実行可能であり、具体的なコンパイルおよびテスト方法を提供する必要があります。
qemu を使用してこのオペレーティングシステムを実際に実行できることを保証する必要があります。
Ring-2.5-1T は Claude Code で 2 時間 8 分実行され、最終的に上記タスクを完了しました。詳細な記録は以下の動画にあります:
我々は Ring-2.5-1T に TinyOS の機能を豊かにするよう促しました。入力したプロンプトは以下の通りです:
よし、今後開発を続け、bash の機能を実装して、qemu を使用して bash コマンドインターフェースにログインし、ls、pwd、cat などの簡単なコマンドを実行できるようにしてください。
最終的に開発された TinyOS は以下の動画に示されています:
我々はまた、Ring-2.5-1T をパーソナル AI アシスタント OpenClaw に統合し、AI infra 文献の読影を支援し、Java コードで技術ロジックを提示しました。
限界と将来計画
このバージョンのモデルは、トークン効率と指示遵从においてstill不足しており、より現実的で複雑なタスクの長期実行と実際の配信能力には大幅な最適化の余地があります。今後のバージョンでこれらの能力を継続的に改善し、コミュニティからの使用フィードバックと提案を大いに期待しています。現在、Ring-2.5-1T のトレーニングはまだ进行中です。完全な技術レポートは次のバージョンリリース後に正式に公開されます。
さらに、上記の GAIA2 ベンチマーク評価は、コミュニティで広く採用されている OpenAI function call 形式を使用しており、元の ReAct 形式ではありません。関連する評価設定と方案は、GAIA2 の GitHub リポジトリに提出され、コミュニティによるより広範で再現可能な比較と評価のために提供されます。
皆様のご利用をお待ちしております。オープンソースリポジトリと体験ページをご訪問いただき、ダウンロードおよび使用してください
🤗 Hugging Face: https://huggingface.co/inclusionAI/Ring-2.5-1T
🤖 ModelScope: https://modelscope.cn/models/inclusionAI/Ring-2.5-1T
Ling Studio(https://ling.tbox.cn/chat)およびZenMux(https://zenmux.ai/)の Ring-2.5-1T Chat 体験ページおよび API サービスは近日公開予定です。
【原文を読む】をクリックして、Ring-2.5-1T の Hugging Face アドレスにアクセスしてください。