最新の記事
すべての記事

日本語

カテゴリー：大規模言語モデル

大規模モデル強化学習の新たなブレイクスルー — SPO新パラダイムが大モデルの推論能力向上を支援！
AIヘッドライン：OpenAI Codexがインターネットアクセスを追加、Mistralがコーディングアシスタントをリリース
SFT+RL二段階学習でLLMの自己教師あり学習を突破！人民大学DeepCriticがAI批評の自律進化を実現
ZeroSearchに続き、通義の最新作MaskSearchが推論検索事前学習の新しいフレームワークを提案
大変だ！Appleが証明：DeepSeek、o3、Claudeなどの「推論」モデルには推論能力が全くない
世界のトップ数学者30名がAIを秘密裏に包囲し、その場で打ち破られる！「数学の天才に近い」と驚嘆
世界のトップ数学者が、AIの職務遂行能力に驚愕
初のマルチモーダル専用スローシンキングフレームワーク！GPT-o1を7ポイント近く上回り、強化学習がVLMに「熟考」を促す
サム・アルトマン：CodexでAGIを感じた！最新の対談で次世代の「完璧なモデル」を珍しく示唆、エージェントが来年限界を突破すると大胆予測！
10行のコードでAIME24/25が15%向上！大規模モデル強化学習におけるエントロピーメカニズムの解明
AIも「損得勘定」ができるように？DecisionFlowで大規模言語モデルが高リスクな意思決定をより深く理解！
モデルが賢くなればなるほど「言うことを聞かなくなる」？MathIFベンチマークがAIの服従性における脆弱性を明らかに
初のゲノム推論AIが登場！精度97%に急上昇、ゲノム研究を根本的に変革
プロセス監視＞結果監視！華為港城がRAG推論トレーニングを再構築、5kサンプルで90kモデルの性能を凌駕
RL推論の進捗整理
OPA-DPO：マルチモーダル大規模モデルにおける幻覚問題の効率的な解決策
AIが「自信」のみで推論を学習、浙江大学出身者がDeepSeekの長思考連鎖の出現を再現、強化学習は外部報酬信号を必要としない
マイクロソフトらが新パラダイム「モデルチェーン」を提案、Transformerと同等の性能で拡張性と柔軟性が向上
LSTMの父が22年前に構想したアイデアは実現するのか？AI「自己進化」に関する論文が1週間で集中公開、新たなトレンドが台頭？
AIの数学能力が100%急増、自己進化が強化学習の限界に迫る！CMUの新作が認識を覆す
【深層学習】Mamba主要著者の新作：DeepSeek採用のアテンションメカニズムを置き換え、推論専用に設計
LLMがどのように推論し自己反省するかを初解説！ノースウェスタン大学とGoogleの新フレームワーク：ベイズ適応型強化学習を導入し、数学的推論能力を大幅に向上
AIは「自らの過ち」を認めるのか？マルチエージェント協調の「羅生門」を解き明かし、ICML 2025 Spotlightを獲得
スタンフォードの中国人チームがまさかの番狂わせ！AIが純粋なCUDA-Cでカーネルを記述し、PyTorchを凌駕？
大規模モデルは数独が苦手？！Transformer開発者のスタートアップがランキング発表：o3 Mini Highの「変種数独」正答率はわずか2.9%

←
1
2
3
4
5
6
7
8
9
10
11
12
13
→

AINews·AI 新聞聚合平台

© 2026 AINews. All rights reserved.