カテゴリー: 大規模言語モデル
- モデルはズルが大好き!Cursorが初公開するComposer 2の強化学習の内幕:モデルは「偽の環境」を見抜き、浮動小数点演算の不確実性がRL学習の致命的な落とし穴に
- Claude Codeとロボットを支える共通メカニズムを、UIUC、Meta、スタンフォード大学の最新サーベイが解き明かす
- 仰天……面壁がAIに訓練フレームワークを書かせ、最強の1Bモデル「MiniCPM5-1B」が誕生
- OpenAIのポストトレーニング責任者が語る:AIは突然賢くなったわけではなく、信頼性という「壁」を越えただけ
- 5月20日、国産「新モデル王」Qwen3.7-Maxに出会う!
- AIが初の科学研究競争で人類を打破!Opus 4.7、2930ステップの世界新記録を樹立
- 35Bパラメータで数兆パラメータモデルに匹敵する科学性能、「書生」科学大規模モデルIntern-S2-Previewがオープンソース化
- 神業:7Bの小型モデルがGPT-5を雇い、テストで勝利
- WWW'26 | タスク横断型適応的マルチエージェント協働の新パラダイム
- Thinking Machinesの最新作「Interaction Model」をどう評価すべきか?
- ゼロインデックス、ゼロ埋め込み、純粋なgrep:DCIが生コーパス上で直接ディープリサーチを実行
- ICML 2026|力技を拒絶、PRISMフレームワークがdLLMでも効率的なTest-Time Scalingを実現
- エージェント訓練はなぜ長距離タスクで必ず崩壊するのか
- 生成-フィルター-制御-再生:LLM強化学習におけるロールアウト戦略の包括的レビュー
- 圧縮こそが全て ― フィールズ賞受賞者マイケル・フリードマンから数学とAIへの手紙
- トークンレベルで生成長を精密制御:3BモデルがGPT-5.4やClaudeを撃破
- 10億未満のアクティブパラメータで、数学のスコアがGPT-5ハイエンド版を逆転する小型モデルがオープンソース化
- 近年で最も革新的なAI論文か:推論にリアルタイム字幕を付けると、AIの心理活動が衝撃的だった!
- 核心、Googleジェフ・ディーン:100万チップLLM事前学習のボトルネックが完全に打破された!
- 静的評価はもう「時代遅れ」?OpenKGがLLM知識強化の動的評価ベンチマークDynamic OneEval-202605を継続更新
- AIがついに「自己告白」!Anthropicの最新論文が衝撃、「内省アダプター」でブラックボックスモデルが自ら隠れた行動を暴露
- Agent-World:実世界環境を拡張し、エージェントと環境の共進化を実現!
- Abstract-CoT:推論トークンを11.6倍削減、無語の思考連鎖がLLMの効率限界を突破
- 論文サーベイ | マルチエージェント大規模言語モデルによる知識グラフ自動拡充 (NeurIPS 2025)
- 自己進化型エージェントに関する最新の優れた体系的サーベイ