カテゴリー: 機械学習
- Gemini の中心人物、伝説的エンジニア Jeff Dean 最新インタビュー:未来は一人あたり 50 人の仮想インターン時代、専門家は不要に!
- 苦い教訓!ROLLチームが共有:Agentic RLトレーニングにおける実践経験
- 小米がJudgeRLVRを発表:先に判断してから生成——推論モデルの「長い思考チェーン」の効率パラドックスを打破
- コインを採掘するように活性化関数を採掘?DeepMindが「計算力マイニング場」を構築し、次世代ReLUを総当たり検索
- 強化学習は最適ではない、CMUが最大尤度強化学習を提案
- もう暴力的にClipするな!千問がGatedNormを提案、統一的な視点で残差流の玄学を解明
- Less is More: Recursive Reasoning with Tiny Networks
- GPT-5.3-Codex 発表:初の自己訓練モデル
- 自己進化エージェントの新たなブレークスルー!MetaがDr. Zeroを発表:自発的に複雑な推論と検索能力を獲得
- 美团が静かに新モデルを公開!実測初のオープンソース「重思考」モデル:8路並列、AgentがClaudeと直接対決
- オープンソースフレームワークがコードAIにGitHubから学習!バグ修正率が69.8%に急上昇、性能が記録を更新
- Googleがモデルの記憶を革新し、NVIDIAが注目を再定義|Hao好聊論文
- 事前学習データが低品質な場合どうすればいい?Bengioチーム、明示的ベイズを導入し勾配なしでIn-Context RLを実現
- 最適化は即ち幾何、幾何は即ち推論:数学でTransformerのブラックボックス時代を終わらせる
- Attentionは必要ではない?グラスマン流形を用いたシーケンスモデル링の幾何学的美学の再構築
- 「Titans+MIRAS & Nested」の飛躍的なアーキテクチャ革新からNeurIPS2025最優秀論文「Gated Attention」へ
- コスト8000ドル以下!Sina Weiboの1.5B小型モデルが数千億パラメータモデルを超える
- AIが18世紀の「謎の帳簿」を瞬時に解読!Googleの新モデルがブラインドテストで話題に
- 上海交通大学博士の最新考察:2つの質問だけで強化学習を明確にする
- Metaが発見:RAGシステムの遅延は無駄な作業が多すぎることが原因
- AIは本当に癌を克服しようとしているのか?Googleが2日間で2つのブレークスルーを発表
- 手動アノテーションを不要に!華人チームがマルチモーダル大規模モデルの自己進化アルゴリズムを提案
- NTUらがA-MemGuardを発表:AIメモリをロックし、ポイズニング攻撃の成功率を95%以上削減
- 再帰的推論HRMモデルがさらなる進化!TRMの2層ネットワーク(7Mモデル)がLLMを凌駕!
- MicrosoftがGRPO-RoCを提案:エージェント型強化学習の鍵は軌跡品質フィルタリング