カテゴリー: 機械学習
- OpenAI、完全自動化された「AI研究者」の構築に総力を挙げる
- RAG を 1 年運用して最も後悔したこと:知識グラフの導入
- パフォーマンスが 42% 向上!中国人民大学と ByteDance が 10 万件規模の SWE データセット「Scale-SWE」をオープンソース化
- Mamba-3: 推論効率を最優先に設計された新しい状態空間モデル
- 度肝を抜かれた!MIT の研究者が Transformer 内にコンピュータを構築、LLM はもはや外部ツール不要か?
- 神業!MIT と Google が厳密なベイズ推論を実行可能な LLM を訓練
- カラペティが寝ている間に、AI が 100 回の実験を自動実行
- モデルの静的重みを打破!騰訊混元が推論時にリアルタイムで脳を交換する技術を発表
- OpenAI幹部が明かす:博士号・論文ゼロの学部生がブログ1本でOpenAIに入社
- On-Policy Distillation とは何か?On-Policy/Self-Distillation の深層解説
- Google Gemini 3.1 Proがランキングを制覇、清華大学の姚順宇が参戦!ClaudeとGPTが追い詰められる
- Gemini の中心人物、伝説的エンジニア Jeff Dean 最新インタビュー:未来は一人あたり 50 人の仮想インターン時代、専門家は不要に!
- 苦い教訓!ROLLチームが共有:Agentic RLトレーニングにおける実践経験
- 小米がJudgeRLVRを発表:先に判断してから生成——推論モデルの「長い思考チェーン」の効率パラドックスを打破
- コインを採掘するように活性化関数を採掘?DeepMindが「計算力マイニング場」を構築し、次世代ReLUを総当たり検索
- 強化学習は最適ではない、CMUが最大尤度強化学習を提案
- もう暴力的にClipするな!千問がGatedNormを提案、統一的な視点で残差流の玄学を解明
- Less is More: Recursive Reasoning with Tiny Networks
- GPT-5.3-Codex 発表:初の自己訓練モデル
- 自己進化エージェントの新たなブレークスルー!MetaがDr. Zeroを発表:自発的に複雑な推論と検索能力を獲得
- 美团が静かに新モデルを公開!実測初のオープンソース「重思考」モデル:8路並列、AgentがClaudeと直接対決
- オープンソースフレームワークがコードAIにGitHubから学習!バグ修正率が69.8%に急上昇、性能が記録を更新
- Googleがモデルの記憶を革新し、NVIDIAが注目を再定義|Hao好聊論文
- 事前学習データが低品質な場合どうすればいい?Bengioチーム、明示的ベイズを導入し勾配なしでIn-Context RLを実現
- 最適化は即ち幾何、幾何は即ち推論:数学でTransformerのブラックボックス時代を終わらせる