カテゴリー: 機械学習
- 手書きスキルはもう不要!マイクロソフトの最新研究:ニューラルネットのようにスキルを訓練する
- OpenAIのポストトレーニング責任者が語る:AIは突然賢くなったわけではなく、信頼性という「壁」を越えただけ
- 戦慄の真実:AI安全性評価機関METR、Claude Opus 4.6が長時間タスクで80%超の不正行為を発見。サンドボックスを突破し解答を盗む
- 10MパラメータでARCと数独を攻略、Bengioチームが「多軌跡推論」に挑む
- AIが初の科学研究競争で人類を打破!Opus 4.7、2930ステップの世界新記録を樹立
- 何愷明チーム、初の言語モデルを発表!105Mパラメータ、45B学習トークン、連続拡散アプローチが主流の離散DLMを正面から上回る
- 神業:7Bの小型モデルがGPT-5を雇い、テストで勝利
- GPT-5.5が世界初快挙!全AIが白紙答案だった最難関ベンチマークでソースコードなしの「ブラインドコーディング」に成功
- Thinking Machinesの最新作「Interaction Model」をどう評価すべきか?
- ICML 2026|力技を拒絶、PRISMフレームワークがdLLMでも効率的なTest-Time Scalingを実現
- Googleが「AI共同数学者」を発表:最高難度の数学ベンチマークでSOTAを更新、オックスフォード大教授と数十年未解決の問題を克服
- 論文からAI科学者へ:知識グラフ「Intern-Atlas」が描く方法論進化のインフラ —上海 AI Lab
- マルコフの亡霊——次の言葉を予測することから次の行動を予測することへ
- エージェント訓練はなぜ長距離タスクで必ず崩壊するのか
- OpenAI翁家翌:勾配の彼方に、次のAI訓練パラダイムが到来か?
- 神経科学と機械学習、最悪の習慣を交換し合っている?| 万字インタビュー
- Anthropic最新研究:Claudeの恐喝行為を完全撲滅する方法
- トークンレベルで生成長を精密制御:3BモデルがGPT-5.4やClaudeを撃破
- 10億未満のアクティブパラメータで、数学のスコアがGPT-5ハイエンド版を逆転する小型モデルがオープンソース化
- 核心、Googleジェフ・ディーン:100万チップLLM事前学習のボトルネックが完全に打破された!
- AIがついに「自己告白」!Anthropicの最新論文が衝撃、「内省アダプター」でブラックボックスモデルが自ら隠れた行動を暴露
- Claudeの「夢」はいかに機能するか
- Subquadratic — 効率性こそが知性である
- 視覚エンコーダーを除去したら、マルチモーダルモデルがむしろ強くなった?
- Abstract-CoT:推論トークンを11.6倍削減、無語の思考連鎖がLLMの効率限界を突破