カテゴリー: 研究論文
- GPT-5.4 や Claude Opus などの最高峰モデルが「偽の推論」を露見:その思考過程は「演技」だったのか?
- 「層を一つ削除する」と、モデルはかえってタスクをより深く理解するのか?哈工深|楊朔チームがVLMにおける「タスク干渉層」を発見
- 事前学習データが低品質な場合どうすればいい?Bengioチーム、明示的ベイズを導入し勾配なしでIn-Context RLを実現
- 浙江大学チーム:AIは人からやる気を奪い、退屈にさせる!研究がNature系列誌に掲載
- LLMエージェントのパフォーマンスが低い理由:Google DeepMindの研究が3つの失敗モードを明らかに、RLファインチューニングで緩和可能