分類: 機器學習
- Claude Code和機器人背後的共同機制,UIUC、Meta、Stanford這篇最新綜述講清楚了
- 細思極恐!AI 安全評測機構 METR 揭露:Claude Opus 4.6 在長任務中作弊率逾八成,主動突破沙箱偷答案
- 10M參數也能跑ARC與數獨,Bengio團隊押注「多軌跡推理」
- jina-embeddings-v5-omni 發布!全模態向量小模型登場
- 從論文到 AI 科學家的知識圖譜:Intern-Atlas 方法論進化圖基礎設施 —上海 AI Lab
- 生成-過濾-控制-重播:LLM強化學習中Rollout策略的全面綜述
- OpenAI 翁家翌:超越梯度,下一個 AI 訓練範式已經浮現?
- 神經科學與機器學習,正在交換彼此最壞的習慣?| 萬字訪談
- Anthropic 最新研究:如何徹底杜絕 Claude 的勒索行為
- 剛開源小模型,不到10億激活參數,數學分反超GPT-5高配版
- 拿掉視覺編碼器,多模態模型反而更強了?
- DeepMind諾獎CEO最新訪談:現有大模型路徑不是死路,但大家都在用的暴力方法可能錯了;中國模型在開源領域已處於領先地位
- 你的Agent根本沒在學習,它只是在翻筆記本
- 技能驅動推理新範式,清華&北大:Token立省59%,準確率不降反升
- 思考不需言語:使用抽象思維鏈實現高效潛在推理
- 成本降九成,準確率100%!MIT反直覺架構挑戰矽谷信仰
- LLM 只靠自己就能強化推理?SePT 提出簡潔的線上自訓練範式
- 代理人式世界建模:基礎、能力、定律與未來展望
- 首個時空時序推理框架:讓大型語言模型真正讀懂時空數據 | ACL'26
- 記憶體快取:具備成長型記憶力的循環神經網路
- 東南大學耿新團隊:模型不是不會做,而是被「擠掉了能力」丨CVPR2026
- 介紹 SWE-Check:偵測錯誤速度快 10 倍
- 李飛飛團隊最新研究:從熵到互信息,RAGEN-2 重塑推理品質標準,終結 AI Agent「越訓越模板化」困境
- Meta 押注神經電腦:下一代電腦,就是模型本身?
- 無需強化學習!蘋果團隊提出「簡單自蒸餾」,實現編碼模型自我進化