分類: 機器學習
- 李飛飛團隊最新研究:從熵到互信息,RAGEN-2 重塑推理品質標準,終結 AI Agent「越訓越模板化」困境
- Meta 押注神經電腦:下一代電腦,就是模型本身?
- 無需強化學習!蘋果團隊提出「簡單自蒸餾」,實現編碼模型自我進化
- AI Agent 又貴又洩密?這個開源外掛讓成本直降 60%,敏感資料不出門
- Composer 2 技術報告
- 讓思考更精準更長!強化學習新演算法 FIPO 登場
- GLM-5.1:邁向長時間跨度的任務處理
- ASI-Evolve:AI 加速 AI
- 88 歲演算法宗師、圖靈獎得主高德納驚呆了!Claude 聯手 GPT 攻克 30 年難題,14 頁論文零修改
- Meta-Harness 讓 Haiku 性能狂飆,甚至追平 Opus!
- Meta-Harness:史丹佛最新Harness論文,林俊旸按讚
- 模型已具備內省能力,但過去它的心門上了鎖|Hao 好聊論文
- 賦予大模型「終身學習」能力,北航 CASE 框架:編輯千次不失憶,額外參數不到 1MB丨WWW'26
- 全球首位 AI 科學家登上《自然》!從發想到論文撰寫全包辦,已通過人類雙盲審查
- Anthropic 借鑑 GAN 思路,破解 AI 產出品質難題
- 一夜之間,AI 終於擁有「永久記憶」!最難考試 99% 刷爆 SOTA,全網直呼瘋狂
- 僅用2億真實Token訓練的模型,為何能媲美3.6億數據量的效果?
- Mamba-3:專為推論效率打造的新一代狀態空間模型
- 太狂了!MIT 團隊在 Transformer 內部打造電腦,LLM 從此無需外部工具?
- OpenClaw-RL:讓 AI 智慧代理在對話中自我進化
- 神作!MIT 與 Google 訓練出能進行嚴格貝氏推論的 LLM 大模型
- On-Policy Distillation 到底是什麼?深度解讀 On-Policy/Self-Distillation
- Gemini 靈魂人物、傳奇工程師 Jeff Dean 最新訪談:未來人均 50 個虛擬實習生,用不上專家了!
- Qwen3.5:邁向原生多模態智慧代理人
- 小米推出 JudgeRLVR:先判斷後生成——打破推理模型「長思維鏈」的效率悖論