分類: 機器學習
- Dualformer:透過隨機推理軌跡學習實現可控的快速與慢速思考
- 多模態大型語言模型真的「理解」世界嗎?——揭露多模態大型語言模型的核心知識缺陷
- 數學訓練如何「解鎖」大型模型的通用推理能力?最新研究揭示關鍵機制
- 吳恩達推出大型語言模型(LLM)後訓練免費課程,涵蓋三大調優方法:SFT、DPO、RL
- 持續強化學習技術最新綜述
- 阿里巴巴深夜開源「王牌」Agent!硬槓OpenAI,性能全面超越SOTA!
- RAG開發者必看Google新論文MUVERA:讓多向量檢索與單向量搜尋一樣快
- 推理越多,幻覺越重?多模態推理模型的「幻覺悖論」
- 解讀大型推理模型的「思維奧秘」:從「推理圖」視角看模型的「啊哈時刻」
- 邊畫邊想!多模態推理迎來巨大提升!
- 爆肝一篇部落格就拿到 OpenAI Offer!Muon 作者怒揭:幾乎所有優化器論文都是「假的」
- Midjourney 進軍影片生成,圖像模型 V7 持續更新,視覺霸主實至名歸
- 字節跳動Seed新作DeltaFormer:下一世代模型架構的嘗試
- LLM 已能自我更新權重,自適應、知識整合能力大幅提升,AI 覺醒了?
- 何愷明新作:為擴散模型加入正規化,無需預訓練與資料增強,超簡單實現效能提升
- 重磅!Meta 開源最新世界模型 V-JEPA 2
- 不需SFT也不用RL,樣本級推論優化神器SLOT登場,準確率輕鬆提升10%
- 繼ZeroSearch之後,通義最新力作MaskSearch提出推論搜尋預訓練新框架
- 35%準確率蒸發!字節跳動與華中科技大學WildDoc揭示多模態文件理解的強韌性短板
- Google 研究發現:多代理人系統的核心在於提示詞設計!
- 晴天霹靂!蘋果最新研究證實:DeepSeek、o3、Claude 等「推論」模型根本不具推論能力
- 類R1訓練不再只看結果對錯!港中文推出SophiaVL-R1模型
- 10行程式碼,AIME24/25提升15%!揭密大型模型強化學習的熵機制
- RMoA殘差提取Mixture-of-Agents,讓Agent發現新事物並自適應停止「ACL2025」
- Agent Zero:能學習進化的開源免費智慧體