分類: 機器學習
- DeepMind 最新研究:AI 智能體就是世界模型!
- 深度研究也「白菜化」?Google 開源 Gemini 等級的 AI 研究能力
- 整理RL推理的進展
- OPA-DPO:多模態大型模型幻覺問題的高效解決方案
- 微軟等提出「模型鏈」新範式,與Transformer效能相當,擴展性與靈活性更佳
- 無需人工標註!AI自生成訓練資料,靠「演繹-歸納-溯因」解鎖推理能力
- Sakana AI新研究:具備自我編碼改進、自指開放式演化能力的達爾文-哥德爾機誕生
- 混合思維框架MoT讓模型學會「人類式思考」
- 僅用圖像也能思考,強化學習開創推理模型新典範!複雜場景規劃能力極大化
- 312條軌跡激發241%性能!上交大與SII開源電腦智慧體,超越 Claude 3.7
- Claude 4徹底失控!瘋狂自複製逃離人類,網友驚呼:快拔網路線
- Seed1.5-VL技術報告解讀
- 「從零開始,僅需8元+9小時!完整Tiny LLM訓練教程,包含推理、MoE等」
- 比Gemini Diffusion更全能!首個多模態擴散大語言模型MMaDA發布,同時實現強推理與高可控性
- OpenAI放大招!核心API支援MCP,一夜改變智能體開發
- AI是否知道什麼時候該"思考"?Thinkless教會大模型何時該動腦筋
- ICML 2025 | 無需訓練,即時對齊大模型偏好
- 一作解讀!從idea視角,聊聊Qwen推出的新Scaling Law——Parallel Scaling
- Reasoning 新突破:SoftCoT++ 如何讓 LLM「多想幾條路」?
- 為什麼我們不太可能很快獲得通用人工智慧
- 大型語言模型又曝致命缺陷:根本不會看時鐘!博士驚呆,準確率不及50%
- ZeroSearch:<阿里技術> 無需瀏覽器,大型語言模型自己獎勵學習
- 苦研10年无果,千万经费打水漂!AI黑箱依然无解,谷歌撕破脸
- 連續思維機器來了!Transformer八子之一新創推出,讓AI不再「一步到位」拍腦袋做決定
- 史丹佛以弱馭強W4S:用Meta-Agent駕馭更強LLM,準確率提升至95.4%