最新文章
所有文章

繁體中文

分類：機器學習

ReaGAN：讓圖中每個節點都成為智能推理專家
超越人類標註，Meta 提出 CoT-Self-Instruct：如何用「推理式自進化」重塑大型語言模型訓練
Dualformer：透過隨機推理軌跡學習實現可控的快速與慢速思考
多模態大型語言模型真的「理解」世界嗎？——揭露多模態大型語言模型的核心知識缺陷
數學訓練如何「解鎖」大型模型的通用推理能力？最新研究揭示關鍵機制
吳恩達推出大型語言模型（LLM）後訓練免費課程，涵蓋三大調優方法：SFT、DPO、RL
持續強化學習技術最新綜述
阿里巴巴深夜開源「王牌」Agent！硬槓OpenAI，性能全面超越SOTA！
RAG開發者必看Google新論文MUVERA：讓多向量檢索與單向量搜尋一樣快
推理越多，幻覺越重？多模態推理模型的「幻覺悖論」
解讀大型推理模型的「思維奧秘」：從「推理圖」視角看模型的「啊哈時刻」
邊畫邊想！多模態推理迎來巨大提升！
爆肝一篇部落格就拿到 OpenAI Offer！Muon 作者怒揭：幾乎所有優化器論文都是「假的」
Midjourney 進軍影片生成，圖像模型 V7 持續更新，視覺霸主實至名歸
字節跳動Seed新作DeltaFormer：下一世代模型架構的嘗試
LLM 已能自我更新權重，自適應、知識整合能力大幅提升，AI 覺醒了？
何愷明新作：為擴散模型加入正規化，無需預訓練與資料增強，超簡單實現效能提升
重磅！Meta 開源最新世界模型 V-JEPA 2
不需SFT也不用RL，樣本級推論優化神器SLOT登場，準確率輕鬆提升10%
繼ZeroSearch之後，通義最新力作MaskSearch提出推論搜尋預訓練新框架
35%準確率蒸發！字節跳動與華中科技大學WildDoc揭示多模態文件理解的強韌性短板
Google 研究發現：多代理人系統的核心在於提示詞設計！
晴天霹靂！蘋果最新研究證實：DeepSeek、o3、Claude 等「推論」模型根本不具推論能力
類R1訓練不再只看結果對錯！港中文推出SophiaVL-R1模型
10行程式碼，AIME24/25提升15%！揭密大型模型強化學習的熵機制

←
1
2
3
4
5
6
→

AINews·AI 新聞聚合平台

© 2026 AINews. All rights reserved.