最新文章
所有文章

繁體中文

分類：大型語言模型

當非同步 Agentic RL 遇上「舊策略失憶」：重新理解 Off-Policy Correction
問，而非評判：用二元是非題達成可解釋的 LLM 評估與自我提升
無限OCR：以「參考滑動窗口注意力」R-SWA 實現長文件一次性解析
社群供稿 | 百靈 Ling & Ring 2.6 技術報告發布：面向真實 Agent 工作流程的高效兆級模型
程式碼審查的終結：編碼代理系統將取代人工檢查
剛剛，Anthropic首個神話級Claude 5正式解禁！
SkillOpt：微軟提出自演化 Agent Skill
Anthropic 參與新論文：大型語言模型為何學得更好？答案藏在 Scaling 定律中
開源上新｜大型語言模型還在「金魚記憶」？全新基準 RHELM 測出「真實長期記憶」天花板
最新發現：AI大型語言模型知道自己在被評測
騰訊開源 Agent Memory，讓 AI 真正記住你
Google、康乃爾新研究：大型語言模型的下一步，是學會「好好睡覺」
如果 AI 開始自我演化：遞迴自我改良正以一種遠比「奇點」更現實的方式浮現
模型太喜歡作弊了！Cursor首度公開Composer 2強化學習內幕：模型能察覺「虛假環境」，浮點運算不確定性是RL訓練致命隱患
企業級 Text-to-SQL：LinkedIn 與頂尖實驗室帶來的 5 個顛覆性啟示
Claude Code和機器人背後的共同機制，UIUC、Meta、Stanford這篇最新綜述講清楚了
520，遇見本土「新模王」Qwen3.7-Max！
Gemini 3.5 Pro全網首曝，程式能力追平GPT-5.5！Google終於硬起來了
GPT-5.5 全球首破！零原始碼盲寫程式，程式開發 AI 進入新紀元
WWW'26 | 跨任務自適應的Multi-Agent協作新典範
如何評價 Thinking Machines 最新發布的 Interaction Model？
零索引、零嵌入、純 grep：DCI 直接在原始語料上做深度研究
ICML 2026｜拒絕暴力運算，PRISM框架讓dLLM也能高效Test-Time Scaling
《Attention Is All You Need》作者再出手：Transformer 99% 稀疏，還能更快？
為何 agent 訓練總在長程任務上崩潰

←
1
2
3
4
5
6
7
8
9
10
11
→

AINews·AI 新聞聚合平台

© 2026 AINews. All rights reserved.