最新文章
所有文章

繁體中文

分類：語言模型

聊聊Anthropic這篇最新研究，我覺得可能是AI意識誕生的前夜。
如何評價 Thinking Machines 最新發布的 Interaction Model？
馬爾可夫的幽靈——從預測下一個詞到預測下一步行動
OCR 領域適應不用從頭訓？解耦語言模型，單 GPU 搞定 95% 計算量縮減
Stable-DiffCoder超越自迴歸模型！擴散模型在程式碼生成取得新突破
GPT-5.3-Codex 發布：首個自我訓練的模型
剛剛，梁文鋒署名新論文深夜引爆！DeepSeek-V4 新架構曝光：提出新的稀疏化方向，與 MoE 互補，長上下文能力顯著擴展，推理程式碼能力更強了
錯越多學越快！「軌跡重寫」技術讓 AI 智能體從失敗中創造完美經驗！
微軟提出 GRPO-RoC：軌跡品質過濾是代理式強化學習的關鍵
對喔！為什麼語言模型不能直接輸出答案與其置信度呢？
How Does Claude 4 Think? Senior Researchers Respond: RLHF Paradigm is Out, RLVR Proven in Programming/Mathematics
可靠的Agent應該用哪個模型？LLM多輪對話中的「迷失」現象 | 微軟最新
專業醫師遠不如AI模型？OpenAI推出醫療開源測試基準HealthBench，o3表現最強
NVIDIA讓AI更聰明地使用工具：Nemotron-Research-Tool-N1模型深度解析

←
1
→

AINews·AI 新聞聚合平台

© 2026 AINews. All rights reserved.