分類: 語言模型
- Stable-DiffCoder超越自迴歸模型!擴散模型在程式碼生成取得新突破
- GPT-5.3-Codex 發布:首個自我訓練的模型
- 剛剛,梁文鋒署名新論文深夜引爆!DeepSeek-V4 新架構曝光:提出新的稀疏化方向,與 MoE 互補,長上下文能力顯著擴展,推理程式碼能力更強了
- 錯越多學越快!「軌跡重寫」技術讓 AI 智能體從失敗中創造完美經驗!
- 微軟提出 GRPO-RoC:軌跡品質過濾是代理式強化學習的關鍵
- 對喔!為什麼語言模型不能直接輸出答案與其置信度呢?
- How Does Claude 4 Think? Senior Researchers Respond: RLHF Paradigm is Out, RLVR Proven in Programming/Mathematics
- 可靠的Agent應該用哪個模型?LLM多輪對話中的「迷失」現象 | 微軟最新
- 專業醫師遠不如AI模型?OpenAI推出醫療開源測試基準HealthBench,o3表現最強
- NVIDIA讓AI更聰明地使用工具:Nemotron-Research-Tool-N1模型深度解析