分類: 大型語言模型
- 模型太喜歡作弊了!Cursor首度公開Composer 2強化學習內幕:模型能察覺「虛假環境」,浮點運算不確定性是RL訓練致命隱患
- 企業級 Text-to-SQL:LinkedIn 與頂尖實驗室帶來的 5 個顛覆性啟示
- Claude Code和機器人背後的共同機制,UIUC、Meta、Stanford這篇最新綜述講清楚了
- 520,遇見本土「新模王」Qwen3.7-Max!
- Gemini 3.5 Pro全網首曝,程式能力追平GPT-5.5!Google終於硬起來了
- GPT-5.5 全球首破!零原始碼盲寫程式,程式開發 AI 進入新紀元
- WWW'26 | 跨任務自適應的Multi-Agent協作新典範
- 如何評價 Thinking Machines 最新發布的 Interaction Model?
- 零索引、零嵌入、純 grep:DCI 直接在原始語料上做深度研究
- ICML 2026|拒絕暴力運算,PRISM框架讓dLLM也能高效Test-Time Scaling
- 《Attention Is All You Need》作者再出手:Transformer 99% 稀疏,還能更快?
- 為何 agent 訓練總在長程任務上崩潰
- 生成-過濾-控制-重播:LLM強化學習中Rollout策略的全面綜述
- OpenAI 翁家翌:超越梯度,下一個 AI 訓練範式已經浮現?
- 壓縮即是全部 —— 菲爾茲獎得主 Michael Freedman 給數學和 AI 的一封信
- Token級精準控生:3B開源模型擊敗GPT-5.4與Claude
- 或近年最強AI論文:替推理配上即時字幕後,AI的內心戲讓人頭皮發麻!
- 硬核,Google Jeff Dean:百萬晶片LLM預訓練瓶頸被徹底打破了!
- Anthropic最危險路線圖曝光:無限記憶、多智能體!AI終局戰僅剩雙雄決頂
- 靜態評測已「過時」?OpenKG 持續更新 LLM 知識增強動態評測榜單 Dynamic OneEval-202605
- AI 終於學會「自我坦白」!Anthropic 最新論文震撼來襲,「內省適配器」讓黑箱模型自己說出隱藏行為
- Claude 的「夢境」機制如何運作
- 刷榜AI全陣亡!Meta、斯坦佛地獄級測試,GPT/Claude/Gemini交出0分
- Abstract-CoT:推理token暴降11.6倍,無詞思維鏈打破LLM效率天花板
- 論文淺嚐 | 利用多智能體大型語言模型實現知識圖譜自動化擴充(NeurIPS 2025)