分類: 深度學習
- OpenAI 後訓練負責人:AI 沒有突然變強,只是剛跨過一道檻
- 10M參數也能跑ARC與數獨,Bengio團隊押注「多軌跡推理」
- AI首次在科研競賽中擊敗人類!Opus 4.7狂飆2930步創世界紀錄
- 35B參數科學性能比肩兆級參數模型,「書生」科學大模型Intern-S2-Preview開源
- 何愷明團隊首個語言模型亮相!105M參數、45B訓練token,連續擴散路線正面擊敗主流離散DLM
- 田淵棟履新:聯手多位AI大牛,6.5億美元押注「會自我進化的AI」
- GPT-5.5 全球首破!零原始碼盲寫程式,程式開發 AI 進入新紀元
- OpenAI 前技術長,帶來了永遠「在場」AI 的原型|Hao 好聊論文
- 何愷明團隊「擴散模型」新作:在「最後一公里」進行離散解碼
- 如何評價 Thinking Machines 最新發布的 Interaction Model?
- ICML 2026|拒絕暴力運算,PRISM框架讓dLLM也能高效Test-Time Scaling
- Google 發表「AI 協同數學家」:刷新最難數學基準SOTA,與牛津教授破解數十年無解難題
- 《Attention Is All You Need》作者再出手:Transformer 99% 稀疏,還能更快?
- 馬爾可夫的幽靈——從預測下一個詞到預測下一步行動
- 為何 agent 訓練總在長程任務上崩潰
- 諾貝爾獎得主哈薩比斯:資訊是宇宙的本質,AI將開啟全新的科學分支
- 圖靈獎得主Yann LeCun押注10億美元做空LLM!新一代AI架構究竟是什麼?
- 貝氏沒想到的事——一個牧師的賭博公式,如何成為 AI 的第一性原理
- Anthropic 最新研究:如何徹底杜絕 Claude 的勒索行為
- Token級精準控生:3B開源模型擊敗GPT-5.4與Claude
- 或近年最強AI論文:替推理配上即時字幕後,AI的內心戲讓人頭皮發麻!
- DeepMind入股硬派網遊EVE,要讓AI學習「黑暗森林」法則
- 史丹佛新理論:揭開神經網路泛化之謎,Adam加一行程式碼,加速2.4倍
- Subquadratic — 效率即智慧
- 拿掉視覺編碼器,多模態模型反而更強了?