分類: 深度學習
- DeepMind諾獎CEO最新訪談:現有大模型路徑不是死路,但大家都在用的暴力方法可能錯了;中國模型在開源領域已處於領先地位
- DeepSeek連夜撤下的新論文,究竟說了什麼
- Qwen-Scope:看穿大型語言模型的「思考脈絡」
- GPT之父把AI丟回1930年:沒見過一行程式碼,卻「發明」了Python!
- ChatGPT數學進階之路!OpenAI研究員自爆:從數不清數到給出埃爾德什問題全新解法;數學是衡量模型進步的重要基準;AI自動化研究員
- 技能驅動推理新範式,清華&北大:Token立省59%,準確率不降反升
- 首個時空時序推理框架:讓大型語言模型真正讀懂時空數據 | ACL'26
- DeepSeek-V4 預覽版:邁入百萬字元上下文普惠時代
- 循環 Transformer 的縮放定律:Parcae 如何破解穩定性難題
- 記憶體快取:具備成長型記憶力的循環神經網路
- NUS、復旦、清華聯手:首份大模型潛在空間(Latent Space)系統性綜述出爐
- 東南大學耿新團隊:模型不是不會做,而是被「擠掉了能力」丨CVPR2026
- 李飛飛團隊最新研究:從熵到互信息,RAGEN-2 重塑推理品質標準,終結 AI Agent「越訓越模板化」困境
- 權重凍結是AI進步的敵人!DeepMind頂尖AI研究員:AI自我改進的關鍵在於評估,需借鑑形式化驗證!專家模型是通往泛化AGI的基石!
- ASI-Evolve:AI 加速 AI
- OCR 領域適應不用從頭訓?解耦語言模型,單 GPU 搞定 95% 計算量縮減
- MSA 程式碼準時開源!突破 1 億 Token 記憶極限,效能超越 58 倍大模型 RAG
- 19 歲、常春藤輟學,這群中國年輕人重構了 AI 記憶
- Chandra OCR 2 開源了!官方基準測試拿下 85.9 分,直接碾壓 GPT-4o 的 69.9 分
- LLM 真實能力大起底:Python 考 90 分,Whitespace 考 0 分!AI 的「學霸」人設崩了
- 重構原生多模態!美團發布純離散基座,真正實現萬物皆 Token
- 輝達自我革命:AI 智能體自主演化 7 天,超越所有人類 GPU 專家與算子工程師
- NVIDIA Nemotron-Cascade 2 技術報告:3B 激活參數奪下 IMO 金牌,重新定義小模型極限
- Mamba-3:專為推論效率打造的新一代狀態空間模型
- AI 不需要理解世界,但我們需要理解 AI