最新文章
所有文章

繁體中文

分類：演算法優化

史丹佛新理論：揭開神經網路泛化之謎，Adam加一行程式碼，加速2.4倍
DeepSeek-V4 預覽版：邁入百萬字元上下文普惠時代
你寫的 Skill 正在拖累模型？策略式 Gene 才是正解
長文縮減六成＋稀疏度 95%：今日雙重突破，創下推理運算效率新紀錄
MSA 程式碼準時開源！突破 1 億 Token 記憶極限，效能超越 58 倍大模型 RAG
推理不再為 logits「搬磚」：FlashSampling 讓解碼提速 19%
賦予大模型「終身學習」能力，北航 CASE 框架：編輯千次不失憶，額外參數不到 1MB丨WWW'26
VideoSeek 長影片理解 Agent：讓 GPT-5 在長影片理解上再提 10 個百分點的祕密
別再迷信結果獎勵了！港中文發現並解決 RL 中的「資訊自鎖」難題！
Mamba-3：專為推論效率打造的新一代狀態空間模型
太狂了！MIT 團隊在 Transformer 內部打造電腦，LLM 從此無需外部工具？
LLM RL 訓練軌跡竟然是線性的？Miaow Lab 最新工作：無需繼續訓練，直接「預測」未來模型！
強化學習遠非最優，CMU 剛剛提出最大似然強化學習
DeepSeek-GRPO重要性權重設計錯誤？詳解Qwen3新強化學習演算法GSPO
！離AGI更近了！！0.31元人民幣運行Google的AlphaEvolve和UBC的DGM「達爾文-哥德爾機」？
50年僵局突破！麻省理工學院最新證明：演算法中，少量記憶體勝過大量時間

←
1
→

AINews·AI 新聞聚合平台

© 2026 AINews. All rights reserved.