最新文章
所有文章

繁體中文

分類：深度學習

Anthropic 最新研究：如何徹底杜絕 Claude 的勒索行為
Token級精準控生：3B開源模型擊敗GPT-5.4與Claude
或近年最強AI論文：替推理配上即時字幕後，AI的內心戲讓人頭皮發麻！
DeepMind入股硬派網遊EVE，要讓AI學習「黑暗森林」法則
史丹佛新理論：揭開神經網路泛化之謎，Adam加一行程式碼，加速2.4倍
Subquadratic — 效率即智慧
拿掉視覺編碼器，多模態模型反而更強了？
DeepMind諾獎CEO最新訪談：現有大模型路徑不是死路，但大家都在用的暴力方法可能錯了；中國模型在開源領域已處於領先地位
DeepSeek連夜撤下的新論文，究竟說了什麼
Qwen-Scope：看穿大型語言模型的「思考脈絡」
GPT之父把AI丟回1930年：沒見過一行程式碼，卻「發明」了Python！
ChatGPT數學進階之路！OpenAI研究員自爆：從數不清數到給出埃爾德什問題全新解法；數學是衡量模型進步的重要基準；AI自動化研究員
技能驅動推理新範式，清華＆北大：Token立省59%，準確率不降反升
首個時空時序推理框架：讓大型語言模型真正讀懂時空數據 | ACL'26
DeepSeek-V4 預覽版：邁入百萬字元上下文普惠時代
循環 Transformer 的縮放定律：Parcae 如何破解穩定性難題
記憶體快取：具備成長型記憶力的循環神經網路
NUS、復旦、清華聯手：首份大模型潛在空間（Latent Space）系統性綜述出爐
東南大學耿新團隊：模型不是不會做，而是被「擠掉了能力」丨CVPR2026
李飛飛團隊最新研究：從熵到互信息，RAGEN-2 重塑推理品質標準，終結 AI Agent「越訓越模板化」困境
權重凍結是AI進步的敵人！DeepMind頂尖AI研究員：AI自我改進的關鍵在於評估，需借鑑形式化驗證！專家模型是通往泛化AGI的基石！
ASI-Evolve：AI 加速 AI
OCR 領域適應不用從頭訓？解耦語言模型，單 GPU 搞定 95% 計算量縮減
MSA 程式碼準時開源！突破 1 億 Token 記憶極限，效能超越 58 倍大模型 RAG
19 歲、常春藤輟學，這群中國年輕人重構了 AI 記憶

←
1
2
3
4
5
→

AINews·AI 新聞聚合平台

© 2026 AINews. All rights reserved.