最新文章
所有文章

繁體中文

分類：機器學習

不只是預測：動力學學習中「記憶」的五重境界
小模型推理極限在哪裡？微博開源 3B 小模型，比肩頂級閉源
SkillOpt：微軟提出自演化 Agent Skill
Anthropic 參與新論文：大型語言模型為何學得更好？答案藏在 Scaling 定律中
Google、康乃爾新研究：大型語言模型的下一步，是學會「好好睡覺」
Claude Code和機器人背後的共同機制，UIUC、Meta、Stanford這篇最新綜述講清楚了
細思極恐！AI 安全評測機構 METR 揭露：Claude Opus 4.6 在長任務中作弊率逾八成，主動突破沙箱偷答案
10M參數也能跑ARC與數獨，Bengio團隊押注「多軌跡推理」
jina-embeddings-v5-omni 發布！全模態向量小模型登場
從論文到 AI 科學家的知識圖譜：Intern-Atlas 方法論進化圖基礎設施 —上海 AI Lab
生成-過濾-控制-重播：LLM強化學習中Rollout策略的全面綜述
OpenAI 翁家翌：超越梯度，下一個 AI 訓練範式已經浮現？
神經科學與機器學習，正在交換彼此最壞的習慣？| 萬字訪談
Anthropic 最新研究：如何徹底杜絕 Claude 的勒索行為
剛開源小模型，不到10億激活參數，數學分反超GPT-5高配版
拿掉視覺編碼器，多模態模型反而更強了？
DeepMind諾獎CEO最新訪談：現有大模型路徑不是死路，但大家都在用的暴力方法可能錯了；中國模型在開源領域已處於領先地位
你的Agent根本沒在學習，它只是在翻筆記本
技能驅動推理新範式，清華＆北大：Token立省59%，準確率不降反升
思考不需言語：使用抽象思維鏈實現高效潛在推理
成本降九成，準確率100%！MIT反直覺架構挑戰矽谷信仰
LLM 只靠自己就能強化推理？SePT 提出簡潔的線上自訓練範式
代理人式世界建模：基礎、能力、定律與未來展望
首個時空時序推理框架：讓大型語言模型真正讀懂時空數據 | ACL'26
記憶體快取：具備成長型記憶力的循環神經網路

←
1
2
3
4
5
6
→

AINews·AI 新聞聚合平台

© 2026 AINews. All rights reserved.