分類: 人工智慧
- 88 歲演算法泰斗驚呆了!Claude 聯手 GPT 攻克 30 年難題,14 頁論文零修改
- 有意思,Codex 被 OpenAI 做成插件,塞進了 Claude Code
- DeepMind 之父驚人自白:親手打造的 AI 恐致人類滅絕,但已無人能踩煞車
- LLM 真實能力大起底:Python 考 90 分,Whitespace 考 0 分!AI 的「學霸」人設崩了
- 合成資料比真實數據更有效?Meta 論文揭示強化學習訓練大模型的突破路徑
- 500 筆種子數據、四個 Agent 自我進化,推理能力提升 10.7%
- SortedRL:大模型 RL 訓練速度提升 50%,訓練效率躍升 18%
- Claude 僅耗 90 分鐘挖出潛藏 20 年漏洞!5 萬顆星的「安全」系統光環破滅,Linux 核心也未能倖免
- 重構原生多模態!美團發布純離散基座,真正實現萬物皆 Token
- 席捲記憶體概念股、市值蒸發 900 億美元的谷歌 AI 論文,竟涉學術造假
- 工業程式碼能力開源第一!北航團隊打造真實模擬環境生成 250 萬筆驗證數據,專治工業編碼「水土不服」
- GPT-5.4、Claude Opus 等頂尖大模型被曝「假推理」:解題過程竟是「表演」?
- 智能體软件工程 #6 | buffa:來自 Anthropic AI 編碼(Rust)的方法論樣本
- vLLM 硬核四連發!2026 年 3 月重大更新深度解析
- 《駭客任務》在 Google 成真?絕密 AI 曝光:伺服器癱瘓,布林瘋狂寫代碼停不下來
- 智能體軟體工程 #4|當 Agent 寫完程式碼,誰來說「可以合併」?
- 智慧體軟體工程 #2 | 重新思考程式碼審查
- 智能體軟體工程|別再用人類的尺量 AI 的活:智能體原生工作估算
- 推理不再為 logits「搬磚」:FlashSampling 讓解碼提速 19%
- 模型已具備內省能力,但過去它的心門上了鎖|Hao 好聊論文
- 多智能體編排太繁瑣?MASFactory 用 Vibe Graphing 直接「話」出來了
- Anthropic 工程部落格最新文章:Anthropic 如何設計 Claude Code 的自動模式(Auto Mode)
- 全球最難AI考試驚天大逆轉!黑馬AI衝破36%,頂流模型集體翻車
- 大型語言模型能成為電腦嗎?
- 賦予大模型「終身學習」能力,北航 CASE 框架:編輯千次不失憶,額外參數不到 1MB丨WWW'26