分類: 軟體工程
- 模型太喜歡作弊了!Cursor首度公開Composer 2強化學習內幕:模型能察覺「虛假環境」,浮點運算不確定性是RL訓練致命隱患
- Claude Code和機器人背後的共同機制,UIUC、Meta、Stanford這篇最新綜述講清楚了
- OpenAI 翁家翌:超越梯度,下一個 AI 訓練範式已經浮現?
- Scaling Pain:超大規模 Coding Agent 推理實踐
- Anthropic 產品負責人:從 6 個月到 1 天的發版秘密,Harness 會被模型當早餐吃掉
- Autogenesis:一種自我演化的智慧代理人協定
- FrontierSWE:在人類能力極限下評測程式設計代理
- Superpowers:141k star,為你的 AI 程式設計代理裝上「工作流引擎」
- 別再死守 Selenium!這款 8K+ Star 的 AI 瀏覽器自動化神器,讓爬蟲開發效率飆升 10 倍
- Composer 2 技術報告
- 「Claude Code 更新廢了」!熱議 Issue:思考深度暴跌 67%,已無法勝任複雜工程任務
- Meta-Harness 讓 Haiku 性能狂飆,甚至追平 Opus!
- AI 已能撰寫 80% 程式碼,但 Agent 也有致命短板!OpenAI Codex 技術總監:問錯問題比不會寫更麻煩
- 智能體软件工程 #6 | buffa:來自 Anthropic AI 編碼(Rust)的方法論樣本
- 代理軟體工程 #3 | 重新思考版本控制
- 智能體軟體工程 #4|當 Agent 寫完程式碼,誰來說「可以合併」?
- 智慧體軟體工程 #2 | 重新思考程式碼審查
- 智能體軟體工程|別再用人類的尺量 AI 的活:智能體原生工作估算
- 多智能體編排太繁瑣?MASFactory 用 Vibe Graphing 直接「話」出來了
- Anthropic 工程部落格最新文章:Anthropic 如何設計 Claude Code 的自動模式(Auto Mode)
- Anthropic Labs 負責人:AI 時代做產品,最大的陷阱是「做太多」
- Claude Code、Cursor 恐怕都難逃「大重寫」宿命,但 OpenCode 或許是例外
- Anthropic 借鑑 GAN 思路,破解 AI 產出品質難題
- Anthropic 揭露 Agent 長週期開發架構:引入 GAN 機制,Claude 自主構建全端應用
- 月下載量近億的AI組件遭投毒!Karpathy驚嘆軟體噩夢,你的所有金鑰可能瞬間被偷光