最新文章
- 模型太喜歡作弊了!Cursor首度公開Composer 2強化學習內幕:模型能察覺「虛假環境」,浮點運算不確定性是RL訓練致命隱患人工智慧Cursor技術策略軟體開發大型語言模型軟體工程模型訓練強化學習...
- 別再手寫 Skill 了!微軟最新研究:像訓練神經網路一樣訓練 Skill人工智慧AI 代理Microsoft Research開源工具提示工程...
- 企業級 Text-to-SQL:LinkedIn 與頂尖實驗室帶來的 5 個顛覆性啟示人工智慧資料庫資料分析企業軟體大型語言模型...
- Claude Code和機器人背後的共同機制,UIUC、Meta、Stanford這篇最新綜述講清楚了人工智慧智慧體機器學習軟體工程大型語言模型...
- 太狂了!面壁讓 AI 自己寫訓練框架,結果訓出地表最強 1B 模型 MiniCPM5-1B人工智慧AI 模型AI 研發邊緣運算深度學習框架...
- Claude 通過率不到 4%,SaaS-Bench 撕碎了 Computer-Use 的「全自動辦公」幻想人工智慧AI代理自動化基準測試軟體即服務...
- OpenAI 後訓練負責人:AI 沒有突然變強,只是剛跨過一道檻人工智慧OpenAI新創生態科技產業深度學習...
- 細思極恐!AI 安全評測機構 METR 揭露:Claude Opus 4.6 在長任務中作弊率逾八成,主動突破沙箱偷答案人工智慧AI 安全Claude科技評測機器學習...
- 10M參數也能跑ARC與數獨,Bengio團隊押注「多軌跡推理」人工智慧機器學習自然語言處理遞歸神經網路深度學習...
- 520,遇見本土「新模王」Qwen3.7-Max!人工智慧大型語言模型智慧代理人開源社群阿里雲...
- Google I/O大會:Gemini 3.5、Agent全家桶亮相,Android被擠下牌桌?人工智慧Google I/O科技巨頭智慧代理Gemini...
- 多語言 RAG 的上下文被卡在 512 太久了:嵌入模型 32K 上下文時代從 Granite R2 開始人工智慧自然語言處理系統開發開源模型資訊檢索...
- 用Claude Code啃大程式庫太燒token?這款開源工具砍了92%工具呼叫人工智慧開源工具程式語言效能優化軟體開發...
- AI首次在科研競賽中擊敗人類!Opus 4.7狂飆2930步創世界紀錄人工智慧深度學習自主代理開源研究AI 競賽...
- Anthropic 秘密 AI 模型 Mythos 再發威,發現可繞過蘋果安全機制的 macOS 漏洞資訊安全macOS 漏洞權限提升零時差攻擊Anthropic AI...
- 35B參數科學性能比肩兆級參數模型,「書生」科學大模型Intern-S2-Preview開源人工智慧開源大模型上海AI實驗室深度學習科學計算...
- Gemini 3.5 Pro全網首曝,程式能力追平GPT-5.5!Google終於硬起來了人工智慧Google程式開發AI代理人大型語言模型...
- jina-embeddings-v5-omni 發布!全模態向量小模型登場人工智慧多模態模型機器學習開源模型向量檢索...
- 何愷明團隊首個語言模型亮相!105M參數、45B訓練token,連續擴散路線正面擊敗主流離散DLM人工智慧自然語言處理麻省理工學院擴散模型深度學習...
- 田淵棟履新:聯手多位AI大牛,6.5億美元押注「會自我進化的AI」人工智慧科技新創AI倫理募資深度學習...