分類: 人工智慧
- 谷歌新發現:DeepSeek 推理分裂出多重人格,左右腦互搏越來越聰明
- 智譜新模型也用DeepSeek的MLA,蘋果M5就能跑
- 開源框架讓程式碼AI偷師GitHub!錯誤修復率飆升至69.8%,效能創紀錄
- 真·開外掛!MIT新研究:架構0改動,讓大模型解鎖千萬級上下文
- 谷歌剛掀了模型記憶的桌子,英偉達又革了注意力的命|Hao好聊論文
- 上下文爆炸怎麼破?讓Agent像生物一樣主動「忘記」
- DeepResearchEval震撼發布:首個能自動出題、智慧評分的AI研究評測框架
- Transformer已死?DeepMind正在押注另一條AGI路線
- 只剩5年?諾獎得主Hassabis放出AGI時間表:還差一兩個技術突破
- Anthropic 最新訪談:當 AI 讓知識幾乎免費,大學的價值還剩下什麼?
- Google Cloud AI負責人預測爆料:未來兩年,軟體專才將死!Google部分職位已不再要求本科!程式設計師要成為系統編排者;大學讀CS含金量會大打折扣
- Anthropic 剛發布了一份「AI 搶飯碗報告」:學歷越高越「被搶」
- GPT-5.2 連續熬夜 7 天,300 萬行程式碼打造出 Chrome 級瀏覽器
- 預訓練資料太差怎麼辦?Bengio團隊引入顯式貝葉斯,無梯度實現In-Context RL
- 剛剛,梁文鋒署名新論文深夜引爆!DeepSeek-V4 新架構曝光:提出新的稀疏化方向,與 MoE 互補,長上下文能力顯著擴展,推理程式碼能力更強了
- Menlo 風險投資:企業生成式人工智慧發展報告(2025)
- 最佳化即是幾何,幾何即是推理:用數學終結Transformer的黑盒時代
- 谷歌首席工程師自曝:公司搞了一年的項目,Claude 只用 1 小時就搞定!
- 谷歌首席工程師自曝:公司 1 年的專案,被 Claude 僅用 1 小時搞定了!
- NVIDIA開源神作:8B小模型吊打GPT5,成本僅30%,速度快2.5倍!NVIDIA研究總監:為Agent去優化單個LLM簡直是個錯誤!讓小模型管大模型更香
- 讓 AI 自己打怪升級,Meta 用 Self-play RL 把 Coding 推向超級智慧
- RLVR強化學習訓練成本暴降98%!12種PEFT方法大PK,結果讓人意外...
- Attention 並非你所需的全部?以格拉斯曼流形重構序列建模的幾何美學
- 梁文鋒署名,DeepSeek新年開啟宏觀架構新篇章,破解梯度爆炸與顯存牆
- 別讓「反幻覺」扼殺AI創造力,最新實證研究來了!