最新文章
所有文章

繁體中文

分類：大語言模型

大模型終於說不出髒話了！有毒子詞剪枝 ToxPrune，預訓練+推理雙重防線
豆包大模型2.1發布，程式編寫能力躍居國際第一梯隊
Qwen3.7-Plus：能看會寫還能操控螢幕，這個多模態智慧體離實用更近了
疑似 GPT-6 現身！OpenAI 聯合創辦人親揭 Spud 新模型，自帶「大模型氣味」！網友熱議：首款真正會「思考」的 AI
Xiaomi MiMo-V2.5 系列大模型正式開啟公測
你寫的 Skill 正在拖累模型？策略式 Gene 才是正解
Qwen3.6-Max-Preview 登場！下一代旗艦模型搶先看
NUS、復旦、清華聯手：首份大模型潛在空間（Latent Space）系統性綜述出爐
全球最惡名昭彰的論壇，竟發現 AI 最重要的「思考」能力
長文縮減六成＋稀疏度 95%：今日雙重突破，創下推理運算效率新紀錄
讓全網 AI 翻車的「洗車難題」，終於有人破案了
史丹佛大學實錘！多智能體推理竟是算力幻覺，同 Token 預算下單一智能體完勝
北大團隊改造 DeepSeek 注意力機制：速度提升四倍且不損精度
LLM 真實能力大起底：Python 考 90 分，Whitespace 考 0 分！AI 的「學霸」人設崩了
合成資料比真實數據更有效？Meta 論文揭示強化學習訓練大模型的突破路徑
SortedRL：大模型 RL 訓練速度提升 50%，訓練效率躍升 18%
GPT-5.4、Claude Opus 等頂尖大模型被曝「假推理」：解題過程竟是「表演」？
模型已具備內省能力，但過去它的心門上了鎖｜Hao 好聊論文
讓 AI 自己「煉數據」！DataChef 開源：用強化學習自動生成 LLM 數據配方
實作 RAG 這一年，最後悔的就是盲目導入知識圖譜
效能飆升 42%！人大與字節開源 10 萬級 SWE 資料集 Scale-SWE
Agent Skills 時代：強弱模型差異究竟多大？戳破你的「平替」幻覺｜牛津最新研究
30B模型投入科研，效能超越GPT-5.4，成績從1.7%提升至33.3%
神作！MIT 與 Google 訓練出能進行嚴格貝氏推論的 LLM 大模型
打破模型靜態權重！騰訊混元發布模型推理時即時換腦技術

←
1
2
3
→

AINews·AI 新聞聚合平台

© 2026 AINews. All rights reserved.