分類: Transformer
- 別再暴力 Clip 了!千問提出 GatedNorm,統一視角揭秘殘差流玄學
- Transformer 作者領軍,Sakana AI 連發三篇論文:徹底重構長文本的記憶機制
- Transformer已死?DeepMind正在押注另一條AGI路線
- 預訓練資料太差怎麼辦?Bengio團隊引入顯式貝葉斯,無梯度實現In-Context RL
- 最佳化即是幾何,幾何即是推理:用數學終結Transformer的黑盒時代
- NAS新視角:圖神經網路驅動的通用架構空間,卷積與Transformer混合架構性能躍升!
- Mamba 架構登上頂級會議 ICLR 2026,AI 大腦核心 Transformer 的王座還能坐穩嗎?
- 微軟等提出「模型鏈」新範式,與Transformer效能相當,擴展性與靈活性更佳