カテゴリー: 拡散モデル
- 何愷明チーム、初の言語モデルを発表!105Mパラメータ、45B学習トークン、連続拡散アプローチが主流の離散DLMを正面から上回る
- 何愷明チームの「拡散モデル」新作:ラストワンマイルで離散デコード
- 高速で省エネ?わずか5%のパラメータで訓練が4倍速く!ArcFlowが「非線形」の魔法でFLUX/Qwen推論を40倍加速
- Kaiming Heの新作:拡散モデルに正則化を追加、事前学習やデータ拡張不要で、超シンプルに性能向上を実現
- Gemini Diffusion:1500トークン/秒、稲妻のような速さ!
- Gemini Diffusionよりも万能!初のマルチモーダル拡散型大規模言語モデルMMaDAが発表、強力な推論と高い制御性を両立