カテゴリー: Transformer
- 度肝を抜かれた!MIT の研究者が Transformer 内にコンピュータを構築、LLM はもはや外部ツール不要か?
- Googleの新しい研究、大規模モデルが反復推敲する重要なトークンを発見!
- もう暴力的にClipするな!千問がGatedNormを提案、統一的な視点で残差流の玄学を解明
- Transformerの著者が率いるSakana AI、3つの論文を連続発表:長文の記憶メカニズムを徹底的に再構築
- Googleがモデルの記憶を革新し、NVIDIAが注目を再定義|Hao好聊論文
- Transformerは死んだか?DeepMindがAGIへの別の道に賭ける
- 最適化は即ち幾何、幾何は即ち推論:数学でTransformerのブラックボックス時代を終わらせる
- NASの新視点:グラフニューラルネットワーク駆動の汎用アーキテクチャ空間、ハイブリッド畳み込みとTransformerで性能向上!
- マイクロソフトらが新パラダイム「モデルチェーン」を提案、Transformerと同等の性能で拡張性と柔軟性が向上