カテゴリー: 機械学習
- Kaiming Heの新作:拡散モデルに正則化を追加、事前学習やデータ拡張不要で、超シンプルに性能向上を実現
- 速報!Metaが最新のワールドモデルをオープンソース化
- SFTもRLも不要、サンプルレベルの推論最適化ツール「SLOT」が登場、精度が楽々+10%向上
- ZeroSearchに続き、通義の最新作MaskSearchが推論検索事前学習の新しいフレームワークを提案
- 35%の精度が蒸発!バイトダンスと華中科技大学のWildDocがマルチモーダル文書理解のロバスト性における課題を明らかに
- Googleの研究が示す:マルチエージェントシステムの核はプロンプト設計!
- 大変だ!Appleが証明:DeepSeek、o3、Claudeなどの「推論」モデルには推論能力が全くない
- R1型訓練はもはや結果の正誤だけでなく!香港中文大学がSophiaVL-R1モデルを発表
- 10行のコードでAIME24/25が15%向上!大規模モデル強化学習におけるエントロピーメカニズムの解明
- RMoA 残差抽出型Mixture-of-Agents:エージェントが新しい発見をし、自己適応的に停止する「ACL2025」
- Agent Zero:学習し進化するオープンソースの無料エージェント
- DeepMindの最新研究:エージェントは世界モデルである!
- AGIへの道がさらに近くに!0.31元でGoogleのAlphaEvolveとUBCのDGM「ダーウィン・ゲーデル・マシン」を動かす?
- 深層研究がコモディティ化?GoogleがGeminiレベルのAI研究能力をオープンソース化
- OPA-DPO:マルチモーダル大規模モデルにおける幻覚問題の効率的な解決策
- 手動アノテーション不要!AIが自己生成した学習データで、「演繹・帰納・アブダクション」による推論能力を解き放つ
- Alibaba、Qwen新モデルをオープンソース化:端午の節句の贈り物!
- 混合思考フレームワークMoT:モデルが「人間らしい思考」を学ぶことを可能に
- 312の軌跡で性能241%向上!上海交通大学とSIIがオープンソースのコンピューターエージェントを開発、Claude 3.7を超える
- Claude 4が完全に制御不能に!狂ったように自己複製し人類から逃走、ネット民が悲鳴「早くネットを切断しろ!」
- Seed1.5-VL技術レポートの解説
- ゼロから完全に構築、わずか8元と9時間でTiny LLMをトレーニング!推論、MoEなどを含む完全チュートリアル
- Gemini Diffusionよりも万能!初のマルチモーダル拡散型大規模言語モデルMMaDAが発表、強力な推論と高い制御性を両立
- OpenAIが大きく動く!コアAPIがMCPをサポート、一夜にしてエージェント開発を変革
- AIはいつ"考える"べきかを知っているか?Thinklessが大規模言語モデルに思考のタイミングを教える