カテゴリー: 機械学習
- LLM の真の実力が暴かれる:Python は 90 点、Whitespace は 0 点!AI の「優等生」の仮面が剥がれ落ちる
- 合成データは実データよりも優れているのか?
- 500 件のシードデータと 4 つの自律エージェントによる自己進化で推論能力が 10.7% 向上
- ネイティブなマルチモーダルを再構築!美団が純粋離散基盤モデルを発表、まさしく「万物はすべてトークン」を実現
- GPT-5.4 や Claude Opus などの最高峰モデルが「偽の推論」を露見:その思考過程は「演技」だったのか?
- AI モデルは内省能力を既に有している、しかしその心の扉には鍵がかかっている|Hao 好聊論文
- 世界最難の試験で劇的な大逆転!黒馬AIが36%を突破、トップモデル勢は揃って失速
- 大規模言語モデルに「継続的に新知識を注入」する北航 CASE フレームワーク:1000 回の編集で記憶喪失を起こさず、追加パラメータは 1MB 未満丨 WWW'26
- 世界初、AI 科学者が『Nature』誌に掲載!アイデア創出から論文執筆までを完全自動化、人間の盲検審査も通過
- VideoSeek 長編動画理解エージェント:GPT-5 の性能を 10 ポイント向上させる秘密
- AI にデータ「錬成」を任せる!DataChef がオープンソースに:強化学習で LLM 用データレシピを自動生成
- 中国のオープンソースが初めて米国を超越:Hugging Faceが世界AIオープンソース現状レポートを発表
- NVIDIA Nemotron-Cascade 2 技術レポート:3B の活性化パラメータで IMO 金メダル級の性能を達成
- 200Mの実トークンで学習したモデルが、なぜ360Mデータ量の効果に匹敵するのか?
- OpenAI、完全自動化された「AI研究者」の構築に総力を挙げる
- RAG を 1 年運用して最も後悔したこと:知識グラフの導入
- パフォーマンスが 42% 向上!中国人民大学と ByteDance が 10 万件規模の SWE データセット「Scale-SWE」をオープンソース化
- Mamba-3: 推論効率を最優先に設計された新しい状態空間モデル
- 度肝を抜かれた!MIT の研究者が Transformer 内にコンピュータを構築、LLM はもはや外部ツール不要か?
- 神業!MIT と Google が厳密なベイズ推論を実行可能な LLM を訓練
- カラペティが寝ている間に、AI が 100 回の実験を自動実行
- モデルの静的重みを打破!騰訊混元が推論時にリアルタイムで脳を交換する技術を発表
- OpenAI幹部が明かす:博士号・論文ゼロの学部生がブログ1本でOpenAIに入社
- On-Policy Distillation とは何か?On-Policy/Self-Distillation の深層解説
- Google Gemini 3.1 Proがランキングを制覇、清華大学の姚順宇が参戦!ClaudeとGPTが追い詰められる