最新の記事
すべての記事

日本語

カテゴリー：機械学習

VideoSeek 長編動画理解エージェント：GPT-5 の性能を 10 ポイント向上させる秘密
AI にデータ「錬成」を任せる！DataChef がオープンソースに：強化学習で LLM 用データレシピを自動生成
中国のオープンソースが初めて米国を超越：Hugging Faceが世界AIオープンソース現状レポートを発表
NVIDIA Nemotron-Cascade 2 技術レポート：3B の活性化パラメータで IMO 金メダル級の性能を達成
200Mの実トークンで学習したモデルが、なぜ360Mデータ量の効果に匹敵するのか？
OpenAI、完全自動化された「AI研究者」の構築に総力を挙げる
RAG を 1 年運用して最も後悔したこと：知識グラフの導入
パフォーマンスが 42% 向上！中国人民大学と ByteDance が 10 万件規模の SWE データセット「Scale-SWE」をオープンソース化
Mamba-3: 推論効率を最優先に設計された新しい状態空間モデル
度肝を抜かれた！MIT の研究者が Transformer 内にコンピュータを構築、LLM はもはや外部ツール不要か？
神業！MIT と Google が厳密なベイズ推論を実行可能な LLM を訓練
カラペティが寝ている間に、AI が 100 回の実験を自動実行
モデルの静的重みを打破！騰訊混元が推論時にリアルタイムで脳を交換する技術を発表
OpenAI幹部が明かす：博士号・論文ゼロの学部生がブログ1本でOpenAIに入社
On-Policy Distillation とは何か？On-Policy/Self-Distillation の深層解説
Google Gemini 3.1 Proがランキングを制覇、清華大学の姚順宇が参戦！ClaudeとGPTが追い詰められる
Gemini の中心人物、伝説的エンジニア Jeff Dean 最新インタビュー：未来は一人あたり 50 人の仮想インターン時代、専門家は不要に！
苦い教訓！ROLLチームが共有：Agentic RLトレーニングにおける実践経験
小米がJudgeRLVRを発表：先に判断してから生成——推論モデルの「長い思考チェーン」の効率パラドックスを打破
コインを採掘するように活性化関数を採掘？DeepMindが「計算力マイニング場」を構築し、次世代ReLUを総当たり検索
強化学習は最適ではない、CMUが最大尤度強化学習を提案
もう暴力的にClipするな！千問がGatedNormを提案、統一的な視点で残差流の玄学を解明
Less is More: Recursive Reasoning with Tiny Networks
GPT-5.3-Codex 発表：初の自己訓練モデル
自己進化エージェントの新たなブレークスルー！MetaがDr. Zeroを発表：自発的に複雑な推論と検索能力を獲得

←
1
2
3
4
5
6
7
8
→

AINews·AI 新聞聚合平台

© 2026 AINews. All rights reserved.