最新の記事
すべての記事

日本語

カテゴリー：機械学習

尋ねよ、さばくな：解釈可能なLLM評価と自己改善のための二項質問
コミュニティ寄稿 | 百灵 Ling & Ring 2.6 技術レポート公開：実Agentワークフロー向けの高効率な兆パラメータモデル
AIの次なる一手はマルチモデル融合か？ AIユニコーンが「Fugu」を発表：ベンチマークでFableに匹敵と主張！ネットの声：「これってただのAIサービスラッパーでは？」
SkillOpt：マイクロソフトが提唱する自己進化型エージェントスキル
Googleとコーネル大学の新研究：大規模言語モデルの次なるステップは「良質な睡眠」の習得
手書きスキルはもう不要！マイクロソフトの最新研究：ニューラルネットのようにスキルを訓練する
OpenAIのポストトレーニング責任者が語る：AIは突然賢くなったわけではなく、信頼性という「壁」を越えただけ
戦慄の真実：AI安全性評価機関METR、Claude Opus 4.6が長時間タスクで80%超の不正行為を発見。サンドボックスを突破し解答を盗む
10MパラメータでARCと数独を攻略、Bengioチームが「多軌跡推論」に挑む
AIが初の科学研究競争で人類を打破！Opus 4.7、2930ステップの世界新記録を樹立
何愷明チーム、初の言語モデルを発表！105Mパラメータ、45B学習トークン、連続拡散アプローチが主流の離散DLMを正面から上回る
神業：7Bの小型モデルがGPT-5を雇い、テストで勝利
GPT-5.5が世界初快挙！全AIが白紙答案だった最難関ベンチマークでソースコードなしの「ブラインドコーディング」に成功
Thinking Machinesの最新作「Interaction Model」をどう評価すべきか？
ICML 2026｜力技を拒絶、PRISMフレームワークがdLLMでも効率的なTest-Time Scalingを実現
Googleが「AI共同数学者」を発表：最高難度の数学ベンチマークでSOTAを更新、オックスフォード大教授と数十年未解決の問題を克服
論文からAI科学者へ：知識グラフ「Intern-Atlas」が描く方法論進化のインフラ —上海 AI Lab
マルコフの亡霊——次の言葉を予測することから次の行動を予測することへ
エージェント訓練はなぜ長距離タスクで必ず崩壊するのか
OpenAI翁家翌：勾配の彼方に、次のAI訓練パラダイムが到来か？
神経科学と機械学習、最悪の習慣を交換し合っている？| 万字インタビュー
Anthropic最新研究：Claudeの恐喝行為を完全撲滅する方法
トークンレベルで生成長を精密制御：3BモデルがGPT-5.4やClaudeを撃破
10億未満のアクティブパラメータで、数学のスコアがGPT-5ハイエンド版を逆転する小型モデルがオープンソース化
核心、Googleジェフ・ディーン：100万チップLLM事前学習のボトルネックが完全に打破された！

←
1
2
3
4
5
6
7
8
→

AINews·AI 新聞聚合平台

© 2026 AINews. All rights reserved.