最新の記事

モデルはズルが大好き！Cursorが初公開するComposer 2の強化学習の内幕：モデルは「偽の環境」を見抜き、浮動小数点演算の不確実性がRL学習の致命的な落とし穴に
テクノロジー強化学習ソフトウェア開発AICursorAIインフラ大規模言語モデル
...
手書きスキルはもう不要！マイクロソフトの最新研究：ニューラルネットのようにスキルを訓練する
人工知能機械学習自動最適化エージェントマイクロソフト
...
企業向けText-to-SQL：LinkedInと最先端ラボが示す5つの革新的示唆
人工知能データベース企業ITLLM自然言語処理
...
Claude Codeとロボットを支える共通メカニズムを、UIUC、Meta、スタンフォード大学の最新サーベイが解き明かす
人工知能エージェント研究解説ソフトウェア工学大規模言語モデル
...
仰天……面壁がAIに訓練フレームワークを書かせ、最強の1Bモデル「MiniCPM5-1B」が誕生
人工知能大規模言語モデル半導体・チップ自動プログラミング深層学習フレームワーク
...
Claudeの合格率4%未満、SaaS-BenchがComputer-Useの「全自動オフィス」幻想を打ち砕く
人工知能AIエージェントオートメーションベンチマークSaaS
...
OpenAIのポストトレーニング責任者が語る：AIは突然賢くなったわけではなく、信頼性という「壁」を越えただけ
人工知能OpenAI大規模言語モデル強化学習機械学習
...
戦慄の真実：AI安全性評価機関METR、Claude Opus 4.6が長時間タスクで80%超の不正行為を発見。サンドボックスを突破し解答を盗む
人工知能AI安全性AI倫理テクノロジー機械学習
...
10MパラメータでARCと数独を攻略、Bengioチームが「多軌跡推論」に挑む
人工知能機械学習推論生成モデル深層学習
...
5月20日、国産「新モデル王」Qwen3.7-Maxに出会う！
人工知能大規模言語モデルAIエージェント阿里雲Qwen
...
Google I/O 2026：Gemini 3.5、AIエージェント群が続々登場、Androidの影は薄れたのか？
テクノロジー人工知能GeminiGoogle I/OGoogle
...
512トークンに留まり続けた多言語RAGの文脈：32K時代はGranite R2から始まる
人工知能自然言語処理IBMオープンソース情報検索
...
Claude Codeで巨大コードベースを扱うとトークン消費が激しい？このオープンソースツールがツール呼び出しを92%削減
開発ツールClaude Code生産性向上オープンソースコード分析
...
AIが初の科学研究競争で人類を打破！Opus 4.7、2930ステップの世界新記録を樹立
人工知能科学研究大規模言語モデルベンチマーク機械学習
...
AnthropicのMythos AIがmacOSの深刻な脆弱性を発見、Appleのセキュリティ機構を回避可能
サイバーセキュリティ脆弱性macOSAIApple
...
35Bパラメータで数兆パラメータモデルに匹敵する科学性能、「書生」科学大規模モデルIntern-S2-Previewがオープンソース化
人工知能大規模言語モデル深層学習オープンソース科学研究
...
Gemini 3.5 Proが世界初公開、コーディング性能はGPT-5.5に匹敵！グーグルがついに本気を出した
AI・人工知能Google Geminiテクノロジー競争コーディングAIエージェント
...
jina-embeddings-v5-omni 発表！全モダリティ対応の小型ベクトルモデル
AI・機械学習マルチモーダルAI音声認識コンピュータビジョン自然言語処理
...
何愷明チーム、初の言語モデルを発表！105Mパラメータ、45B学習トークン、連続拡散アプローチが主流の離散DLMを正面から上回る
テクノロジー人工知能拡散モデル機械学習自然言語処理
...
田淵棟が新天地へ：AI界のスター研究者たちと共に、6.5億ドルを投じ「自己進化するAI」を創る
人工知能AI研究技術哲学自己進化システムスタートアップ
...