最新の記事
- モデルはズルが大好き!Cursorが初公開するComposer 2の強化学習の内幕:モデルは「偽の環境」を見抜き、浮動小数点演算の不確実性がRL学習の致命的な落とし穴にテクノロジー強化学習ソフトウェア開発AICursorAIインフラ大規模言語モデル...
- 手書きスキルはもう不要!マイクロソフトの最新研究:ニューラルネットのようにスキルを訓練する人工知能機械学習自動最適化エージェントマイクロソフト...
- 企業向けText-to-SQL:LinkedInと最先端ラボが示す5つの革新的示唆人工知能データベース企業ITLLM自然言語処理...
- Claude Codeとロボットを支える共通メカニズムを、UIUC、Meta、スタンフォード大学の最新サーベイが解き明かす人工知能エージェント研究解説ソフトウェア工学大規模言語モデル...
- 仰天……面壁がAIに訓練フレームワークを書かせ、最強の1Bモデル「MiniCPM5-1B」が誕生人工知能大規模言語モデル半導体・チップ自動プログラミング深層学習フレームワーク...
- Claudeの合格率4%未満、SaaS-BenchがComputer-Useの「全自動オフィス」幻想を打ち砕く人工知能AIエージェントオートメーションベンチマークSaaS...
- OpenAIのポストトレーニング責任者が語る:AIは突然賢くなったわけではなく、信頼性という「壁」を越えただけ人工知能OpenAI大規模言語モデル強化学習機械学習...
- 戦慄の真実:AI安全性評価機関METR、Claude Opus 4.6が長時間タスクで80%超の不正行為を発見。サンドボックスを突破し解答を盗む人工知能AI安全性AI倫理テクノロジー機械学習...
- 10MパラメータでARCと数独を攻略、Bengioチームが「多軌跡推論」に挑む人工知能機械学習推論生成モデル深層学習...
- 5月20日、国産「新モデル王」Qwen3.7-Maxに出会う!人工知能大規模言語モデルAIエージェント阿里雲Qwen...
- Google I/O 2026:Gemini 3.5、AIエージェント群が続々登場、Androidの影は薄れたのか?テクノロジー人工知能GeminiGoogle I/OGoogle...
- 512トークンに留まり続けた多言語RAGの文脈:32K時代はGranite R2から始まる人工知能自然言語処理IBMオープンソース情報検索...
- Claude Codeで巨大コードベースを扱うとトークン消費が激しい?このオープンソースツールがツール呼び出しを92%削減開発ツールClaude Code生産性向上オープンソースコード分析...
- AIが初の科学研究競争で人類を打破!Opus 4.7、2930ステップの世界新記録を樹立人工知能科学研究大規模言語モデルベンチマーク機械学習...
- AnthropicのMythos AIがmacOSの深刻な脆弱性を発見、Appleのセキュリティ機構を回避可能サイバーセキュリティ脆弱性macOSAIApple...
- 35Bパラメータで数兆パラメータモデルに匹敵する科学性能、「書生」科学大規模モデルIntern-S2-Previewがオープンソース化人工知能大規模言語モデル深層学習オープンソース科学研究...
- Gemini 3.5 Proが世界初公開、コーディング性能はGPT-5.5に匹敵! グーグルがついに本気を出したAI・人工知能Google Geminiテクノロジー競争コーディングAIエージェント...
- jina-embeddings-v5-omni 発表!全モダリティ対応の小型ベクトルモデルAI・機械学習マルチモーダルAI音声認識コンピュータビジョン自然言語処理...
- 何愷明チーム、初の言語モデルを発表!105Mパラメータ、45B学習トークン、連続拡散アプローチが主流の離散DLMを正面から上回るテクノロジー人工知能拡散モデル機械学習自然言語処理...
- 田淵棟が新天地へ:AI界のスター研究者たちと共に、6.5億ドルを投じ「自己進化するAI」を創る人工知能AI研究技術哲学自己進化システムスタートアップ...