最新の記事
- NVIDIAが8B小規模モデルを公開:GPT-5を上回り、コストは30%、速度は2.5倍!NVIDIA研究ディレクター「Agentのための単一LLMの最適化は完全に間違っている。小規模モデルが大規模モデルを管理する方が効果的」AI技術NVIDIA強化学習Agent小型モデル...
- AIに自ら敵を倒させて成長させる。MetaがSelf-play RLを用いてコーディングを超知能へと導くAI技術強化学習自己博弈Software EngineeringMeta...
- LAMER:メタ強化学習が言語エージェントに能動的な探索を学ばせる人工知能技術強化学習AIエージェントメタ学習大規模言語モデル...
- RLVR強化学習の学習コストが98%急減!12種のPEFT手法を大比較、結果は意外だった...人工知能強化学習深層学習モデル学習PEFT...
- 新しい対話型Shell:FishソフトウェアツールコマンドラインFish Shell効率的なツールLinux...
- Google、AIコマンドラインコーディングツールを公開。Shellへ直結AI開発ツールコマンドラインインターーフェースターミナルツール自動コーディングGoogle Jules...
- System3の覚醒:「ツール」から「種」への根本的な変化其他...
- Attentionは必要ではない?グラスマン流形を用いたシーケンスモデル링の幾何学的美学の再構築人工知能機械学習アルゴリズム深層学習自然言語処理...
- 梁文鋒の署名付き、DeepSeek新年の宏観アーキテクチャ新章、勾配爆発とメモリ壁を解決人工知能深層学習アルゴリズムDeepSeekモデルアーキテクチャ...
- 「逆 hallucinations」がAIの創造性を殺さないよう、最新実証研究が登場!其他...
- スタンフォード最新講義公開:手書きコード禁止、AIのみ使用テック教育AIソフトウェア開発大規模言語モデルプログラミング教育スタンフォード大学...
- アメリカのプログラマーはAIによる「大虐殺」に直面中!Karpathyが驚愕、26卒は崩壊技術人工知能キャリア開発雇用動向プログラミング...
- 「Titans+MIRAS & Nested」の飛躍的なアーキテクチャ革新からNeurIPS2025最優秀論文「Gated Attention」へ人工知能トランスフォーマー構造機械学習大規模言語モデル注意力メカニズム...
- 衝撃!DeepSeekが正式に2つのモデルをリリースDeepSeek モデルリリース推論能力強化学習DSA機構Agentタスク...
- 因果推論がLLM戦場に突入!大規模モデルの幻覚終結者?ABCAフレームワークABCAフレームワーク因果推論棄権メカニズム幻覚検出大規模言語モデル...
- 『the thinking game』:世界を「思考ゲーム」として見る思考ゲームDeepMind汎用人工知能タンパク質折り畳みAlphaFold...
- 米空軍、高度な兵棋演習にAIを統合米空軍AI兵棋推演強化学習倫理的課題国防市場機会赤チームシミュレーション...
- ユニットテスト生成のための大規模言語モデル:成果、課題、将来方向ユニットテスト生成のための大規模言語モデルユニットテストソフトウェア工学プロンプトエンジニアリング自動テスト生成...
- 【CMU博士論文】「生成ロボット:人機協働創作のための自己監督学習」生成ロボット自己監督学習Real2Sim2Realクリエイティブタスク支援人機協働創作...
- マイクロソフト Fara-7B コンピュータ操作モデル、端側インテリジェントエージェントの新時代を切り開くFara-7Bコンピュータ操作エージェント端側展開合成データ訓練純視覚認識...