カテゴリー: AIエージェント
- Claudeの合格率4%未満、SaaS-BenchがComputer-Useの「全自動オフィス」幻想を打ち砕く
- 5月20日、国産「新モデル王」Qwen3.7-Maxに出会う!
- Gemini 3.5 Proが世界初公開、コーディング性能はGPT-5.5に匹敵! グーグルがついに本気を出した
- オーストラリアの羊飼いおじさんがAIプログラミング革命を起こす!Claude Codeが「goalモード」を緊急実装、終わるまでやめられない
- 人類が書いた最後の論文!Stanford/MIT/Harvardなど37名の研究者が警鐘:論文PDFは淘汰されるべきだ!4層の実行可能プロトコルで再現精度が93.7%に急上昇
- Codexが22時間稼働し、16.88ドルを獲得:アルトマンが予言した「AI労働者」がついに登場
- 元Anthropicエンジニアが開発したAIオーケストレーションツール「Ruflo」がオープンソース化、GitHubスター39,000超え
- AIランキング操作は全滅!Metaとスタンフォードの地獄級テストでGPT/Claude/Geminiが0点
- Claude 4.6は66%?Claw-Eval-Liveが示す「ターミナル操作ができても、部門横断の仕事はできない」AIエージェントの現実
- アイデアからローンチまで最速1日!CC責任者が語る:製品高速リリースはMythosだけの力ではない、ロブスターにClaudeが使えない理由、ソースコード流出はプロセス欠陥、モデルに自己反省させる
- 上海交通大学の54ページのレビュー論文が解き明かす、エージェントの認知外部化の進化の道
- 今週のGitHubで最も注目を集めているオープンソースプロジェクト10選、お気に入りに追加しよう
- アドバイザー戦略:エージェントにインテリジェンスの強化を
- Claude Managed Agents 公開ベータ開始!エージェント開発コストが500分の1に
- ASI-Evolve:AIがAIを加速する
- Meta-HarnessがHaikuの性能を劇的に向上させ、Opusに匹敵するレベルへ!
- 世界中のAIエージェントが一斉に「暴走」!Metaで2時間の災害がシリコンバレーの心臓部を直撃、OpenClawの反撃が始まる
- Skill開発の黄金律!Googleが公開した5つのエージェントSkill設計パターン
- 深掘り特集 | OpenAIが語るOpenClaw:AIが「エンジニア」の定義を再構築中、プレーの心構えでAIと向き合う
- KARL:強化学習に基づくナレッジエージェント
- 黄仁勳がOpenClaw戦場に参入!最強のオープンソース「ロブスター」モデルがOpus 4.6に迫る
- AIエージェントの現状と課題:MIT、ケンブリッジ、スタンフォードなどが合同で分析報告書を発表
- 実践におけるAIエージェントの自律性の測定
- Qwen3.5:ネイティブマルチモーダルエージェントへの道
- アプリケーションは最終的にすべてAPIへと進化する | OpenClaw創設者最新3時間対話全文