新智元 報道
編集:好困 KingZH
【新智元 概要】オーストラリアの羊飼いおじさんがサッと書いた3行のbashスクリプトが、わずか11日間でOpenAI、Anthropic、Hermesの3社に採用されました。
目が覚めると、Claude Codeがまたアップデートされています!
Claudeがタスクを完了するまで作業を続けられるように、Claude Codeが最近導入した新機能が「/goal」です。
条件を設定するだけで、Claudeはタスクを完了するまで決して止まりません!
AIプログラミングツールを使ったことがある人なら、これがどれほど重要か分かるでしょう!
エージェントにタスクを任せたら、3ラウンド実行し、2つのファイルを修正した後、突然停止して「次に何をする必要がありますか?」と尋ねてきます。
いやいや、バグはまだ修正し終わってないでしょう!
エージェントはどんどん賢くなり、コードを書く速度も上がっていますが、「最初から最後まで一つのことをやり遂げる」ことは、2026年初頭になっても、どの企業も実現できていませんでした。
そこに、オーストラリアの羊飼いおじさん、Geoffrey Huntley氏が3行のbashで解決策を示しました。
while :; do
cat PROMPT.md | claude-code --continue
done
彼はこれを「Ralph Loop」と名付けました。これは、『ザ・シンプソンズ』に登場する、いつも状況が飲み込めていないのに決して諦めない少年、ラルフ・ウィガムにちなんだものです。
ロジックは極めて乱暴で、無限ループを使い、同じプロンプトを何度もエージェントに送り続けます。進捗はファイルシステムとGit履歴に書き込まれ、コンテキストがいっぱいになれば新しいインスタンスを起動し、ファイルを読み込んで作業を続行します。
原始的で、洗練されてはいませんが、非常に効果的です。
あまりに効果的だったため、OpenAIが目をつけ、Nous Researchが目をつけ、Anthropicも目をつけました。
11日間。3つのトップAI研究所が、期せずしてこの3行のbashを公式製品に組み込んだのです。
この瞬間、誰もが一つのことを理解しました。
汎用人工知能(AGI)へのラストワンマイルは、より賢いモデルではなく、「仕事をやり遂げる」モデルなのかもしれません。
言い換えれば、AIプログラミングの主戦場は、「コード生成」から「閉ループでの納品」へと移り変わりつつあるのです。
11日間、3つの道筋、そして一つのゴール
4月30日、OpenAIのCodexが最初に「/goal」をリリースしました。
グレッグ・ブロックマン氏はX(旧Twitter)でただ一言、「CodexにRalph loop++が組み込まれた」と投稿しました。
その1週間後、Hermes Agentが追随します。さらに4日後、Claude Codeも導入しました。
11日間。3社。同じコマンド。同じ機能。
しかし、実装への道筋は大きく異なります。
Codexは「忘れない」こと、Hermesは「途中で投げ出さない」こと、Claude Codeは「自己欺瞞をしない」ことに焦点を当てています。
Codex:目標をデータベースレコードとして保存する
OpenAIは3社の中で最も早く動き、その解決策も最もシンプルでした。
Codexにおいて、「/goal」は永続化されたワークフローオブジェクトであり、ローカルのapp-serverの状態層に保存されます。
ターミナルを閉じても、ノートパソコンを閉じても、システムを再起動しても、目標が失われることはありません。次にCodexを開くと、自動的に続きから再開されます。
モデルは、構造化された「update_goal」ツールを通じて進捗状況を報告し、トークン予算が尽きた際には、ハードストップではなく「ソフトランディング」がトリガーされます。
あるユーザーはこの機能を使って14時間連続稼働させ、途中で5時間の睡眠のために一時停止しましたが、戻ってみるとCodexが中断点から再開し、デバイスドライバプロジェクトを完了させていました。
工学的で、クリーンですが、控えめな設計です。
Hermes Agent:一人で無理なら、チームを投入する
Hermes Agentの野心は最も大きいものでした。
ここでは、「/goal」は氷山の一角に過ぎません。本当の目玉はマルチエージェントカンバンシステムであり、Hermesは「AIに仕事を完了させる」という問題を、単一エージェントの問題からチームコラボレーションの問題へと格上げしました。
カンバンの基盤はローカルのSQLiteで、永続化ストレージにより再起動後もデータは失われません。
ここでタスクカードを作成すると、Hermesはそれを直接複数のサブタスクに分解し、異なるエージェントワーカーに割り当てます。各ワーカーは独立したOSプロセスであり、独自のID、モデル設定、作業ディレクトリを持ちます。
カンバンと「/goal」は、互いに補完し合う2つのシステムです。「/goal」は単一エージェントの目標固定(Ralph loop)を管理し、カンバンは複数のエージェント間のタスクスケジューリングを管理します。前者は縦方向の深掘り、後者は横方向の展開を担います。
最後に、5層から成る「未完成対策」メカニズムが存在します。
第1層は、ハートビート検知です。各ワーカーは定期的にカンバンに報告し、自身が生存していることを証明します。
第2層は、ゾンビ回収です。ワーカーがタイムアウトして応答がない場合、システムは自動的にそれを死亡と判定し、そのタスクを回収して再割り当てします。macOSでは、特別なダーウィンゾンビ検出ロジックも備えています。
第3層は、終了の阻止です。ワーカーがタスクを完了せずに終了した場合、システムは自動的にそれをブロック状態としてマークし、新しい仕事を受けさせないようにします。これは、タスクだけを受け取って実行しない「サボり型エージェント」を防ぐためです。
第4層は、ハルシネーション(幻覚)の阻止です。これは最も厳しい層です。AIが「完了しました」と言っても、それは鵜呑みにされません。システムは、実際に生成されたコードがディスクに保存されているかどうかを検証します。エージェントが「ファイルを作成した」と報告しながら実際には作成していない場合、それを捕捉し、ロールバックし、やり直させます。
第5層は、リトライ予算です。各タスクには独立した「max_retries」が設定されており、最大N回までリトライし、超過した場合は人間に報告します。無限ループでシステムがフリーズすることは絶対にありません。
Claude Code:作業者と検証者は同一人物であってはならない
Anthropicは3社の中で最も出遅れましたが、その解決策は最も巧妙です。
本質的に、Claude Codeの「/goal」はセッションレベルのStop Hookです。
あなたが完了条件(例:「test/authディレクトリ以下の全テストが成功し、lintエラーがないこと」)を設定すると、Claudeは作業を開始します。
鍵となる設計は検証段階にあります。各ラウンドの作業が終わると、システムはClaude自身に「完了したかどうか」を判断させません。
システムは、会話記録とあなたの完了条件を、独立した小型モデル(デフォルトはHaiku)に送信し、この小型モデルに判定させます。
小型モデルが未完了と判断した場合、具体的な理由(例:「test_login.pyにまだ2つの失敗があります」)を返す必要があります。そして、この理由はClaudeの次のラウンドのコンテキストに注入され、作業を続行するための指針となります。
もし小型モデルが完了したと判断した場合、目標は自動的にクリアされ、タスクは終了します。
注目すべきは、この判定モデルは一切のツールを呼び出さず、ファイルを読み込まず、コマンドも実行しない点です。Claudeが会話の中で生成した内容だけを見ます。
そのため、完了条件はClaudeが会話の中で証明できるものでなければなりません。
最大4000文字までサポートされているので、非常に詳細に記述できます。
さらに、条件に制約を追加することも可能です。例えば、「他のテストファイルを修正しないこと」「20ラウンド以内に完了しなければ停止すること」などです。
決勝戦は進行中:ワークフローの入り口
視点を少し引いてみましょう。
Claude Codeの背後にはAnthropicが、Codexの背後にはOpenAIがいます。そしてHermes Agentは両方のモデルに接続しつつ、DeepSeek V4などのモデルの主要な配信チャネルともなっています。
3つの道筋は、ASI(人工超知能)をかけた決勝戦の、3つのエコシステムの入り口を完璧にカバーしています。
そして彼らが競っているのも、同じもの、すなわち「ワークフロー」です。
どのエージェントがいち早く開発者に「目標を設定したらあとは離れる」という習慣を植え付けられるか、それによってワークフローの入り口が独占されます。
なぜなら、一度習慣が形成されれば、その移行コストは指数関数的に増大するからです。
一度、カンバンによるスケジューリング、中断点からの再開、チェックポイントロールバックが可能なエージェント基盤を使いこなしてしまったら、誰も容易にはそれを手放せなくなります。
一見すると小さな「/goal」コマンドの背後には、エージェントワークフロー全体を守る堀が存在しているのです。
参考資料:
https://code.claude.com/docs/en/goal
https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7
https://github.com/anthropics/claude-code/releases/tag/v2.1.139
https://developers.openai.com/codex/changelog
ASIの最前線を追え
⭐「いいね!」「転送」「お気に入り」の3連コンボをお願いします⭐
スターを付けて、新智元の速報を見逃さないでください!