オーストラリアの羊飼いおじさんがAIプログラミング革命を起こす!Claude Codeが「goalモード」を緊急実装、終わるまでやめられない

イラスト画像


新智元 報道

編集:好困 KingZH

【新智元 概要】オーストラリアの羊飼いおじさんがサッと書いた3行のbashスクリプトが、わずか11日間でOpenAI、Anthropic、Hermesの3社に採用されました。

目が覚めると、Claude Codeがまたアップデートされています!

Claudeがタスクを完了するまで作業を続けられるように、Claude Codeが最近導入した新機能が「/goal」です。

ターミナルのスクリーンショット

条件を設定するだけで、Claudeはタスクを完了するまで決して止まりません!

/goalコマンドの実行例

AIプログラミングツールを使ったことがある人なら、これがどれほど重要か分かるでしょう!

エージェントにタスクを任せたら、3ラウンド実行し、2つのファイルを修正した後、突然停止して「次に何をする必要がありますか?」と尋ねてきます。

いやいや、バグはまだ修正し終わってないでしょう!

驚きの顔のGIFアニメーション

エージェントはどんどん賢くなり、コードを書く速度も上がっていますが、「最初から最後まで一つのことをやり遂げる」ことは、2026年初頭になっても、どの企業も実現できていませんでした。

そこに、オーストラリアの羊飼いおじさん、Geoffrey Huntley氏が3行のbashで解決策を示しました。

while :; do
  cat PROMPT.md | claude-code --continue
done

彼はこれを「Ralph Loop」と名付けました。これは、『ザ・シンプソンズ』に登場する、いつも状況が飲み込めていないのに決して諦めない少年、ラルフ・ウィガムにちなんだものです。

ロジックは極めて乱暴で、無限ループを使い、同じプロンプトを何度もエージェントに送り続けます。進捗はファイルシステムとGit履歴に書き込まれ、コンテキストがいっぱいになれば新しいインスタンスを起動し、ファイルを読み込んで作業を続行します。

ラルフ・ウィガムの画像

原始的で、洗練されてはいませんが、非常に効果的です。

あまりに効果的だったため、OpenAIが目をつけ、Nous Researchが目をつけ、Anthropicも目をつけました。

11日間。3つのトップAI研究所が、期せずしてこの3行のbashを公式製品に組み込んだのです。

この瞬間、誰もが一つのことを理解しました。

汎用人工知能(AGI)へのラストワンマイルは、より賢いモデルではなく、「仕事をやり遂げる」モデルなのかもしれません。

言い換えれば、AIプログラミングの主戦場は、「コード生成」から「閉ループでの納品」へと移り変わりつつあるのです。

区切り線

11日間、3つの道筋、そして一つのゴール

4月30日、OpenAIのCodexが最初に「/goal」をリリースしました。

グレッグ・ブロックマン氏はX(旧Twitter)でただ一言、「CodexにRalph loop++が組み込まれた」と投稿しました。

グレッグ・ブロックマンのX投稿

その1週間後、Hermes Agentが追随します。さらに4日後、Claude Codeも導入しました。

11日間。3社。同じコマンド。同じ機能。

しかし、実装への道筋は大きく異なります。

Codexは「忘れない」こと、Hermesは「途中で投げ出さない」こと、Claude Codeは「自己欺瞞をしない」ことに焦点を当てています。

Codex, Hermes, Claude Codeのロゴ

アイコン

Codex:目標をデータベースレコードとして保存する

OpenAIは3社の中で最も早く動き、その解決策も最もシンプルでした。

Codexにおいて、「/goal」は永続化されたワークフローオブジェクトであり、ローカルのapp-serverの状態層に保存されます。

ターミナルを閉じても、ノートパソコンを閉じても、システムを再起動しても、目標が失われることはありません。次にCodexを開くと、自動的に続きから再開されます。

Codexのインターフェース

モデルは、構造化された「update_goal」ツールを通じて進捗状況を報告し、トークン予算が尽きた際には、ハードストップではなく「ソフトランディング」がトリガーされます。

あるユーザーはこの機能を使って14時間連続稼働させ、途中で5時間の睡眠のために一時停止しましたが、戻ってみるとCodexが中断点から再開し、デバイスドライバプロジェクトを完了させていました。

工学的で、クリーンですが、控えめな設計です。

Codexのチャット画面

アイコン

Hermes Agent:一人で無理なら、チームを投入する

Hermes Agentの野心は最も大きいものでした。

ここでは、「/goal」は氷山の一角に過ぎません。本当の目玉はマルチエージェントカンバンシステムであり、Hermesは「AIに仕事を完了させる」という問題を、単一エージェントの問題からチームコラボレーションの問題へと格上げしました。

Hermesエージェントのカンバンボード

カンバンの基盤はローカルのSQLiteで、永続化ストレージにより再起動後もデータは失われません。

ここでタスクカードを作成すると、Hermesはそれを直接複数のサブタスクに分解し、異なるエージェントワーカーに割り当てます。各ワーカーは独立したOSプロセスであり、独自のID、モデル設定、作業ディレクトリを持ちます。

カンバンと「/goal」は、互いに補完し合う2つのシステムです。「/goal」は単一エージェントの目標固定(Ralph loop)を管理し、カンバンは複数のエージェント間のタスクスケジューリングを管理します。前者は縦方向の深掘り、後者は横方向の展開を担います。

最後に、5層から成る「未完成対策」メカニズムが存在します。

第1層は、ハートビート検知です。各ワーカーは定期的にカンバンに報告し、自身が生存していることを証明します。

第2層は、ゾンビ回収です。ワーカーがタイムアウトして応答がない場合、システムは自動的にそれを死亡と判定し、そのタスクを回収して再割り当てします。macOSでは、特別なダーウィンゾンビ検出ロジックも備えています。

第3層は、終了の阻止です。ワーカーがタスクを完了せずに終了した場合、システムは自動的にそれをブロック状態としてマークし、新しい仕事を受けさせないようにします。これは、タスクだけを受け取って実行しない「サボり型エージェント」を防ぐためです。

第4層は、ハルシネーション(幻覚)の阻止です。これは最も厳しい層です。AIが「完了しました」と言っても、それは鵜呑みにされません。システムは、実際に生成されたコードがディスクに保存されているかどうかを検証します。エージェントが「ファイルを作成した」と報告しながら実際には作成していない場合、それを捕捉し、ロールバックし、やり直させます。

第5層は、リトライ予算です。各タスクには独立した「max_retries」が設定されており、最大N回までリトライし、超過した場合は人間に報告します。無限ループでシステムがフリーズすることは絶対にありません。

Hermesの5層防御メカニズム

アイコン

Claude Code:作業者と検証者は同一人物であってはならない

Anthropicは3社の中で最も出遅れましたが、その解決策は最も巧妙です。

本質的に、Claude Codeの「/goal」はセッションレベルのStop Hookです。

あなたが完了条件(例:「test/authディレクトリ以下の全テストが成功し、lintエラーがないこと」)を設定すると、Claudeは作業を開始します。

Claude Codeのインターフェース

鍵となる設計は検証段階にあります。各ラウンドの作業が終わると、システムはClaude自身に「完了したかどうか」を判断させません。

システムは、会話記録とあなたの完了条件を、独立した小型モデル(デフォルトはHaiku)に送信し、この小型モデルに判定させます。

小型モデルが未完了と判断した場合、具体的な理由(例:「test_login.pyにまだ2つの失敗があります」)を返す必要があります。そして、この理由はClaudeの次のラウンドのコンテキストに注入され、作業を続行するための指針となります。

もし小型モデルが完了したと判断した場合、目標は自動的にクリアされ、タスクは終了します。

若影片無法播放,請改看 來源頁

注目すべきは、この判定モデルは一切のツールを呼び出さず、ファイルを読み込まず、コマンドも実行しない点です。Claudeが会話の中で生成した内容だけを見ます。

そのため、完了条件はClaudeが会話の中で証明できるものでなければなりません。

最大4000文字までサポートされているので、非常に詳細に記述できます。

さらに、条件に制約を追加することも可能です。例えば、「他のテストファイルを修正しないこと」「20ラウンド以内に完了しなければ停止すること」などです。

Claude Codeのgoal完了条件設定画面

区切り線

決勝戦は進行中:ワークフローの入り口

視点を少し引いてみましょう。

Claude Codeの背後にはAnthropicが、Codexの背後にはOpenAIがいます。そしてHermes Agentは両方のモデルに接続しつつ、DeepSeek V4などのモデルの主要な配信チャネルともなっています。

3つの道筋は、ASI(人工超知能)をかけた決勝戦の、3つのエコシステムの入り口を完璧にカバーしています。

そして彼らが競っているのも、同じもの、すなわち「ワークフロー」です。

どのエージェントがいち早く開発者に「目標を設定したらあとは離れる」という習慣を植え付けられるか、それによってワークフローの入り口が独占されます。

なぜなら、一度習慣が形成されれば、その移行コストは指数関数的に増大するからです。

一度、カンバンによるスケジューリング、中断点からの再開、チェックポイントロールバックが可能なエージェント基盤を使いこなしてしまったら、誰も容易にはそれを手放せなくなります。

一見すると小さな「/goal」コマンドの背後には、エージェントワークフロー全体を守る堀が存在しているのです。

参考資料:

https://code.claude.com/docs/en/goal

https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7

https://github.com/anthropics/claude-code/releases/tag/v2.1.139

https://developers.openai.com/codex/changelog

ASIの最前線を追え

⭐「いいね!」「転送」「お気に入り」の3連コンボをお願いします⭐

スターを付けて、新智元の速報を見逃さないでください!

QRコード

フォローを促す画像

関連記事

分享網址
AINews·AI 新聞聚合平台
© 2026 AINews. All rights reserved.