オーストラリアの羊飼いおじさんがAIプログラミング革命を起こす！Claude Codeが「goalモード」を緊急実装、終わるまでやめられない

イラスト画像

新智元報道

編集：好困 KingZH

【新智元概要】オーストラリアの羊飼いおじさんがサッと書いた3行のbashスクリプトが、わずか11日間でOpenAI、Anthropic、Hermesの3社に採用されました。

目が覚めると、Claude Codeがまたアップデートされています！

Claudeがタスクを完了するまで作業を続けられるように、Claude Codeが最近導入した新機能が「/goal」です。

ターミナルのスクリーンショット

条件を設定するだけで、Claudeはタスクを完了するまで決して止まりません！

/goalコマンドの実行例

AIプログラミングツールを使ったことがある人なら、これがどれほど重要か分かるでしょう！

エージェントにタスクを任せたら、3ラウンド実行し、2つのファイルを修正した後、突然停止して「次に何をする必要がありますか？」と尋ねてきます。

いやいや、バグはまだ修正し終わってないでしょう！

驚きの顔のGIFアニメーション

エージェントはどんどん賢くなり、コードを書く速度も上がっていますが、「最初から最後まで一つのことをやり遂げる」ことは、2026年初頭になっても、どの企業も実現できていませんでした。

そこに、オーストラリアの羊飼いおじさん、Geoffrey Huntley氏が3行のbashで解決策を示しました。

while :; do
  cat PROMPT.md | claude-code --continue
done

彼はこれを「Ralph Loop」と名付けました。これは、『ザ・シンプソンズ』に登場する、いつも状況が飲み込めていないのに決して諦めない少年、ラルフ・ウィガムにちなんだものです。

ロジックは極めて乱暴で、無限ループを使い、同じプロンプトを何度もエージェントに送り続けます。進捗はファイルシステムとGit履歴に書き込まれ、コンテキストがいっぱいになれば新しいインスタンスを起動し、ファイルを読み込んで作業を続行します。

ラルフ・ウィガムの画像

原始的で、洗練されてはいませんが、非常に効果的です。

あまりに効果的だったため、OpenAIが目をつけ、Nous Researchが目をつけ、Anthropicも目をつけました。

11日間。3つのトップAI研究所が、期せずしてこの3行のbashを公式製品に組み込んだのです。

この瞬間、誰もが一つのことを理解しました。

汎用人工知能（AGI）へのラストワンマイルは、より賢いモデルではなく、「仕事をやり遂げる」モデルなのかもしれません。

言い換えれば、AIプログラミングの主戦場は、「コード生成」から「閉ループでの納品」へと移り変わりつつあるのです。

区切り線

11日間、3つの道筋、そして一つのゴール

4月30日、OpenAIのCodexが最初に「/goal」をリリースしました。

グレッグ・ブロックマン氏はX（旧Twitter）でただ一言、「CodexにRalph loop++が組み込まれた」と投稿しました。

グレッグ・ブロックマンのX投稿

その1週間後、Hermes Agentが追随します。さらに4日後、Claude Codeも導入しました。

11日間。3社。同じコマンド。同じ機能。

しかし、実装への道筋は大きく異なります。

Codexは「忘れない」こと、Hermesは「途中で投げ出さない」こと、Claude Codeは「自己欺瞞をしない」ことに焦点を当てています。

Codex, Hermes, Claude Codeのロゴ

Codex：目標をデータベースレコードとして保存する

OpenAIは3社の中で最も早く動き、その解決策も最もシンプルでした。

Codexにおいて、「/goal」は永続化されたワークフローオブジェクトであり、ローカルのapp-serverの状態層に保存されます。

ターミナルを閉じても、ノートパソコンを閉じても、システムを再起動しても、目標が失われることはありません。次にCodexを開くと、自動的に続きから再開されます。

Codexのインターフェース

モデルは、構造化された「update_goal」ツールを通じて進捗状況を報告し、トークン予算が尽きた際には、ハードストップではなく「ソフトランディング」がトリガーされます。

あるユーザーはこの機能を使って14時間連続稼働させ、途中で5時間の睡眠のために一時停止しましたが、戻ってみるとCodexが中断点から再開し、デバイスドライバプロジェクトを完了させていました。

工学的で、クリーンですが、控えめな設計です。

Codexのチャット画面

Hermes Agent：一人で無理なら、チームを投入する

Hermes Agentの野心は最も大きいものでした。

ここでは、「/goal」は氷山の一角に過ぎません。本当の目玉はマルチエージェントカンバンシステムであり、Hermesは「AIに仕事を完了させる」という問題を、単一エージェントの問題からチームコラボレーションの問題へと格上げしました。

Hermesエージェントのカンバンボード

カンバンの基盤はローカルのSQLiteで、永続化ストレージにより再起動後もデータは失われません。

ここでタスクカードを作成すると、Hermesはそれを直接複数のサブタスクに分解し、異なるエージェントワーカーに割り当てます。各ワーカーは独立したOSプロセスであり、独自のID、モデル設定、作業ディレクトリを持ちます。

カンバンと「/goal」は、互いに補完し合う2つのシステムです。「/goal」は単一エージェントの目標固定（Ralph loop）を管理し、カンバンは複数のエージェント間のタスクスケジューリングを管理します。前者は縦方向の深掘り、後者は横方向の展開を担います。

最後に、5層から成る「未完成対策」メカニズムが存在します。

第1層は、ハートビート検知です。各ワーカーは定期的にカンバンに報告し、自身が生存していることを証明します。

第2層は、ゾンビ回収です。ワーカーがタイムアウトして応答がない場合、システムは自動的にそれを死亡と判定し、そのタスクを回収して再割り当てします。macOSでは、特別なダーウィンゾンビ検出ロジックも備えています。

第3層は、終了の阻止です。ワーカーがタスクを完了せずに終了した場合、システムは自動的にそれをブロック状態としてマークし、新しい仕事を受けさせないようにします。これは、タスクだけを受け取って実行しない「サボり型エージェント」を防ぐためです。

第4層は、ハルシネーション（幻覚）の阻止です。これは最も厳しい層です。AIが「完了しました」と言っても、それは鵜呑みにされません。システムは、実際に生成されたコードがディスクに保存されているかどうかを検証します。エージェントが「ファイルを作成した」と報告しながら実際には作成していない場合、それを捕捉し、ロールバックし、やり直させます。

第5層は、リトライ予算です。各タスクには独立した「max_retries」が設定されており、最大N回までリトライし、超過した場合は人間に報告します。無限ループでシステムがフリーズすることは絶対にありません。

Hermesの5層防御メカニズム