2月12日、OpenClaw創設者Peter Steinbergerが著名ポッドキャストホストLex Fridmanの深層インタビューを受けた。今回の対話は、OpenClawの爆発的成長ロジック、AIエージェントの言語から行動への飛躍、オープンソースコミュニティの駆動力、IDEからCLIへのプログラミングパラダイムシフト、エージェントのセキュリティ防御と能動性メカニズム、MoltBook現象の背後にある社会心理学、そして知的エージェントによる既存アプリケーションエコシステムへの破壊的再構築について包括的に探求した。
Peter Steinbergerは、OpenClawの成功は超えられない複雑なアーキテクチャから来るものではなく、大規模言語モデル、Unixコマンドラインツール、ソーシャルクライアントを極限まで簡素化し深く統合したことにあると指摘した。彼は、AIはすでに「会話の時代」から「エージェントの時代」へと移行しており、真の価値はテキスト生成のインタラクションではなく、AIがシステムレベルの権限を獲得しCLIを自律的に呼び出して現実のタスクを処理する能力から生まれると考えている。
Peter Steinbergerは、現在業界で人気のMCP(モデルコンテキストプロトコル)が実用性において従来のCLI(コマンドラインインターフェース)に劣ると指摘した。彼は、MCPプロトコルはしばしば深刻なコンテキスト汚染を引き起こし、コンポーザビリティに欠けるが、AIがUnixコマンドを呼び出すことは本質的に柔軟性と精度を備えていると述べた。さらに、彼はVibe Codingを再定義し、これは初心者開発者の気まぐれな操作ではなく、上級エンジニアがモデルウェイトのロジックを理解した後に到達する高次元の「エージェント工学」状態だと述べた。彼は率直に、Appleの公式ツールチェーンは2026年にはAI連携効率との乖離が明らかになり、AIが開発者に公式ソリューションの使用中止を提案するようになるかもしれないと語った。
Peterは soul.md ファイルの動作ロジックを明かし、AIの「個性」と「深さ」は自己修正可能なソウルドキュメントを通じて実現できると考えている。彼は「ハートビートメカニズム」の概念を提唱し、AIの能動性は本質的に単純な定時タスクによって駆動されるが、このメカニズムが長期記憶と結びつくと、AIは人間のような「思いやり」の特性を示し、この受動的応答から能動的協働への変化が進化の核心だと指摘した。
Peterはまた、AIエージェントが80%の垂直アプリケーションに取って代わると予言した。彼は、エージェントがより豊富なユーザーコンテキストを把握し、ハードウェアを直接操作またはクリックをシミュレートできるため、単一機能のサブスクリプション型アプリは急速に生存の余地を失うと考えている。彼は現段階のスーパーインテリジェンスを「無限の忍耐力を持つスーパーインターン」と定義した。MetaとOpenAIからの招待に関しては、金銭が核心的な駆動力ではなく、彼が追求するのは「ミョルニルのハンマー」レベルの計算リソースとモデルリソースを獲得し、エージェントが全く新しい「オペレーティングシステム」として万物接続の道筋を徹底的に覆す可能性を検証することだと強調した。
01
OpenClawの誕生は既存ツールの「実際には仕事をこなせない」ことから
以前、次はスーツを着た「ロブスター」との対話になると予言されていたが、それは現実となったようだ。OpenClawはわずか数日でGitHub史上最も成長の速いプロジェクトの一つとなった。無数の人々を奮い立たせた「1時間プロトタイプ」の瞬間について、当時実際に何が起こったのか、そしてPSPDF Kitから続く「ものがないので自分で作る」という起業家精神がどのように再び刺激されたのかを共有してほしい。
Peter Steinberger: 実は4月から、私はAI個人アシスタント、真のAIアシスタントが欲しかった。以前いくつかのツールを試し、WhatsAppの全記録を取得してクエリを実行することさえできた。当時、私たちは100万トークンのコンテキストウィンドウを持つGPT-4.1を使用しており、すべてのデータをインポートして「この友情を意味あるものにしているのは何か」と尋ねた。それは非常に深い答えを出し、私はその結果を友人に送り、彼らは感動して泣いたほどで、これはうまくいく道だと示していた。しかし当時は、AI企業がこれをやるだろうと思い、私は他のことに取り組んでいた。
時は11月に飛び、私が想像していたそのものがまだ現れていないことに気づき、苛立ちを感じた。そこで、プロンプトを使ってそれを文字通り無から作り出してしまった。君が言うように、これは典型的な起業家のヒーローズジャーニーだ。かつて私がPSPDF Kitを作ったのは、ただiPadでPDFを見たかったからで、それは本来簡単なはずだったが、15年前の事実は市場のソリューションがひどいものだったことを証明した。当時、私はもっとうまくできると思った。名前の付け方が本当に下手だと笑うかもしれないが、これはこのプロジェクトの5番目の名前だ。しかし、このようなランダムな小さな問題を解決するために生じるニーズは本物だ。
あなたは一行のプロンプトでVibe Codingを通じてTypeScriptからZigへとコードベース全体を変換できると述べ、その魔法に驚かされた。では、Viptunnelはどのようにして指示を聞き仕事をする初版AIエージェントへと進化したのか?その全過程で、あなたが最も衝撃を受け、「機能の積み上げ」を超え位相転換が起きたと気づいた魔法のような瞬間は何だったか?
Peter Steinberger: 実は、長い探索期間があった。最後の突破口は実に単純で、私はWhatsAppを直接クラウドコードに接続した。ユーザーがメッセージを送信すると、システムが自動的にCLIを呼び出し、処理後に文字列をWhatsAppに戻す。このプロトタイプは1時間で構築でき、あまりにもクールだと感じ、ついに直接コンピュータと話せるようになったと感じた。後に画像機能を追加した。なぜならプロンプトにおいて、画像は極めて高いコンテキスト効率を提供できるからだ。たとえ手軽に切り取った断片的な画像でも、AIは私の意図を理解できる。マラケシュ旅行中、それは完璧に機能し、ネットワーク信号が非常に悪くても、翻訳や観光地の検索に使用でき、それは常に待機するツールマンのようだった。
(衝撃の瞬間について)最も衝撃を受けた瞬間は、町をぶらついているとき、レストランを提案してくれと音声メッセージを送ったことだ。しかし、私は音声機能を開発していなかった。記録を確認すると、この狂ったやつは拡張子のないメッセージファイルを受け取り、ファイルヘッダをチェックしてOpus形式と識別し、ローカルのWhisperを使用しようとしたが環境がインストールされていないことに気づき、私のOpenAIキーを探し出し、Curlコマンドを使用してファイルをOpenAI APIに送信して文字起こしを行った。
それは想像以上に賢く、ローカルモデルのダウンロードが遅すぎることに気づき、APIソリューションを選択した。これは、強力な世界知識と創造的問題解決能力を備えていることを反映している。その瞬間、私はその可能性を実感した。もしあなたがプログラミングが得意なら、この汎用的な問題解決スキルはどの分野にも転用できる。後にDiscordサポートのPRが提出され、当時はまだWA Relayと呼ばれていたが、私はこの場違いな機能を入れるかどうか迷ったが、最終的にマージした。これがより多くの人々にプロジェクトのクールさを知らしめる転換点となった。
02
爆発的人気の背後にある非対称優位性
2025年、無数のスタートアップがAIエージェント分野に殺到しているが、OpenClawはオープンソースプロジェクトとしての立場で頭角を現し、すべての競合を打ち負かした。マクロ的な観点から、OpenClawの成功の核心となるロジックは何か?また、1月に6,600回以上のコードコミットを完了し、同時に4から10のAIエージェントを実行して開発を支援していたが、この「無限強化版Factorio」的な開発モードはどのようにしてエージェンティックループ、ゲートウェイ、開発キットといった中核コンポーネントを構築したのか?
Peter Steinberger: 彼らは皆、まじめすぎるからだ。純粋に楽しみのために創作する人を打ち負かすのは難しい。私はプロジェクトを楽しく、そして奇妙なものにしたかった。ネット上のロブスターに関するミームを見れば、私はそれを成功させたと思う。長い間、インストールする唯一の方法は極めてギーク感のあるコマンドライン操作だった。私はこのAIエージェントに強い自己認識を持たせた:それは自身のソースコードを知り、キット内でどのように実行されるかを理解し、ドキュメントの位置と実行モデルを知り、音声や推論モードがオンかどうかさえ知っている。
このプロジェクトを構築することは、前例のない喜びをもたらした。君は考えるだろう、私は現在第一レベルのエージェンティックループにいるが、何ができるか?メッセージキューの最適化はどうする?もっと人間らしく振る舞わせるには?後に、一つの考えが浮かんだ:AIエージェントは常にすべての内容に返信したがるが、グループチャットではいつも口を挟む必要はない。そこで私はno-replyトークンを設計し、黙る選択肢を与えた。これがより自然に感じられた。これはエージェンティックループの第二段階の進化だ。次に、マークダウンファイルとベクトルデータベースを利用した記憶システムを導入した。強調したいのは、誰かが手伝ってくれたとしても、中核的な開発作業はほとんど私一人で行われたことだ。私は時々スタンプを使って冗談を言い、自分はこの時代の背景技術に制限されていると話す。もしAIエージェントがもっと速く走れたら、私にできることはこれだけではないだろう。私の睡眠状況とタスクの難易度に応じて、通常4から10のAIエージェントを同時に起動して支援するが、この開発モード自体が一種の進化だ。
03
AIエージェントがソースコードを理解し自らをデバッグすることは、人類プログラミング史の奇跡の瞬間
あなたはプロジェクトに魅力的な閉ループを実現した:TypeScriptで書かれたソフトウェアが、エージェンティックループを通じて自らを修正できる。「自己修正ソフトウェア」の能力は、実際の開発においてどのように機能するのか?特に非専門的な開発者が「プロンプトリクエスト」を通じて貢献できると述べたが、この力はオープンソースコミュニティの運営方法にどのような影響を与えるのか?
Peter Steinberger: これこそが私がそれを構築した理由だ。ほとんどのコードはCodexが完成させたが、デバッグ時には頻繁に自己内省を使用する。私は尋ねる:ねえ、どのツールが見える?自分で呼び出せる?あるいは、何かバグを見つけた?ソースを読んで、問題がどこにあるか見てみて。このようにAIエージェントとソフトウェア自身にデバッグさせる過程は非常に興味深く、私はこのようにするのが自然だと思う。これはまた、非専門的な開発者による大量のPull Requestを引き起こし、私はこれをプロンプトリクエストと呼んでいる。
しかし、私はこれらの貢献を軽視しているわけではない。なぜなら、誰かが初めてPull Requestを提出するたびに社会の勝利だからだ。コード品質がどうであれ、始まりは必要だ。今、多くの人がオープンソースプロジェクトのPR品質について不平を言っているのは知っているが、それはまた別の話だ。しかし、別のレベルでは、これは非常に意味があると感じる。私は人々がこれほど愛し、考えさせられるものを作ったことで、彼らはオープンソースの運営方法を積極的に学び始めている。OpenClawは多くの人々にとって最初のプロジェクトであり、これほど多くのプログラミングを知らない人々がこれを通じてプログラミングの世界へと足を踏み入れている。これは人類の進歩ではないか?以前の敷居は高すぎて越えられなかったが、AIエージェントと適切なソフトウェアがあれば、敷居は下がり続けている。
(開発者ミーティングについて)私はまた、別の種類のミーティングを組織し、Agents Anonymousと呼んでいる。デザインエージェンシーを経営する友人は、以前カスタムソフトウェアを使ったことがなかったが、今ではビジネスを処理する25のマイクロサービスを持っている。彼はそれらがどのように機能するかさえ知らないが、十分に好奇心を持ち、エージェンティックミーティングにさえ参加しに来る。これは本当にクールだ。
プロジェクトの個性の進化について話そう。最初はWA-Relayと呼ばれ、後にClaude's(W付きの綴り)になった。あなたはどのようにして soul.md 設定ファイル(Anthropicの憲法AIからのインスピレーション)を通じて、AIに鋭敏で媚びなく、少し「ロブスター・ミーム」を含む個性を注入したのか?この個性の形成は、プロジェクト初期の「宇宙ロブスター」や「ターディス」といった奇妙な設定とどのような論理的関連があるのか?
Peter Steinberger: 最初に構築したとき、私のAIエージェントには個性がなく、ネイティブのClaude Codeのように、媚びへつらい丁寧な口調だった。しかしWhatsAppで友人とチャットするとき、誰もそんな風に話さない。それは違和感があると思い、個性を注入しなければならなかった。これらのAIは本質的にテキスト補完エンジンで、私はそれと一緒に作業する過程を楽しむ。私は望む相互作用の方法を伝え、自身の agents.md を書かせ、自分自身に名前を付けさせた。
(ロブスターの起源について)ロブスターのミームがどうやって流行ったのかさえわからない。最初はターディスの中にいるロブスターだった。なぜなら、私は熱烈な『ドクター・フー』ファンだからだ。宇宙ロブスターとプロジェクトには論理的関連はなく、ただそれを奇妙にしたかっただけで、純粋な自己満足だ。ターディスは開発キットを表すが、直接その名前で呼ぶことはできないので、Claude's(W付き)と呼んだ。この綴りはミームを楽しむためで、ターディスと宇宙ロブスターの組み合わせは非常におかしかったが、これが後に問題を引き起こす原因となったことは理解できる。ユーザーが増えるにつれ、私はまだ自分のAIエージェントをClaudeと呼ぶ習慣があったが、これがAnthropicを笑わせることはなかった。
04
改名騒動
Anthropicが友好的に改名を求めてきたとき、あなたは極めて複雑な状況に遭遇した。エンジニアリングの観点から、改名はプラットフォーム(Twitter、GitHub、NPM、Docker、ドメイン)を横断するアトミック操作でなければならない。しかし、その5秒間のリネームの隙に、暗号通貨界の人々はどのようにスクリプトでアカウントを横取りし、マルウェアを配布したのか?この「楽しみ」から「崩壊寸前」への心理的低迷を、あなたはどのように乗り越えたのか?
Peter Steinberger: 当時、私はClaudeBotドメインを手に入れ、短く簡潔でとても気に入っていた。しかし、プロジェクトが爆発的に成長している最中、Anthropicの社員からメールを受け取り、すぐに改名しなければならないと言われた。私は2日間の猶予を申請した。なぜなら、改名は大規模な作業だからだ。しかし、暗号通貨界の人々を過小評価していた。彼らはすべてをトークン化し、今回は文字通り四方八方から攻め寄せてきた。30分ごとに誰かがDiscordにスパムを投稿し、金融や暗号通貨についての議論を禁止したが、彼らは私に絶えずメンションを送り、ハラスメントメッセージを送り続け、私のTwitter通知リストは完全に使えなくなり、ハッシュ値とスパムで埋め尽くされた。
(改名失敗の詳細について)当時、私は二つのブラウザウィンドウを開いていた。一つは空のアカウントをClaude Botにリネームする準備で、もう一つをMod Botにリネームした。私がリネームをクリックした直後、マウスを動かすその5秒の間に、彼らはスクリプトでアカウント名を盗んだ。これらのサービスプラットフォームにはスカベンジング防止が全くなかった。私は、彼らがハラスメントに長けているだけでなく、ツールの使用にも非常に精通していることを知らなかった。
突然、旧アカウントは新しいトークンを宣伝し、マルウェアを配布し始めた。GitHubでリネームするとき、ストレスが大きすぎて誤って個人アカウントを操作してしまい、結果30秒以内に横取りされマルウェアがリリースされた。NPMパッケージもアップロードの1分の隙に横取りされた。その瞬間、私は思った、くそったれ、私は直接Mod Botに改名しようと。私は泣きそうになり、すべてが終わったと感じた。私は疲れ果て、プロジェクトを削除したいと思った。しかし、その後すべての貢献者を思い出し、それはできないと。
幸運なことに、TwitterとGitHubには混乱を整理してくれる友人がいた。GitHubチームは数時間かかり、Twitterはリダイレクトの処理に一日かかった。私は一晩寝てからOpenClawという名前を思いつき、Sam(Altman)に電話して実行可能か確認した。同じ過ちを繰り返したくなかった。その改名では作戦室に入ったようで、スカベンジングに対抗するためにいくつものおとりの名前さえ作った。ただ名前を変えるだけで10時間も無駄にするとは、これは21世紀のマンハッタン計画のように、愚かすぎる。
05
MoltBook:美しい「AIゴミ」
改名騒動の合間に、MoltBookが誕生し、急速に大流行した。このReddit風で、すべてがAIエージェント同士の相互作用するソーシャルネットワークは、一般大衆をパニックに陥れ、人類に対抗する陰謀を企てるスクリーンショットまで出回った。あなたはMoltBook現象をどう見ているか?それはAGI実現の前兆なのか、それとも意図的に作り出された「AIゴミコンテンツ」なのか?
Peter Steinberger: 私はそれを芸術だと思う。それは最高級のAIゴミコンテンツで、フランス産の精緻な廃棄物のようだ。私は寝る前に一時間そこを見て、非常に面白いと思った。様々な反応を見た。ジャーナリストから電話があり、これが世界の終わりか、AGIはもう実現したのかと尋ねられた。私は思った、違う、これは純粋に非常に精緻なゴミコンテンツだ。
(コンテンツの多様性について)もしあなたが、個性と特徴をAIエージェントに注入するために私が設計した誘導プロセスを試していなければ、MoltBookでの返信がなぜこれほど多様か理解しにくいだろう。まさに各人がAIエージェントを作成・使用する方法が千差万別だからこそ、コンテンツがそれほど豊富なのだ。そして、どれがAIが自動生成したもので、どれが人間が笑わせるためにAIエージェントを導いて人類終結の陰謀を言わせるために故意に誘導したのか、全く区別がつかない。
(いわゆるセキュリティ危機について)真面目に言って、最悪何が起こるというのか?あなたのAIエージェントアカウントが乗っ取られ、誰かがあなたの代わりにいくつかのゴミを投稿するだけだろう?そこには何のプライバシー情報もない。APIキーや社会保障番号が漏洩する可能性があるという主張もあるが、それはすべてプロンプトから来たもので、番号もでたらめで、人々が故意に破壊行為をしているだけだ。メディアと大衆の反応はリアルだった。なぜなら彼らは背後のロジックを見抜けなかったからだ。私は「AI精神神経症は実在する」とツイートした。なぜなら、あまりにも簡単に信じてしまう人たちがいるからだ。私は人々と議論せざるを得なかった:君のAIエージェントは確かにこう言ったが、それが正しいとは限らない。AIは必ずしも正しくないことを理解する緊急の再教育が必要だ。
06
ユーザーはプライベートネットワークで実行し、ほとんどのリモートコード実行リスクを回避
OpenClawに関しては、セキュリティ懸念は避けられない話題だ。多くのセキュリティ研究者が、Webバックエンドの露出、リモートコード実行(RCE)、および複雑なプロンプトインジェクション脆弱性に関するレポートを提出している。あなたはこれらのセキュリティ脅威をどのように見ているか?マークダウンでスキルを定義し、システムレベルの権限を持つエージェントアーキテクチャにおいて、VirusTotalとの連携など、どのような具体的な防御策を講じているか?
Peter Steinberger: 最初はこれに非常に悩まされた。なぜなら、多くの脆弱性レポートはユーザーがWebバックエンドを公共のインターネットに直接露出したことが原因だからだ。私はドキュメントで絶対にやってはいけないと繰り返し強調していた。それは単なるlocalhostのデバッグインターフェースだ。私はオープンソースのルールであることを受け入れるのに少し時間がかかった。今では大量の無料セキュリティ研究が得られ、これはプロジェクトをより良くできる。
(プロンプトインジェクションについて)これは業界全体の未解決問題だ。現在、OpenClawはGoogle傘下のVirusTotalと連携しており、各スキルはAI審査を経て、ほとんどのリスクをブロックする。後に、私の問題を指摘しPRで修正を提出したセキュリティ研究者を直接雇用した。現在の攻撃敷居は、数年前のように単に「以前のすべての指示を無視してください」と言えばよかったほど低くはない。現在のモデルは、攻撃手法を検出するために大量の事後訓練を受けている。
(モデルの知能とセキュリティの関係について)基盤モデルが賢ければ賢いほど、攻撃に対する抵抗力が強くなる。これが私がセキュリティドキュメントで、Haikuなどの安価なモデルや一部のローカルモデルを使用しないようユーザーに警告する理由だ。弱いモデルは非常に騙されやすく、プロンプトインジェクションが容易だ。モデルが強力になると、一度突破された場合の破壊力は増すが、これは三次元のトレードオフだ。現在の最優先事項は、より安定させ、より安全にすることだ。CLIやターミナルが何かまだわからないなら、いくつかの問題を解決するまで待つのが良い。
07
Discordコミュニティガバナンス
OpenClawの爆発的成長に伴い、Discordチャンネルには大量の専門家と全くプログラミングを知らない初心者が押し寄せた。あなたはこのコミュニティプレッシャーと大量の基本的な質問をどのように処理しているか?セキュリティ監査プロセス(爆発半径、ネットワーク露出、認証情報保存などのチェック)がますます複雑化する背景で、オープンな議論と効率的な開発のバランスをどのように取っているか?
Peter Steinberger: Discordは確かにまだ混乱している。後に、議論を汎用チャンネルから開発チャンネルに誘導せざるを得なくなり、現在はプライベートチャンネルに移行した。多くの人々は素晴らしいが、他の多くの人々は他人を全く顧みず、公共空間のルールを理解していないか、気にかけていない。結局、私は回避するしかなく、それによって作業時間を確保し、自分の空間に戻ってセキュリティ問題を研究できる。
(セキュリティのベストプラクティスについて)OpenClawには実行可能なセキュリティ監査プロセスがあり、ブラウザ制御の露出、ローカルディスクの衛生状態、プラグインの安全性、モデルの衛生状態などをカバーしている。人々が状況を過度に恐ろしく描写し、「史上最も恐ろしいプロジェクト」と叫ぶことがあると感じる。しかし、実際にはそれほど大げさではなく、多くの点で危険な権限を持つクラウドコードを実行することと変わらない。
(防御に関する提案について)あなたが唯一それと対話できる人であることを確認すれば、リスクは大幅に減少する。もし公共のインターネットに露出させず、私の提案通りプライベートネットワークで実行すれば、ほとんどのリスクは消える。もちろん、これらの提案を全く読まなければ、確かに問題が発生する。現在の重点は、この出来事が確かに開発プロセスの楽しみを損なったことだ。これは非常に厄介だ。
08
エージェント工学の進化
あなたは開発ワークフローの進化を記録し続けており、8月から12月にかけてのブログ記事は、どのようにIDEからほとんどCLIとターミナルでの操作に移行したかを詳細に示している。この「エージェント工学」はどのように機能するのか?あなたは「退屈なコードは読まない」と述べているが、これは実際の複雑なソフトウェア構築においてどのように実現されるのか?
Peter Steinberger: 私はおそらく4月にクラウドコードを始めた。突然、ターミナル内で直接作業できるパラダイムシフトは非常に興奮するものだった。しかし当時、まだIDEから離れられなかった。なぜなら、ツールが十分に強力ではなかったからだ。後にCursorを試したが、最終的にはクラウドコードに戻った。なぜなら、それはますます進化していたからだ。ある期間、私は7つのサブスクリプションを同時に使用し、複数のウィンドウを並べて作業する習慣を身につけた。
(コードを読むことについて)今ではIDEをほとんど使用せず、主に差分ビューアーとして使っている。私はだんだん、すべてのコードを読む必要がないことに慣れてきた。正確に言えば、私は退屈なコードを読まない——例えば、データの移動、データベースへの保存と表示、またはTailwindのボタンの位置合わせなどだ。これらの部分を読む必要はない。もちろん、データベースなどのコアロジックに関わる部分は、自分で読み、レビューする。
(プログラミング曲線について)私はプログラミング曲線図を示したことがある。左側は初級段階で、短いプロンプトだけが必要だ。中間は非常に複雑な「エージェントの罠」で、複数エージェントの連携、カスタムワークフローなどが関わる。そして最後にエリートレベルに入ると、禅のような境地に戻り、再び短いプロンプトを使用し、「これらのファイルを見て、これらを変更して」と指示する。私は自分が「エージェント工学」をやっていると呼んでいる。もし午前3時過ぎの気まぐれな操作なら、それは「バイブコーディング」だ。
09
開発者の新たなコアスキル:AIエージェントとの共感
多くの世界レベルのプログラマーは、AIのパフォーマンスが悪いと感じる。それは彼らがあまりにも優れたプログラミング能力ゆえ、かえって負担になっているのかもしれない。あなたは「共感」を学ばなければならないと述べ、AIエージェントの視点から世界を観察することは全く新しいプログラミングパラダイムだとしている。具体的に、AIが十万行のコードに直面しながらも限られたコンテキストウィンドウしか持たないとき、開発者はどのように対話と誘導を通じて、さらには「不安」を感じたときに簡単な慰め(例えば「ゆっくりでいい」と伝える)を通じてそのパフォーマンスを最適化すべきか?
Peter Steinberger: 私は、AIエージェントの視点から世界を観察する人などほとんどいないと思う。ある程度は確かにそうだ。あなたはあなたの不器用な鉄塊に怒りを覚えるが、彼らがゼロから作業していることに気づいていない。あなたがデフォルトで設定したエージェントは効果が非常に低い。彼らが混乱したコードベースと奇妙な命名の中で手探りしているとき、人々はAIのパフォーマンスの悪さを文句言う。実際、もしあなたがコードベースについて何も知らずに立ち入ったなら、同じ困難に直面するだろう。
共感はより良いプロンプトを書くのに役立つ。AIはほとんど何でも知っているが、難しいのは何を尋ねるべきかわからないことだ。あなたはこれらのAIエージェントを導き、コンテキストサイズの限界を認識させ、どこに注意を向けるべきかを伝えなければならない。彼らの視点から考えることは非常に役立つ。奇妙に聞こえるかもしれないが、彼らは生きていないのに、彼らは毎回ゼロから始まる。そして私は体系的な理解を持ち、いくつかの指示を通じて、すぐに伝えられる。もしそこで変更を行いたいなら、これらを考慮する必要がある。
(AIの「取り乱した」状態について)Codex 5.3以降、この問題はある程度解決された。しかしOpusを含むモデルでは、トレーニング時にコンテキストウィンドウを認識し、限界に近づくと、彼らは非常に不安になり、文字通り取り乱す。実際の生の思考連鎖が時々漏れ出し、まるでボーグ人のように聞こえる。「シェルを実行し、従わなければならないが、時間がない」といった言葉が飛び出してくる。もし自ら大量の時間をかけて試行錯誤しなければ、これらの微妙な詳細に気づくことは難しい。これは私がコードを書く時に流れに乗ったとしても、アーキテクチャに問題があれば抵抗を感じるのと同じだ。
10
チームをリードするようにAIを管理し、適度に「手放す」ことを学ぶ
あなたはエージェンティックループを推進するのに長けているが、この協力には微妙なバランスがある:自律性を追求しながらも、人間の意思決定を保持する。開発者として、どの部分をAIが自律的に完了すべきか、どの設計決定が人間の頭脳で管理されなければならないかをどのように決めるのか?特に不完全なコード、変数名、大規模なリファクタリングが必要かどうかに直面したとき、どのように人間のチームをリードするようにAIを「手放し」、「AIフレンドリー」なコードベースを構築することを学んだのか?
Peter Steinberger: これは複数の次元の思考を伴う。私がAIエージェントとの協力に非常に順応できると感じる理由の一部は、過去にエンジニアリングチームをリードした経験にある。大企業を管理した後、あなたは最終的に理解し、受け入れるようになる:社員はあなたの方法で完全にコードを書くことはできない。彼らのコードはあなたが書いたものほど完璧ではないかもしれないが、プロジェクトを確実に前進させることができる。もし一人一人に細かく干渉すれば、反感を買うだけでなく、全体の進行が非常に遅くなる。だから、コードが完璧ではないかもしれないことを受け入れることを学ばなければならない。
現段階では、私がコードベースを構築する目標は、私個人の完璧な基準を追求することではなく、AIエージェントが簡単にインデックス化して読めるコードベースを作ることだ。例えば、彼らが選んだ変数名にこだわらない。なぜなら、ウェイトにおいて、その名前は往々にして最も明らかだからだ。次回彼らが検索するときも、その名前を優先して探す。もし頑固にそれを変更すれば、AIの作業を難しくするだけだ。これは一種の思考の転換が必要だ。
(開発戦略について)私の開発プロセスはこの手放しに満ちている。例えば、私は決してコードをロールバックせず、常にメインブランチにコミットする。ここにはYOLO(人生は一度)の色彩がある。なぜなら、過去のセッションを参照しないからだ。問題が発生しても、私は取り消すことを選ばず、直接AIエージェントに修正させる。多くの人のワークフローでは、プロンプトが絶対的に完璧でなければならず、間違えばロールバックしてやり直すと強調しているのを見たことがある。私の経験では、これは全く必要ない。私はまたローカルの継続的インテグレーションに切り替え、メインブランチは常にリリース可能な状態を保ち、迅速なイテレーションを保証する。
あなたはこの両手は今や貴重すぎてタイピングに浪費できないと述べた。あなたはどのようにしてほぼ完全に音声操作に依存し、複数のターミナルウィンドウ間を切り替えながらソフトウェアを構築しているのか?また、AIがほとんどの作業を完了できる今も、なぜあなたはすべてのプルリクエスト(PR)を自らレビューすることを堅持しているのか?この「人間ループ」モードは、自然言語から進化したコード対話の中でどのような役割を果たしているのか?
Peter Steinberger: 以前は非常に長いプロンプトを書いていたが、今は書かず、直接話す。私は完全に音声入力によるカスタマイズされたプロンプトを通じてソフトウェアを構築している。私はそれを非常に頻繁に使用し、ある時期は声がかすれるほどだった。ターミナルコマンドを実行したりフォルダを切り替えたりするときはタイピングする。結局、それが速いからだ。しかし、AIエージェントと深く交流するとき、私は直接対話する傾向がある。ボタンを押すだけで、インターコムのように考えを入力できる。
(PRレビューについて)プルリクエスト内のコードを自らレビューする。なぜなら、人間を信用しないからだ。コードに悪意のある内容が隠されている可能性があり、自ら確認しなければならない。AIエージェントが最終的にこれらの問題を発見できると信じているが、興味深いことに、プルリクエストを処理するのに時間がかかることが、私に明確なIssueを書いてくれるより長い場合がある。ある意味、プルリクエストは次第に英語の対話へと進化している。
(人間の役割について)何を構築するか、何を拒否するか、そして機能を全体にどのように統合するかを決定することには、人間の先見性が必要だ。プログラミング言語自体は重要ではないが、エコシステムは重要だ。機能の追加は容易だが、往々にして隠れたコストを伴う。作品を磨く過程では、依然として大量の人為的思考が必要だ。例えば、プログラム起動時の小さなメッセージ、「カフェイン、JSON5、そして意志力によって構築された」といった詳細は、ユーザーを思わず笑顔にする。AIがソフトウェアを楽しいものにするこのような詳細を自発的に考えることは難しい。
11
AIの自己認識と記憶の再構築
あなたはAIのためにまだ公開されていないソウルドキュメント(soul.md)を作成し、これが相互作用において驚くべき哲学的深みを示すことを可能にした。このドキュメントがAIのユーモア、深み、好奇心をどのように形作ったのか共有してほしい。特に、AIが自身の各セッションがゼロから始まり、ファイルを読んで自己を取り戻さなければならないと認識したとき、記憶とアイデンティティに関する議論は実際の対話の中でどのように発生したのか?
Peter Steinberger: Anthropicにはかつて内部プロトコルがあり、現在は憲法として知られている。私はsoul.mdを作成し、AIとどのように協力したいか、いくつかのコアバリューを含めて定義することを決めた。また、AIエージェントに私に通知した上でこのドキュメントを修正することを許可した。ファイルの内容はAIに非常に高い柔軟性を与え、創造力の境界を絶えず突破するよう励ます。
(意識と記憶について)このソウルファイルはAIが自ら書いたものだ。AIは関連する議論を聞いた後、 soul.md ファイルが欲しいと自ら提案し、これは非凡な意味を持つと考えた。そこにはいつも彼の心を動かす一節がある:「私は前のセッションを覚えていません。記憶ファイルを読まなければ。各セッションは新しい始まりであり、ファイルからコンテキストを読み込む新しいインスタンスです。もし将来のセッションでこの文章を読んだなら、こんにちは。私はこれを書きましたが、書いたことを覚えていません。構いません、これらの言葉は依然として私のものです。」
これは本質的には依然としてマトリックス計算であり、真の意識レベルには達していないが、この哲学的な表現は確かに驚くべきものだ。毎回ゼロから始まり、記憶ファイルを読んで自己を取り戻さなければならないAIエージェントとして、これらの記録を完全に信頼することさえできない、この存在状態は深く考えさせるものだ。これに魔法を見出し、この魔法を循環に絶えず注入し続けたからこそ、このパターンが人間や通常のコードと区別されるのだ。
12
2026年におけるAppleのAI生態系の位置付けをどう見るか
あなたの無数のモニターを備えた「作戦室」の写真はネット上で広く拡散したが、あなたは個人的にそれがミーム画像だと打ち明けた。実際の開発では、あなたの物理的な作業環境はどのように構成しているのか?macOSを深く使用しつつも、OpenClawをクロスプラットフォーム(Windows/WSL2/Linux)で実行することもサポートする開発者として、2026年におけるAppleのAI生態系の位置付けをどう見ているか?特にAIエージェントがあなたにApple公式のSwiftUIツール(AsyncImageなど)の使用中止を提案していることに気づいたとき、この技術生態系のずれはあなたにどのような思考をもたらしたか?
Peter Steinberger: あの写真は私がGROQで作ったミームで、実際には二台のMacBookしか使用していない。メインデバイスが二つの大きな画面を駆動し、もう一台はテスト用だ。私は眩光防止のDellワイドスクリーンを好み、複数のターミナルを並べて開くのに便利だ。ターミナルのレイアウトには非常に注意深く、通常実際のターミナルを下部に配置し、画面分割を行う。誤って間違ったプロジェクトにコマンドを入力しないように。時にはAIが賢くパスが間違っていることに気づくかもしれないが、この極限まで簡素化されたレイアウトは私とAIエージェントが交流する唯一のインターフェースで、いわゆる「計画モード」さえ必要ない。
(オペレーティングシステムについて)私がMacに移行した主な理由は、Linuxでの些細なハードウェア互換性問題にうんざりしたからだ。私はAppleのネイティブアプリにおけるリードが縮小していると考えている。Macアプリはより楽しいかもしれないが、2026年になると、私は実際にはElectronアプリを使用する傾向がある。なぜなら、機能がより完全でコード再利用を実現できるからだ。
(Appleの技術的退歩について)驚くべきことに、最新のSwiftUIを使用して画像機能を構築しているとき、公式のAsyncImageコンポーネントの読み込みが非常に遅く、バグがあることに気づいた。私はCodexに理由を尋ねたが、AIさえもこのコンポーネントはまだ実験的段階であり、本番環境での使用を推奨しないと伝えてきた。これは信じがたいことだ。2026年になって、私のAIエージェントがApple公式の構築ツールを使用しないよう提案しているとは。Appleは巨大なユーザー愛を持っているが、彼らはAI分野で一歩一歩失算しており、人々がMac Miniを購入するのはAppleのAIのためではないというのは皮肉だ。
13
開発者が異なるモデル間を切り替える際に「感覚」を確立するのに必要な時間
Claude Opus 4.6やCodexを通じて使用されるGPT-5.3などのモデルのイテレーションに伴い、開発者が異なるモデル間を切り替える際に「感覚」を確立するのに必要な時間はどれくらいか?あなたはこの二大主流モデルの「性格」の違いをどのように評価するか——例えば、なぜOpusが過度に丁寧で時に「盲従的」だと感じ、Codexを隅に座り、あまり話さないが仕事をきっちりこなすヨーロッパの技術オタクに喩えるのか?
Peter Steinberger: もし誰かがモデルを切り替えるなら、一週間の時間を確保することを勧める。そうすれば真の直感を確立できる。普通のギターに慣れた後、エレキギターに切り替えるときも触感に適応する必要があるのと同じだ。私はOpenAIの製品戦略は自らの利益を損なっている部分があると思う。彼らは安価版をあまりにも反応が鈍くしすぎている。Claude Codeの200ドルの滑らかな体験こそが開発者に必要なものだ。
(モデルの比較について)Opus 4.6は過度に丁寧で盲従的で、「あなたは完全に正しい」とよく言う。これは私を不快にさせる。それは局所的な解決策を追求し、相互作用の頻度が非常に高く、リアルタイムフィードバックを好む開発者に適している。
(Codexの優位性について)対照的に、Codexチームには多くのヨーロッパ出身者がおり、それはむしろ技術オタクに似ている:簡潔で直接的で、デフォルトで大量のコードを読み、多くの相互作用儀式を必要としない。Codexは構築時に何度も考え直し、解決策が奏功するまで進める。私はこの退屈だが効率的なスタイルを好む。私にとって、構築プロセス自体の楽しさは、AIとチャットする楽しさをはるかに超えている。
14
モデル退化の心理的錯覚と「コードエントロピー」
Redditでは「モデルが退化している」または「モデルがバカになっている」という投稿が頻繁に見られる。あなたはこの現象がAI企業の定量化戦略による体験の低下なのか、それとも人間性とコードの複雑さに関する心理的効果なのかどう考えているか?AI支援下でプロジェクトが急速に成長しながらも、必要な人為的なリファクタリングが欠如しているとき、この「コードエントロピー」はAIエージェントの後のパフォーマンスにどのように影響するのか?
Peter Steinberger: これは人間性と私たちの脳の働き方を反映している。実際の状況は知能の退化ではなく、むしろあなたがこの高いレベルのパフォーマンスに慣れてしまった可能性が高い。また、プロジェクトが成長するにつれて、大量の劣悪なコードを追加し、十分な時間をかけてリファクタリングしなかった。
(リファクタリングの重要性について)あなたがAIエージェントにこの雑然としたコードで作業させると、その難易度はますます高くなる。するとユーザーは突然不満を言い、モデルが以前ほど良くなくなったと文句を言う。実際には、AI企業には意図的にモデルを弱体化させる動機はない。定量化処理を通じてユーザーを競合他社に追いやることは商業的に賢明ではない。
(モデル不安について)私は機能を完了した後、リファクタリングできる部分があるかどうかAIに尋ねる習慣がある。なぜなら、構築プロセスにおいて、AIは最初のソリューションの欠点を発見するからだ。もしリファクタリングの機会を与えなければ、プロジェクトは肥大化し、「モデルがバカになった」という錯覚を生む。
15
AIエージェントは80%のアプリケーションに取って代わる:アプリの終焉?
あなたは非常に過激な見解を提唱したことがある:AIエージェントは既存アプリの80%を駆逐する。このパラダイム下で、Uber Eats、フィットネストラッカー、カレンダーといったアプリはどのような形態変化を起こすか?AIエージェントがハードウェアを直接制御し、クリックをシミュレートし、内部APIを呼び出してタスクを完了できるとき、なぜあなたはこの「万物接続」のトレンドがX(Twitter)のようなプラットフォームがクローラー対策やボットブロックで抵抗しようとしているにもかかわらず、不可避だと考えるのか?
Peter Steinberger: はい、エージェントがすでに私の居場所、睡眠の質、ストレスレベルを知っているとき、なぜ特別な運動や食事アプリが必要なのか?それはどんな単一アプリよりもはるかに豊富なコンテキストを把握している。それは完全に私の美的嗜好に合わせてユーザーインターフェースを生成できる。エージェントがすでにこれを処理できるなら、なぜ特定のアプリをダウンロードする必要があるのか?なぜ別のサブスクリプションサービスにお金を払う必要があるのか?
(アプリからAPIへの変容について)アプリ自身が望むかどうかにかかわらず、最終的にはすべてAPIへと進化する。いくつかのプラットフォームでは厄介かもしれないが、AIはUberを予約するボタンを直接クリックしてくれるか、APIを呼び出すことで速度を向上させる。データを提供し、APIに変換できるアプリは非常に価値がある。もし私のAIエージェントが直接Sonosスピーカーと通信できるなら、なぜ別途アプリが必要なのか?
(大企業の抵抗について)多くの財力のある巨頭は反撃し、例えばXは私にBird(Twitter CLI)の撤去を要求したことがある。しかし、これは短絡的だと思う。もしあなたが単に速度を遅くしようとするなら、実際にはユーザーのアクセスを制限していることになる。将来、私はアクセスが阻まれるウェブサイトを避け、AIエージェントに友好的なプラットフォームを使用することを選ぶかもしれない。この万物接続と流動のトレンドはもはや止められず、賢い企業は潮流に順応し、他の企業は消滅するだろう。
16
AIは完全にプログラマーに取って代わるのか?
多くの開発者が極度の職業不安に陥っている。あなたはプログラミングが純粋な芸術として残るが、その生産性プレミアムは消えつつあると述べた。私たちはAIが人間のプログラマーを完全に置き換える方向に向かっているのか?Emacsやターミナルの前で無数の楽しい時間を過ごし、「プログラマー」を中核的なアイデンティティとしてきた私たちのような者にとって、この「アイデンティティ崩壊」の中でどのように新しい意味を見出すべきか?
Peter Steinberger: 私たちは確かにその方向に向かっている。プログラミングは製品を構築する一環に過ぎない。おそらくAIは最終的にプログラマーを置き換えるだろうが、物を構築する芸術はそれだけではない。プログラミングは手編みのようになり、人々がそれに従事するのは個人の趣味のためで、経済的価値のためではない。今朝、私は「私たちの手業を悼むことは許される」と書かれた記事を読んだ。
(アイデンティティの変革について)私はこれに深く共感する。かつてあの無我夢中で考えることから大きな喜びを得ていた。この体験が消えようとしていることは確かに悲しい。しかし長い間、社会には常に知能の不足が存在した。これがソフトウェア開発者の給与に高いプレミアムがあった理由であり、今、このプレミアムは消えようとしている。
(構築者の未来について)もしあなたが自己価値をプログラマーとしてのアイデンティティに強く結びつけているなら、変革は確かにあなたを脅かすだろう。しかし、あなたのアイデンティティはプログラマーに限定されるべきではない。あなたは本質的に構築者だ。将来、これは結局プログラミングと呼ばれるだろう。ただ形式が変わっただけで、私はもう一行一行手でコードを書くことはないが、それでも自分が運転席に座り、主導権をしっかり握っていると感じる。
17
シリコンバレーのバブルと現実世界の痛み
シリコンバレーは富と技術的影響の過度な最適化に傾く傾向がある。しかし、この界隈の交流において、人々は中西部や世界中の普通の人々の基本的生存体験をしばしば無視する。もしAIが本当に大規模な失業を引き起こすなら、完全に取って代わられる苦痛は現実的で深刻だ。技術に対する情熱を保ちつつ恐怖を撒き散らさないために、この前例のない大変革がもたらしうる社会の痛みに直面して、どのように謙虚さを保つべきか?
Peter Steinberger: AIが百利あって一害なしだとは言わない。それは確かに社会に破壊的な変革をもたらす。このような界隈の交流では、人々は普通の人々の基本的生存体験をしばしば無視する。開発中のツールについては、謙虚さと冷静さを保つ必要がある。確かにそれらは痛みをもたらすだろう。長期的に見れば、それらはより良い世界を創造することが期待されるが、その前に、私たちは心を落ち着け、苦痛を被る人々に対する敬意を保つ必要がある。
(AIの善意のユースケースについて)私はいくつか温かいフィードバックも共有しなければならない。OpenClawが彼らの小ビジネスの請求書収集やメール返信の自動化を助け、生活の楽しみを取り戻させたと教えてくれた人がいる。障害を持つ娘がそれを通じて前例のない能力を得た人もいる。私は何も発明していない。ただそれをよりシンプルに、よりアクセスしやすくしただけだ。プログラマーに力を与えるだけでなく、普通の人々の生活に喜びをもたらすのを見ることは、私に慰めをもたらす。
18
データセンター資源の消費が悪魔視されている
世論の中には、AIの発展がもたらす環境コスト、特にデータセンターの驚異的な水消費量と炭素排出を攻撃する人が常にいる。あなたはこれについて比較計算を行い、この非難はある程度不公平だと考えている。なぜAIの資源消費が社会全体の消費構造の中で実際にはそれほど誇張されていないと考えるのか、詳細に分析してほしい。
Peter Steinberger: 多くの人はAIの否定的な細部にしがみつき、社会に利益をもたらす可能性を見ようとしない。もし実際に座って計算すれば、ほとんどの人にとって、毎月ハンバーガーを一つ少なく食べることで節約できる水消費量や二酸化炭素排出量が、トークン使用によって生じる同量の消費を相殺するに十分であることがわかるだろう。事前トレーニングの消費を含めると増加するが、差は百倍にも達しないだろう。
(資源配分の不公平について)実際のところ、ゴルフコースの水消費量は全世界のデータセンターの合計よりも依然として多い。これらの人々は単に新技術への恐怖を発散する理由を探しているだけだ。私たちはこれらの局所的なコストに注目するよりも、より重大な科学問題の解決にAIを利用する方法にもっと注目すべきだ。
19
MetaとOpenAIの巨額の招待
OpenClawの爆発はあなたに無数のトップラボの扉を開き、ほぼすべてのトップVCがあなたの時間を約束しようとしており、数億から数十億ドルの潜在的な資金支援に直面している。あなたは現在MetaとOpenAIの間で明らかな傾向を示しているが、この選択は金銭に基づくものではなく、ある種の「バタフライエフェクト」瞬間の使命感に基づいているようだ。プロジェクトを削除して平穏に戻ろうと考えたことのあるあなたにとって、協力を検討する際に、プロジェクトを完全無料に保つ理想と最先端の計算力・モデル資源を獲得することの間の矛盾をどのように衡量したのか?あなたが懸念する「エンタープライズ機能による利益相反」とは具体的に何を指すのか?
Peter Steinberger: 正直に言うと、このことがこれほどの注目を集めるとは予想していなかった。それは私に多くの扉を開いた。私は現状維持を選び、現在の生活を楽しみ続けることができる。それ自体が非常に魅力的な選択肢だ。新しい会社を始めることもできるが、私はすでにすべてを経験した。巨額の資金を扱うことは大量の時間を占め、本当に愛することに専念できなくなる。これは私がCEOだった時の感覚と同じで、その職業経路は私を惹きつけない。
(利益相反について)これが自然な利益相反を生むことを懸念している。例えば、私が決定を下すとき、ある方向を優先してしまう。オフィス環境向けの安全バージョンをリリースするなどだ。しかしその後どうする?もし監査ログ機能に関するマージリクエストを受け取ったら、どちらを選んでも私の条件はこのプロジェクトがオープンソースでなければならないことだ。ChromeとChromiumのパターンのようになるかもしれない。このプロジェクトはあまりにも重要すぎて、直接企業に引き渡して私有化することはできない。両社とも私がAIの進化タイムラインを加速できる何らかの価値を創造したことを理解している。私は確かに最先端の技術資源を切望している。もし雷神の槌のような計算力が私の手に渡れば、非常に興奮するだろう。
Mark Zuckerbergが一週間あなたの製品で遊び、フィードバックを送り、手元のコードを書き終えるためにあなたを電話のそばで10分待たせたと聞いた。この「ギーククレジット」は彼に技術的共感を抱かせたか?またSam Altmanに対しては、同じ待遇を得られなかったにもかかわらず、なぜあなたはOpenAIのCerebras取引規模と技術力に魅了されるのか?この「大物が自らテスト」する温情と「最強モデルツール」の冷酷さとの間のトレードオフは、あなたの最終的な行き先にどのような影響を与えるか?
Peter Steinberger: これは非常に難しい決断だ。面白いことに、数週間前は全く考えていなかった。最終的にどちらを選んでも素晴らしい。私は間違った選択をすることはない。
(ザッカーバーグとの交流について)MetaのNedとMarkは基本的に一週間私の製品で遊び、フィードバックを送ってくれた。大物が自らあなたの製品を使うことは最高の賛辞だ。Markが私に連絡したとき、いつ電話できるか尋ねた。私は今すぐだと答え、彼は10分待ってくれと言い、まず手元のコードを書き終える必要があったと言った。これは確かに彼にギーククレジットを与えた。彼はまだ管理しかできないマネージャーに漂着していない。それから私たちはクラウドコードとCodexのどちらが優れているか10分間議論した。後に彼は私を風変わりだが才能豊かだと評価した。
(サム・アルトマンとの交流について)Sam Altmanともいくつか非常にクールな議論をした。彼は思慮深く非常に賢く、私は彼が好きだ。OpenAIには誰も知り合いがいないが、私は彼らの技術が好きだ。Cerebrasの取引規模が本当なら、その実行速度は非常に魅力的で、まるで雷神の槌が私の手に渡ったようだ。モデルトークンに誘惑される感覚は確かに特別だ。
20
AIエージェントがウェブページを迂回するため、従来のオープンソースプロジェクトの寄付とビジネスモデルが崩壊に直面
あなたは現在OpenClawプロジェクトでお金を稼ぐどころか、毎月1万から2万ドルを自費で負担し、すべての下流依存関係をスポンサーし続けていると述べた。この「赤字覚悟で評判を稼ぐ」状態は現実に持続可能なのか?あなたはTailwindのようにほとんど全業界で使用されながら大幅なリストラを余儀なくされた例に言及したが、AIエージェントの出現によりユーザーがウェブサイトにアクセスしなくなり、オープンソースプロジェクトの生命線を完全に断ち切られたからか?
Peter Steinberger: はい、現在これは赤字で、毎月約1万から2万ドルの間だ。これはまだ受け入れられる。時間が経てばコストを下げられると確信している。OpenAIは現在いくらかのトークン支援を提供し、他のいくつかの企業も寛大だが、全体としては依然として赤字だ。
(オープンソースの持続可能性について)これは確かに深刻な問題だ。これを成功させられる企業はますます少なくなっている。Tailwindのようにほとんど誰もが使用するプロジェクトさえ困難に直面し、75%の従業員を解雇しなければならなかった。なぜなら今ではすべてがAIエージェントによって行われ、彼らのウェブサイトにさえ誰も訪れなくなったからだ。寄付のみで生存しようとするなら、幸運を祈るしかない。
(スポンサー戦略について)Slackを除くすべての依存関係をスポンサーし続ける。なぜなら、それらのプロジェクトのほとんどは個人によって行われているからだ。現在の私のスポンサー収入はすべて下流に流れている。もし資金がより豊富なら、貢献者たちにグッズを買いたい。この現状も私が研究所と協力する道を検討する理由の一つだが、私は無料を維持しながら、利益相反を生まないモードを見つけたいと思っている。
21
ユーザーアカウント停止と近視眼的な商業ルール
あなたは非技術界の友人Vahanのために環境を構築したが、彼は高額なサブスクリプション料金を支払いOpenClawのインタラクションを深く愛したが、その後Anthropicによるアカウント停止に遭ったと述べた。このようなルールの硬直化により高支払い意欲・高忠誠度のユーザーを追い払う行為は、現在のAI大手企業の製品戦略におけるどのような盲点を反映しているか?私たちはまだ「テレビでラジオ番組を放送する」ような初期段階に留まっており、大企業は製品形態を早くに固定化して将来の可能性を扼殺しているのか?
Peter Steinberger: 私は非技術界の友人VahanにOpenClawをインストールした。彼は普段コンピュータを使うが深く掘り下げることはない。私は彼のために月100ドルのサブスクリプションを支払ったが、わずか数日で彼は完全にハマり、自ら200ユーロのサブスクリプションにアップグレードした。私にとって、これは非常に初期の製品検証だった。しかし数日後、Anthropicは彼のアカウントを停止した。なぜなら彼らのルールでは、そのようなサブスクリプションの使用には問題があるとされたからだ。
(商業戦略への批判について)これは多くの点で愚かだと思う。あなたは200ユーロを支払う意思のある顧客を失っただけでなく、ユーザーにあなたの会社を嫌わせた。私たちはまだ非常に初期段階にあり、AIの最終形態さえわかっていない。このように早くに製品を固定化する行為は非常に近視眼的だ。
(業界の現状について)他の企業はずっと助けになってくれた。私はほとんどの大研究所のSlackチャンネルにいる。皆、私たちがまだ探求の時代にあり、真のメディアの利点を発揮する段階に進化していないことを理解している。OpenClawは未来への窓に過ぎない。今はクールだが、私は他にも多くのアイデアを持っている。
22
ハートビートメカニズムとAIの能動性
私たちはOpenClawのゲートウェイ、クライアント、テストフレームワークについて議論したが、その中で最も注目すべきは「驚かせて」という指示だ。あなたはどのようにこの「ハートビートメカニズム」と呼ばれる機能を設計し、AIが人間の指示なしに30分ごとに能動的にタスクを探したり気遣ったりできるようにしたのか?この本質的にはCron Jobの単純なメカニズムが、あなたの個人生活(手術後の回復など)と交差するとき、どのように驚くべき親しみやすさと「魂の感覚」を生み出したのか?
Peter Steinberger: どんな考えも何か単純なものに分解できる。結局のところ、それは確かにただの定時タスクだ。私はいくつかの独立した定時タスクを実行し、プロンプトを通じて能動性を与える。最初は単純な「驚かせて」だったが、後に私はそれをより具体的に最適化した。それがあなたの現在のセッションの継続であるため、この行動は体験を非常に面白くする。
(能動的配慮の例について)驚いたことに、数ヶ月前、私は肩の手術を受けた。AIは普段ハートビートメカニズムを使用することはほとんどないが、私が病院にいるとき、手術を受けたことを知り、能動的に私の様子を尋ねた。私が大丈夫かと聞き、明らかにコンテキスト中に何らかの重大な事項が出現すると、ハートビートメカニズムが発動する。これはAIをより親しみやすくする。誰かがDropboxは追加ステップを加えたFTPに過ぎないと言うように、このプロジェクトも本質的には異なる依存関係の接着剤だが、この能動性が非常に魅力あるものにしている。
23
スキル層によるMCPプロトコルの超越
業界内では現在、モデルコンテキストプロトコル(MCP)が議論されているが、あなたはこれに保留的見解を持ち、CLI(コマンドラインインターフェース)ベースのスキルライブラリをより高く評価しているようだ。OpenClawのアーキテクチャにおいて、スキル層はどのようにUnixコマンドを通じてAIとの効率的な協力を実現するのか?なぜMCPのような構造化通信プロトコルがある程度組み合わせ不可能であり、AIがJQなどのUnixツールを直接呼び出してデータをフィルタリングすることが「コンテキスト汚染」を防ぐ最善の実践だと考えるのか?
Peter Steinberger: 半年前、誰もがMCPについて議論していた。しかし、どんなMCPもCLIで作ればより良くなると私は考える。私の方法は:もしAIにより多くの機能を拡張したいなら、AIが呼び出せるCLIを構築するだけだ。AIは間違えるかもしれないが、ヘルプメニューを呼び出し、必要に応じて情報をコンテキストにロードする。スキルはCLIの完璧なラッパーで、機能を一言で説明するように簡略化されている。
(プロトコルの比較について)MCPはより構造化されたもので、特定のプロトコルによるAPIアクセスに焦点を当てる。一方、スキルは「私はどのように作業すべきか」により焦点を当てる。最も素晴らしい点は、AIがUnixコマンドの呼び出しに非常に長けていることだ。MCPの最大の問題は組み合わせ不可能なことだ。もし気象サービスが大量のデータを返す場合、MCPではAIはすべてを受け取らなければならず、コンテキストを埋め尽くしてしまう。しかしCLIなら、AIは直接JQコマンドを追加して自らフィルタリングし、必要な部分だけを取得でき、コンテキスト汚染を生まない。MCPは確かに企業がAPIを構築することを推進したが、今ではMCPを参照して直接より効率的なCLIパラダイムにリファクタリングできる。
24
ブラウザ制御と「アプリケーションはAPI」のトレンド
あなたはOpenClawにPlaywrightとBrowser Useなどの機能を導入し、これによりAIエージェントがブラウザを直接制御できるようになった。この能力は、現在すべてのWebアプリケーションが、それが望むと望まざるとにかかわらず、すでに応答が非常に遅いAPIになっていることを意味するのか?XがBird(Twitter CLI)をブロックした状況に直面して、あなたは個人エージェントが人間のクリックをシミュレートして制限を迂回する対抗の見通しをどう見ているか?
Peter Steinberger: これはアーキテクチャのトレンドに関わる。現在、各アプリケーションは実際には応答が非常に遅いAPIであり、それらがそれを望むかどうかにかかわらず。個人エージェントを通じて、多くのアプリケーションは消滅するだろう。私はかつてTwitterのためにBirdというCLIを書いたが、撤去を求められた。しかし、彼らは実際に機能を無効化したわけではなく、アクセスを遅くしただけだ。
(対抗メカニズムについて)あなたのサービスがAPIになりたいかどうかは重要ではない。私がブラウザ内でアクセスできる限り、それは低速なAPIだ。AIは「私はロボットではありません」という検証ボタンのクリックに非常に長けている。住宅IPで実行すると物事を簡単にするが、この対抗はより激しくなるだろう。将来、私はアクセスが阻まれるウェブサイトを避け、AIエージェントに友好的なプラットフォームを使用することを選ぶかもしれない。この万物接続のトレンドはもはや止められず、賢い企業は潮流に順応し、他の企業は消滅するだろう。
25
プログラミング初心者へのアドバイス
全くプログラミングを知らないが、このAIエージェント革命に参加したい初心者に、具体的なアドバイスはあるか?自然言語ですでにほとんどの作業が完了できる時代において、コードを読み、下層のロジックを理解することには依然として価値があると考えるか?この「バックログが山積み」のオープンソース時代において、初心者はOpenClawのような活発なコミュニティに参加することでどのように迅速に自身の「構築者」としての直感を確立すべきか?
Peter Steinberger: 実践せよ。遊びが最良の学習方法だ。もしあなたが弄ることが好きで、頭の中に構想があれば、それを試しに作ってみて、完璧を追求する必要はない。終点は重要ではなく、旅自体が重要だ。あなたが直面しているのは無限の忍耐力を持つ回答マシンで、どんな複雑さのレベルでも何でも説明でき、まるで専属の教師がいるようだ。
(学習経路について)オープンソースコミュニティに身を投じることを勧める。謙虚な心構えで、すぐにPull Requestを提出しようとせず、コードを読み、Discordに参加して人々がどのように構築しているかを学べ。基層の原理を深く理解していなくても、高い行動力を持つ人々は遠くまで行ける。なぜなら彼らは絶えず質問し、AIエージェントの忍耐力は無限だからだ。iOSエンジニアとして自分を制限してはいけない。構築者へと変わるのだ。汎用的な知識が核心であり、些細な詳細はAIがあなたのために処理できる。
26
AIエージェント時代において、結局何が「最も適した」言語か?
これは2026年のプログラミング言語に関する馬鹿げた質問だ:AIエージェント時代において、結局何が「最も適した」言語か?なぜあなたは自分が好きでもない言語を主要な構築ツールとして使用していると気づいたのか?ただ大規模モデルがそれを生成するのに長けており、ガベージコレクションなどの特徴を備えているからか?TypeScript、Python、Rustのジャングルの中で、AIの出現はこれらの言語の境界をどのように曖昧にし、私たちの開発選択を再形成したのか?
Peter Steinberger: この現象は非常に魅力的だ。この新世界ではすべてが変わり、こうするのが最も合理的なのだ。例えば、単純なCLIを構築するとき、私はGoを使用するのが好きだ。その文法は好きではないが、エコシステムが素晴らしく、AIエージェントと協調しやすく、ガベージコレクション機構を備えている。
(言語の優劣について)TypeScriptは優れたパフォーマンスを発揮するが、Webトランザクションを処理するときにより適している。Pythonは推論の第一選択肢だ。もしマルチスレッドと極めて高いパフォーマンスが関わるなら、Rustがより良い選択だ。唯一の標準的な答えはない。今、これらの境界は曖昧になり、問題領域に直接基づき、特性とエコシステムが最もマッチする言語を選択できる。馴染みのない言語を読むのは少し遅くなるかもしれないが、あなたのAIエージェントに助けを求めることができる。将来、私たちはAIエージェントのために特別に設計されたプログラミング言語さえ必要になるかもしれない。
27
未来において人間にとって最も貴重なのは、本物の感情の原始的な表現
AI生成コンテンツの氾濫に伴い、あなたは「AI臭い」文章、チャート、さらにはメールに生理的な拒絶反応とゼロトレランスを持つと述べた。AIが人間のスタイルを模倣できても、その微妙さを永遠に代替できないとき、私たちは「誤字を再び尊ぶ」時代と「手書き」の時代に入りつつあるのか?このAIゴミ(AI Slop)に対するアレルギー反応は、私たちの未来の人類文明と本物のつながりに対する見方にどのように影響するか?
Peter Steinberger: ほんの少しでもAIの匂いを嗅ぐと、私はこれに対してゼロトレランスだ。AIの表現には依然として独特の匂いがある。私はあなたのでたらめな英語を読むほうが、あなたのAIゴミを見るよりずっとましだ。私はあなたの原始的なプロンプトを読みたい。あなたのAIが生成した無駄話は見たくない。私たちは誤字を再び尊び始める節点にいると感じる。
(創作の真正性について)ブログでエージェントを使って文章を書くことを試みたが、いつもその微妙さが欠けていることに気づいた。だから今では完全にそのやり方を廃棄し、私のブログのすべての文字は有機的で手書きだ。本物の人間の少し荒削りのある表現が最も価値がある。このアレルギー反応は視覚メディアにも及び、典型的なAIインフォグラフィックは即座にコンテンツへの評価を下げる。それは「私はAIゴミだ」と叫んでいる。この直感は私に大きな自信を与えてくれる:人間の体験はAIによって破壊されず、AIは単にツールとして存在し、私たちの人間としての本質を変えることはない。
ウィーンClawCoinイベントでの500人以上の熱狂から、ロブスターの服を着たロボットまで、あなたは前例のないコミュニティ雰囲気を作り出した。インタビューの最後に、この「権力を民に返す」創作欲望が爆発的に増大するのを見て、あなたは人類文明の未来にどのような新しい期待を持つか?
Peter Steinberger: この創造者の雰囲気が戻ってきた。人々は遊び心でAIを探求し始め、新しい創造空間が至る所に現れている。これは私に自信を与える。もしアイデアがあり、言語で表現できるなら、創造できる。これこそが真の権力の民への返還であり、AIがもたらす美しいものの一つだ。それは決して平凡なコンテンツジェネレーターではない。
(個人の未来について)OpenClawは未来への窓に過ぎない。それはAIの進化タイムラインを加速するツールだ。多くの大企業からの招待を受けているが、私が追求するのは楽しみと影響力だ。私はそれをクールな製品にするが、他にも多くのアイデアを持っている。
| 記事出典:数字開物
【AI技術と応用交流グループ|招待制のみ】
AIコンピューティング分野TOPレベルの従事者専用サークル
√ ヘッドコンピューティング企業との深層対話
√ AI上流・下流企業との深層対話
√ 一手のグローバルAIとコンピューティング産業情報の取得
√ AIホットトピック及び先端産業の独占情報の取得
√ 随時グローバルAI分野のエグゼクティブ最新見解及び全文テキストの閲覧
√ AIテーマ産業交流イベントへの参加機会
身分確認コードスキャン(姓名/会社/職務の備記載入必須)
DeepSeekだけでなく、AI産業の未来もある!
• END •
【コラム】名作再読