Cognition が Devin を使って Devin を構築する方法

私たちは最初から Devin を使って Devin を構築してきました。先週、私たちは 659 件の Devin によるプルリクエストを自社のコードベースにマージしました。これは 2025 年で最も良かった週の 154 件から大幅に増加しています。

多くの皆さんは Devin をウェブアプリとしてご存知でしょう。社内の私たちは、作業の起点に応じて、すべてのインターフェース(ウェブ、Slack、Linear、CLI、API)でそれを使用しています。この記事では、それらすべてをどのように活用しているかについて説明します。

コアエクスペリエンス

設定はこうです。Devin に管理させたいコードベースをすべて追加します。すると、自然言語を使用してすべてのリポジトリを横断して作業できる統合インターフェースが与えられます。

これは対話型インターフェースとして設計されているため、Slack や Linear、Jira のチケット、またはウェブアプリから、チームメンバーにメッセージを送るのと同じようにチャットできます。どのチャンネルでも @Devin とタグ付けします。必要に応じてファイルを添付します。通常のチャットインターフェースと同じように、双方向でコミュニケーションを取ります。

Devin との対話型インターフェースのスクリーンショット

その結果、技術的な専門知識や社内の役割に関係なく、誰でも貢献できるようになります。Git やコマンドラインツールの設定を理解したりする必要はありません。

@Devin とタグを付けてリクエストを送ると、レビューしてテストできるプルリクエストが返ってきます。例えば、誰かがドキュメントが古くなっていることやバグに気づいた場合、Slack で短いメッセージを送って修正してもらい、その日の作業を続行できます。

Slack での Devin による修正の例

これにより、迅速な反復と磨き上げのための摩擦や障壁が取り除かれ、コンテキストの切り替えも減少します。

また、エンジニアが、自分たちが毎日作業しているのと同じコードベースで、同僚が Devin を使って成し遂げている様子を見ると、「えっ、本当に?Devin はそんなこともできるの?」という瞬間が訪れ、有機的に広がっていきます。

Ask Devin(コードベース Q&A)

リポジトリが Devin に追加されると、自動的にインデックスが作成されます。Ask Devin は、そのコードベースへの窓口となります。

セッションを開始する前の作業範囲の特定に、私たちはこれを絶えず利用しています。ワークフローは次の通りです。Ask Devin を使用してコードを探索し、目標を明確にしてから、検索インターフェースから直接セッションを開始します。

Devin は、私たちの探索による明確なコンテキストから始まり、プロンプトはタスクに合わせて自動的に調整されます。

Ask Devin を使用したコード探索のインターフェース

この同じワークフローは、Jira や Linear の統合でも適用されます。チケットで Devin にタグを付けます。Devin はタスクを分析し、コードベースを検索し、アプローチを計画します。そして、高品質なセッションプロンプトを自動的に生成します。

Linear チケットと Devin の統合

自動化されたコードレビュー

エージェントによるコードの出荷が増えるにつれ、ボトルネックはコード作成からレビューへと移行しました。Devin Review は、大規模で複雑な GitHub のプルリクエストを、直感的に整理された差分と正確な説明に変換します。

私たちは今やすべてのプルリクエストにこれを使用しています。

Devin Review によるコードレビューのアニメーション

Devin が Slack にプルリクエストを投稿するたびに、Devin Review のリンクが含まれているため、整理された差分までワンクリックです。

Slack 上の Devin Review リンク

Devin Review が優れている点:

  • 自動修正。Devin Review や GitHub ボットがバグをフラグ付けすると、Devin が自動的にプルリクエストを修正します。Devin は、すべてのチェックに合格するまで CI やリントの問題にも取り組み、エージェントのループを閉じます。
  • スマートな差分の整理。変更を論理的にグループ化し、関連する編集を一緒に配置します(アルファベット順ではありません)。
  • コピーと移動の検出。コードがコピーまたは移動されたことを検出し、完全な削除と挿入ではなく、変更をクリーンに表示します。
  • バグキャッチャー。潜在的な問題についてプルリクエストを自動的に分析し、信頼度レベルでラベル付けします。重大なバグは即時の注意が必要です。重大でないバグもレビューされるべきです。フラグは情報提供のための注釈です。
  • コードベース対応のチャット。プルリクエストについて質問し、コードベースの他の部分からの関連するコンテキストを含む回答を得られます。

任意の GitHub プルリクエストのリンクについて、URL 内の github.comdevinreview.com に置き換えることができます。

自動レビューが構成されると、Devin はプルリクエストが作成されたとき、新しいコミットがプッシュされたとき、または誰かがレビュアーとして追加されたときに、自動的にプルリクエストのレビューを開始します。

デザインシステム

デザインシステムは逸脱しがちです。誰かが 16 進数値をハードコーディングし、別の人がワンオフのボタンを作成すると、突然、複数の情報源を維持することになります。私たちはこれを 2 つの方法で処理しています。

1 つ目は、誰もが違反を発見した瞬間に修正できることです。スクリーンショットを添えて Slack で Devin にタグを付けると、コンポーネントをデザインシステムに合わせて移行します。

Slack を通じたデザインシステムの修正

2 つ目に、毎日の監査を実行しています。毎朝、Devin は過去 24 時間にマージされたプルリクエストをスキャンし、ハードコードされた色、標準外のスペーシング、共有ライブラリを使用すべきコンポーネントにフラグを立てます。各違反に対して Linear のチケットを作成し、オプションで自動的に修正用のプルリクエストを開きます。

この組み合わせにより、誰かがそれらに気づくかどうかにかかわらず、違反が検出されます。

バグのトリアージ自動化

Linear にバグが報告されると、実際の修正が行われる前に、誰かが手を止めて調査(チケットの読み込み、コードベースの検索、最近のコミットの確認など)をする必要があります。私たちはそのトリアージの全工程を自動化しました。

エンジニアが実際にどのように調査を行うかをキャプチャする!triage-bugプレイブックを設定しました。レポートを読み、関連するコードパスを検索し、Git の履歴を確認し、根本原因と提案される修正を要約します。この自動化は、誰かがチケットにBugラベルを追加したときに発動します。割り当ては不要です。

「金曜日のデプロイ後に/contact で 500 エラーが発生」といったチケットは、Devin が自動的にファイルを見つけ、Git ログで最近の正規表現のリファクタを発見し、根本原因、影響を受けるファイル、修正のアプローチの要約を Linear に投稿することに変わります。

調査中に Devin がログを確認できるよう、Datadog MCP を接続しています。エンジニアがバグを引き取る頃には、調査はすでに完了しています。

エンドツーエンドのバグデバッグ

バグの中には、トリアージ以上の対応を必要とするものもあります。ログの取得、データベースの確認、コード変更の追跡、修正の作成が必要です。Devin を Datadog に接続し、読み取り専用のデータベースアクセス権限を与えることで、完全な調査を実行できるようにしました。

「金曜日のデプロイ以降、有料ユーザーに請求ページで 'undefined' が表示されている」といったバグレポートが届くと、Devin は Datadog からエラーログを取得し、読み取り専用レプリカをクエリしてデータの状態を確認し、Git 履歴で問題のコミットを追跡し、回帰テストを含む修正を作成してプルリクエストを開きます。

以前はエンジニアを 1 時間ほど作業から引き離していた調査が、今ではバックグラウンドで完了します。私たちはログではなく、プルリクエストをレビューします。

DANA(データアナリストエージェント)

DANA は、データベースのクエリ、データ分析、可視化の作成に最適化された Devin の特殊バージョンです。

データウェアハウスに関する質問、ダッシュボードの構築、エンジニアを作業から引き離さずにデータに関する質問に答えるために使用しています。以前は時間を食っていた「レポート作成のためにボタンを連打する」といったエンジニアリング以外の作業の定番ツールにもなっています。

DANA には、エージェントピッカーのドロップダウンからウェブアプリ経由でアクセスするか、Slack で /dana または @Devin !dana の後に質問を続けて入力することでアクセスできます。

DANA を使用したデータ分析の例

指標については具体的に記述し、期間を含め、役立つ場合は可視化を求めるようにしています。

DANA は MCP を介してデータウェアハウス(Redshift、PostgreSQL、Snowflake、BigQuery など、稼働中のものなら何でも)に接続し、独自のデータベース知識を維持しているため、質問する前にスキーマを理解しています。簡潔で指標に焦点を当てた回答と、ビルトインの seaborn 可視化に最適化されているため、エンジニアが SQL クライアントにコンテキストを切り替えるのを待たずに、すばやくチャートとインサイトが得られます。

「なぜ火曜日にサインアップが減少したのか?」「エンタープライズとセルフサービスの消費内訳は?」といった、誰かのキューに何日も溜まっていたようなアドホックな質問に特に役立っています。SQL も含まれているため、ロジックを検証できます。

DeepWiki

DeepWiki を使用すると、Devin はすべてのリポジトリを自動的にインデックス化し、アーキテクチャ図、ソースへのリンク、コードベースの要約を含む Wiki を作成します。Ask Devin は、Wiki の情報を使用して、より適切に理解し、関連するコンテキストを見つけます。

公開リポジトリの場合、deepwiki.com がセットアップ不要で、アーキテクチャ図、ソースリンク、ドキュメントを自動的に生成します。

DeepWiki によるアーキテクチャ図の例

また、無料の DeepWiki MCPも維持しています。

プレイブック

プレイブックは、繰り返し発生するタスク向けのカスタムシステムプロンプトのようなものです。複数のセッションにわたって同じ指示を繰り返していることに気づいた場合、それがプレイブックを作成する時です。

Devin のプレイブック設定画面

誰かが Devin での成功を収めれば、他の人もその成功を再現できます。良いプレイブックには以下が含まれます:

  • Devin に達成してほしい成果
  • そこに至るためのステップ
  • 事後条件を記述する仕様
  • Devin の事前知識を修正するためのアドバイス
  • 禁止されたアクション
  • 開始者から必要な入力またはコンテキスト

複雑な反復作業(Redshift へのデータ取り込み、データベースマイグレーションの実行、Stripe、Plaid、Modal との統合など)にプレイブックを使用しています。

MCP マーケットプレイス

MCP により、Devin は数百もの外部ツールやデータソースを利用できます。MCP を使用して、Sentry、Datadog、Vercel のログを掘り下げます。Slack でのデータ分析のためにデータベース MCP を接続します。Notion、Airtable、Linear などのツールからコンテキストを引き出します。

MCP マーケットプレイスのインターフェース

多くのツールはワンクリックで有効にできます。Vercel、Atlassian、Notion、Sentry、Neon、Asana、Jam などです。

例えば、Redshift MCP を使用して Slack で Devin にタグを付け、すべての組織にわたる Linear 統合の累積数をグラフ化します。これにより、週ごとの内訳、主な観察結果、共有できる Metabase へのリンクが得られます。

Slack 上での MCP を使用した分析結果

セッションインサイト

セッションインサイトは、完了した Devin セッションを分析し、改善のための実行可能な推奨事項を提供します。

Devin がタスクを完了した後、セッションインサイトは以下を検証します:

  • 問題と課題(技術的な問題、コミュニケーションのギャップ、スコープクリープ)
  • 主要なマイルストーンと効率指標を含むセッションのタイムライン
  • 即時の改善とプロセスの最適化を含むアクションアイテム
  • 強化された指示を含む改善されたプロンプトの提案

あるセッションからのインサイトを使用して、次のセッションに役立てます。改善されたプロンプトを使用して、インサイトから直接新しいセッションを立ち上げることもできます。時間が経つにつれて、セッションはより効率的になります。

API アクセス

Devin は完全な REST API を公開しているため、エージェントは人間を介さずに作業を開始できます。Devin を既存のシステムに接続し、セッションをプログラムでトリガーします:

  • Sentry からクラッシュログが到着 → Devin が調査してプルリクエストを作成
  • バグレポートが提出 → Devin が再現、診断、修正を行う
  • デプロイが失敗 → Devin がログを分析して修正を提案
  • コードレビューが要求 → Devin がレビューしてコメントを残す

Devin が得意とする分野

Devin は複雑なタスクを含む、ほとんどのエンジニアリング作業を引き受けることができます。成功は具体性と比例して拡大します。明確な基準を持つ適切に範囲定義されたタスクが、最良の結果をもたらします。

私たちが一貫して Devin に使用しているタスク:

  • 高ボリュームの反復的な改善
  • バグ修正とエッジケース
  • テストカバレッジの向上
  • CI 障害の調査
  • リントエラーと CVE の修正
  • プルリクエストのレビュー
  • ドキュメントの維持
  • 静的解析からのセキュリティ脆弱性の修正
  • コードベース Q&A

複雑なタスクのヒント

  • 大規模な課題は、個別のセッションにわたる、より小さく分離されたタスクに分割すべきです。
  • Devin は機能するインターフェースの構築に優れていますが、美しくスタイリングするのは依然として人間の強みです。
  • モバイル開発も機能しますが、Devin にはテスト用の電話を持っていません。
  • 広範なテストと検証を必要とするものについては、検証メカニズムが整っていることを確認しています。

始め方

最小限のセットアップ

  1. app.devin.ai でサインアップする
  2. GitHub、GitLab、または Bitbucket を接続する
  3. 最初のリポジトリを追加する
  4. シンプルなタスクでセッションを開始する

スケールアップ: 慣れるにつれて:

  • 知識を追加して、Devin にコードベースの規約を教える
  • 反復タスクのためにプレイブックを作成する
  • インラインコラボレーションのために Slack を接続する
  • ツール用に MCP を有効にする
  • セッションを開始する前に、Ask Devin を使用して複雑な作業の範囲を定義する

Devin をチームメンバーとして扱ってください。コンテキストを与え、規約を教えましょう。バックログの処理は Devin に任せ、あなたはシニアの判断を必要とする作業に集中してください。明確なコンテキストを持ち、適切に範囲定義されたタスクを自律的に実行する AI ソフトウェアエンジニアは、生産性を飛躍的に高める存在です。


分享網址
AINews·AI 新聞聚合平台
© 2026 AINews. All rights reserved.