AIコーディングツールを使っているのに、なぜか思ったように動いてくれない。 プロンプトをどう書けばいいか、試行錯誤を繰り返しているうちに時間だけが過ぎていく。
そんな経験、ありませんか。
実は2026年現在、AIエンジニアリングの焦点は「どんなプロンプトを書くか」ではなく、「エージェントが動く環境(ハーネス)をどう設計するか」へと完全にシフトしています。 Anthropicが提供するClaude Codeは、その考え方を体現したツールです。
本記事では、Claude Codeの基本的な使い方から、他のAIコーディングツールとの違い、そして「ハーネス設計」という中核的な概念まで、体系的に整理しました。 「なんとなくAIを使っている」状態から一歩踏み出したい開発者の方は、ぜひ最後までご覧ください。
Claude Codeとは何か——既存ツールとの本質的な違い
「副操縦士」から「自律型エンジニア」へ
ChatGPTやGitHub CopilotといったAIツールは、開発者の操作を「補助する」ものでした。 コードを提案してくれたり、チャットで質問に答えてくれたりする、いわば「副操縦士」的な存在です。
Claude Codeは、そこから一段階上のポジションにいます。 自ら計画を立て、ファイルを操作し、テストを実行・修正まで行う「自律型エンジニア」として設計されているのです。
ターミナルから直接動作し、git・docker・terraformといったCLIツールを自分の手足として使いこなす。 これが、Claude Codeの最大の特徴です。
他ツールとのスペック比較
CursorやGitHub Copilotと比較すると、その立ち位置がよりクリアになります。
| 項目 | Claude Code | Cursor | GitHub Copilot |
|---|---|---|---|
| 主なインターフェース | ターミナル(CLI)・Web・デスクトップ | VS Codeフォーク(GUI) | IDE拡張 |
| 自律性 | 非常に高い | 中程度 | 低〜中 |
| ワークフロー | 計画→承認→実行のループ | インライン編集・タブ補完 | リアルタイム補完 |
| コンテキスト管理 | CLAUDE.md・Rulesディレクトリ | プロジェクト全体のRAG | オープンファイル・リポジトリ検索 |
| インフラ連携 | シェル直接実行・MCP標準搭載 | プラグイン形式(限定的) | クラウド経由の単発API実行 |
Cursorは「GUIで直感的に」という設計思想を持っており、IDEに慣れた開発者にとっては馴染みやすいです。 一方でClaude Codeは「ターミナルネイティブ」であり、大規模なリファクタリングや依存関係の一括更新、リリースノートの自動作成といった「定型だが面倒な作業」の自動化において、明確に差をつけます。
環境構築——最初の30分でやること
インストールから初期化まで
Claude CodeはNode.js環境で動作します。 手順はシンプルで、以下の3ステップで完了します。
| ステップ | コマンド | 内容 |
|---|---|---|
| 1. インストール | npm install -g @anthropic-ai/claude-code | グローバルにインストール |
| 2. ログイン | claude → /login | Anthropicアカウントと紐付け |
| 3. プロジェクト初期化 | claude → /init | CLAUDE.mdの自動生成 |
/init を実行すると、リポジトリの構造・ビルドシステム・テストフレームワーク・コーディングパターンを自動スキャンし、プロジェクトに合わせたCLAUDE.mdを生成してくれます。 ここがスタートラインです。
OSごとの推奨環境
Claude CodeはUnix哲学に基づいて設計されているため、OS環境の選択が地味に重要です。
| OS | 推奨環境 | 備考 |
|---|---|---|
| macOS | zsh / bash | ネイティブサポート。/desktopコマンドでGUI連携も可能 |
| Linux / WSL | bash | 最もパフォーマンスを引き出しやすい |
| Windows(ネイティブ) | PowerShell / CMD | npx実行時にラッパーが必要なケースあり |
Windowsで使う場合は、WSL(Windows Subsystem for Linux)経由が断然おすすめです。 パッケージマネージャーやシェルツールの互換性が段違いに改善されます。
基本ワークフロー——「計画→承認→実行」のループを理解する
Plan Modeから始まるエージェントループ
Claude Codeの操作は、以下の反復プロセスで成り立っています。
- Plan Mode:自然言語でタスクを指示すると、まず解決策を立案。このフェーズではコードは一切変更されない
- 承認:エージェントが提案した実行手順を開発者がレビュー
- 実行:承認後、エージェントが実際にファイル操作・コマンド実行を行う
Shift + Tabキーで、Default Mode・Auto Mode・Plan Modeを切り替えられます。
2026年の新機能「Auto Mode」とは
以前は、長時間のタスクで中断を避けたい場合、--dangerously-skip-permissionsというフラグを使って全承認を省略する開発者も多かったです。 セキュリティ的に、これは明らかに問題のある運用でした。
Auto Mode(claude --enable-auto-mode)は、その問題を解消するためのアプローチです。
- 低リスクのアクション:自動で承認して進む
- 高リスクのアクション(破壊的なファイル削除・外部へのデータ送信など):フラグを立てて開発者に確認
全部スキップでも全部確認でもない、ちょうどいい中間地点を取ってくれます。 ただし、推論ステップが増える分だけトークン消費とレイテンシがわずかに上がるというトレードオフはあります。
コンテキスト管理——CLAUDE.mdとRulesディレクトリの使い分け
CLAUDE.mdは「エージェント向け仕様書」
CLAUDE.mdは、プロジェクトのルートに置く指示書です。 セッション開始時に必ず読み込まれるため、ここに書いた内容がエージェントの「基礎知識」になります。
書くべき内容と書かない方がいい内容を整理するとこうなります。
| 書くべき内容 | 書かない方がいいもの |
|---|---|
| 技術スタック | コードを見ればわかる自明なこと |
| ビルド・テストコマンド | 頻繁に変更される詳細情報 |
| アーキテクチャ上の決定事項 | 長大なAPIドキュメント |
| コーディング標準 | あいまいな方針や好み |
1ファイルあたり200行以下に抑えることがベストプラクティスとされています。 指示が長すぎると、エージェントの遵守能力が落ちてしまうからです。
モノレポはRulesディレクトリで解決
プロジェクトが大きくなると、全てのルールをCLAUDE.mdに詰め込むのは逆効果です。 コンテキスト窓が圧迫されて、推論精度が下がります。
解決策が、.claude/rules/ディレクトリを使った「段階的開示」です。
各Markdownファイルにpaths: ["src/api/**/*.ts"]のようなYAMLフロントマターを記述しておくと、エージェントが該当ファイルを編集するときにだけそのルールを読み込みます。 「必要な時に必要な情報だけ」という設計で、20万トークンのコンテキスト窓を賢く節約できます。
サブディレクトリに個別のCLAUDE.mdを配置する方法も同様に機能します。 特定のドメインやチームにだけ適用したいルールを、スッキリ管理できます。
ハーネス設計——AIエンジニアリングの本丸
モデルをCPU、ハーネスをOSと捉える
ここが、この記事で一番伝えたいポイントです。
Claude Opusのようなモデルを「CPU(生の発想力・計算力)」だと考えてみてください。 それだけでは何も動きません。
CPUが力を発揮するには「OS(オペレーティングシステム)」が必要です。 エージェント・ハーネスは、まさにそのOSに相当します。
| ハーネスの構成要素 | 役割 | OSで言うと |
|---|---|---|
| エージェント・ループ | 観察→思考→行動→検証のサイクル管理 | スケジューラ/プロセス管理 |
| ツール群 | シェル実行・ファイル操作・MCP連携 | デバイスドライバ |
| コンテキスト制御 | CLAUDE.md・コンテキスト圧縮 | メモリ管理(RAM) |
| 永続化/メモリ | セッション履歴の保存・Auto Memory | ファイルシステム |
| 検証ループ | テスト実行・構文チェック・セルフレビュー | デバッガ |
| 制約とガードレール | 権限設定・破壊的コマンドの禁止 | セキュリティポリシー |
なぜプロンプトよりハーネス設計が優先されるのか
同じOpusモデルを使っても、環境(ハーネス)の設計次第でアウトプットは劇的に変わります。
- シンプルなスクリプトベースの構成:ベンチマークスコア 42%
- Claude Codeの洗練されたハーネス環境:ベンチマークスコア 78%
この差は、モデルの「賢さ」の差ではありません。 モデルを支えるシステムの差です。
プロンプトをどれだけ磨いても、エージェントが「自分の出力が正しいか」を検証できる環境がなければ、長時間のタスクで必ず迷走が始まります。 テストを実行できる環境を用意し、CLAUDE.mdで進むべき道を示し、不足しているツールをMCPで繋ぐ——この「環境整備」こそが、成果を左右します。
スキルとカスタムコマンド——エージェントの能力を拡張する
スキルとは何か
スキルは、特定のタスクを遂行するための手順書・ツール・参考資料をパッケージ化したものです。 .claude/skills/<スキル名>/ディレクトリに配置し、中核となるSKILL.mdファイルで定義します。
$ARGUMENTSプレースホルダーを使えば、/deploy productionのようにユーザーから引数を受け取ることもできます。
スキルの3分類
2026年のアップデートで、従来の「カスタムコマンド(.claude/commands/)」はスキルへと統合されました。
| スキルの種類 | 用途例 | 呼び出し方 |
|---|---|---|
| 手順型スキル | /deploy・/commit・/release-note | ユーザーによる明示的なスラッシュコマンド |
| 参照型スキル | API設計規約・UIスタイルガイド | Claudeによる自動検知(Auto-invocation) |
| 並列型(サブエージェント) | /batch・大規模リファクタリング | context: forkを指定したサブエージェント実行 |
参照型スキルがポイントで、Claudeが文脈から「今このスキルの知識が必要だ」と判断して自動で読み込みます。 開発者が毎回コマンドを打たなくても、エージェントが適切なガイドラインを参照してくれるわけです。
MCPによる外部連携——エージェントの「手足」を増やす
MCPは「USB-Cポート」のような規格
Model Context Protocol(MCP)は、AIモデルと外部ツールをつなぐ共通規格です。 ハードウェアで言えばUSB-Cポートのようなもので、一度標準化されれば様々なツールをつなぎ込めます。
代表的な活用例をまとめます。
| 連携先 | できること |
|---|---|
| GitHub MCP | PRの一覧取得・イシュー検索・コードレビューの自動化 |
| Google / Slack / Notion | 設計ドキュメントの参照・進捗報告・カレンダー確認 |
| PostgreSQL / Supabase | スキーマ確認・直接データクエリによるデバッグ |
gh CLIとAgent Browser
Claude Codeはターミナルネイティブなので、既存のCLIツールをそのまま使えます。
gh pr createやgh issue listをClaudeに実行させれば、ブラウザを開かずGitHubのワークフローが完結します。
さらに2026年の新機能として、Agent Browserが統合されました。 ヘッドレスブラウザ(Chrome等)をエージェントが操作し、開発サーバーの表示確認・UIの自動テスト・スクリーンショットを使った自己検証が可能になっています。
チーム・組織での運用——コスト管理とガバナンス
モデルの使い分けでコストを最適化
エージェントが自律的に動く分、トークン消費の管理が重要になります。
| 用途 | 推奨モデル |
|---|---|
| 複雑な論理思考・アーキテクチャ検討 | Claude Opus 4.5 |
| 日常的なコーディング・テスト作成 | Claude Sonnet 4.6 |
| 単純な定型処理 | Claude Haiku 4.5 |
プロンプトキャッシュを活用すれば、CLAUDE.mdなどの頻繁に使うコンテキストのコストを最大90%削減できます。 タスクが切り替わるたびに/clearで古い会話履歴を破棄する習慣も、地味に効きます。
CI/CDとの統合
GitHub ActionsやGitLab CI/CDとの連携も実装例が増えています。 GitLabではコメントで@claudeとメンションするだけで、エージェントがパイプライン上でタスクを実行し、修正案をMRとして提出するワークフローが動きます。
CI環境ではセキュリティのため、隔離されたコンテナ内での実行と厳格なネットワーク制限が推奨です。
組織レベルのガバナンス設定
企業導入では、開発者が生のAPIキーを直接管理するのではなく、ゲートウェイ経由の階層管理が必要になります。 Admin Settingsを通じて設定できる主な項目は以下のとおりです。
| 設定項目 | 内容 |
|---|---|
| Auto Modeの制限 | 組織ポリシーに合わせて自律度を調整 |
| MCPサーバーのホワイトリスト化 | 接続先の外部サービスを制限 |
| 開発者ごとの予算制限(Budgeting) | 予期せぬトークン消費を防止 |
まとめ
Claude Codeが示すのは、AIとの向き合い方のアップデートです。
プロンプトを磨く時間を短縮し、代わりに「何が正解か」を検証できるテストを書く。 エージェントが進むべき道を示すCLAUDE.mdを整える。 不足している手足(MCPや外部ツール)を繋ぎ込む。
このハーネス設計こそが、AI時代における開発者の新しいコアスキルです。
重要なポイントを振り返ります。
- Claude CodeはIDEの補助ツールではなく、自律型エンジニアとして設計されている
- ハーネス設計(環境整備)が、プロンプト改善より成果に直結する
CLAUDE.mdは200行以下に抑え、Rulesディレクトリで段階的開示を実現する- Auto ModeとMCP連携で、承認負担とツール不足を同時に解消できる
- モデルの使い分けとプロンプトキャッシュで、コストを賢くコントロールする
AIに「任せきり」でも「逐一確認」でもなく、設計された環境の中で自律的に動かす。 そのための土台づくりを、ぜひ今日から始めてみてください。
最後までご覧いただき、ありがとうございます。
