<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>AIコードレビュー | 週末起業ラボ</title>
	<atom:link href="https://shumatsu-lab.com/tag/ai%E3%82%B3%E3%83%BC%E3%83%89%E3%83%AC%E3%83%93%E3%83%A5%E3%83%BC/feed/" rel="self" type="application/rss+xml" />
	<link>https://shumatsu-lab.com</link>
	<description>本業の隣で、もう一つのキャリアを</description>
	<lastBuildDate>Wed, 03 Jun 2026 23:16:18 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=7.0</generator>

<image>
	<url>https://shumatsu-lab.com/wp-content/uploads/2026/02/cropped-IMG_2742-32x32.jpeg</url>
	<title>AIコードレビュー | 週末起業ラボ</title>
	<link>https://shumatsu-lab.com</link>
	<width>32</width>
	<height>32</height>
</image> 
<site xmlns="com-wordpress:feed-additions:1">252581404</site>	<item>
		<title>AIコードレビュー比較｜Claude・Codex・CodeRabbit実測</title>
		<link>https://shumatsu-lab.com/llm-code-review-benchmark-claude-codex-coderabbit/</link>
		
		<dc:creator><![CDATA[ムラサキ]]></dc:creator>
		<pubDate>Fri, 15 May 2026 05:14:49 +0000</pubDate>
				<category><![CDATA[AI]]></category>
		<category><![CDATA[プログラミング]]></category>
		<category><![CDATA[AIコードレビュー]]></category>
		<category><![CDATA[Claude Code]]></category>
		<category><![CDATA[ツール比較]]></category>
		<guid isPermaLink="false">https://shumatsu-lab.com/?p=1569</guid>

					<description><![CDATA[SE歴20年の筆者は2026年5月、実際のコードベースから抽出した6本のバグをプライベートリポジトリに仕込み、4種のLLMレビューツールを同一条件で対決させた。検出率は Claude Code 内蔵 code-revie [&#8230;]]]></description>
										<content:encoded><![CDATA[
<p class="wp-block-paragraph">SE歴20年の筆者は2026年5月、実際のコードベースから抽出した6本のバグをプライベートリポジトリに仕込み、4種のLLMレビューツールを同一条件で対決させた。検出率は Claude Code 内蔵 code-reviewer が94%、Codex CLI GPT-5.5 が77%、CodeRabbit Pro Plus が42%。同じバグを全手法が見逃す「LLMの壁」も発見した。実測データと月コストを全公開する。</p>



<div class="wp-block-cocoon-blocks-balloon-ex-box-1 speech-wrap sb-id-1 sbs-stn sbp-l sbis-cb cf block-box not-nested-style cocoon-block-balloon"><div class="speech-person"><figure class="speech-icon"><img decoding="async" src="https://shumatsu-lab.com/wp-content/uploads/2026/03/murasaki_icon.png" alt="ムラサキ" class="speech-icon-image"/></figure><div class="speech-name">ムラサキ</div></div><div class="speech-balloon">
<p class="wp-block-paragraph">コードレビューは「念のため通す」感覚でLLMに任せていたが、手法によって検出率が倍以上違うとは思っていなかった。</p>
</div></div>


<div class="slb slb-tldr">
  <div class="slb-tldr__head">
    <span class="slb-mono slb-tldr__label">TL;DR / 三行要約</span>
          <span class="slb-mono slb-tldr__meta">8分 MIN READ · UPDATED 2026-05-14</span>
      </div>
  <ol>
          <li>実バグ6本・4手法ベンチマーク: Claude Code 94%・Codex CLI 77%・CodeRabbit 42%</li>
          <li>/security-review はセキュリティ特化、偽陽性ゼロで専門領域7/7完璧</li>
          <li>全手法が見逃した Bug2 ── git history を見ないと検出できないバグカテゴリが存在する</li>
      </ol>
    <div class="slb-tldr__badges">
          <span class="slb-badge slb-badge--hi">
        RESULT — 完了      </span>
          <span class="slb-badge">
        TOOL — Claude Code      </span>
          <span class="slb-badge">
        COST — サブスク内      </span>
      </div>
  </div>
    




  <div id="toc" class="toc tnt-number toc-center tnt-number border-element"><input type="checkbox" class="toc-checkbox" id="toc-checkbox-2" checked><label class="toc-title" for="toc-checkbox-2">目次</label>
    <div class="toc-content">
    <ol class="toc-list open"><li><a href="#toc1" tabindex="0">なぜLLMコードレビューのセカンドオピニオンが必要か</a><ol><li><a href="#toc2" tabindex="0">「通った」と「正しい」は別の話</a></li><li><a href="#toc3" tabindex="0">副業・個人開発でのリスク</a></li></ol></li><li><a href="#toc4" tabindex="0">ベンチマーク設計 — 実バグ6本・4手法の条件</a><ol><li><a href="#toc5" tabindex="0">バグの仕込み方</a></li><li><a href="#toc6" tabindex="0">4手法の評価条件</a></li></ol></li><li><a href="#toc7" tabindex="0">4手法の結果比較</a><ol><li><a href="#toc8" tabindex="0">全体スコア</a></li><li><a href="#toc9" tabindex="0">Claude Code code-reviewer の特徴</a></li><li><a href="#toc10" tabindex="0">Codex CLI GPT-5.5 の特徴</a></li><li><a href="#toc11" tabindex="0">CodeRabbit Pro Plus の特徴</a></li><li><a href="#toc12" tabindex="0">/security-review の特徴</a></li></ol></li><li><a href="#toc13" tabindex="0">全手法が見逃したバグ — Bug2が示す「LLMの壁」</a></li><li><a href="#toc14" tabindex="0">月コストと推奨スタック</a><ol><li><a href="#toc15" tabindex="0">コスト比較</a></li><li><a href="#toc16" tabindex="0">3つの推奨スタック</a></li></ol></li><li><a href="#toc17" tabindex="0">よくある質問</a></li><li><a href="#toc18" tabindex="0">まとめ</a></li></ol>
    </div>
  </div>

<h2 class="wp-block-heading"><span id="toc1">なぜLLMコードレビューのセカンドオピニオンが必要か</span></h2>



<h3 class="wp-block-heading"><span id="toc2">「通った」と「正しい」は別の話</span></h3>



<p class="wp-block-paragraph">自分でコードを書いて自分でレビューする個人開発・副業開発では、認知バイアスが避けられない。書いた本人はコードの意図を知っているため、実装のミスより「動くはずだ」という確信が先に来る。</p>



<p class="wp-block-paragraph">LLMにセカンドオピニオンを求める意義はここにある。コードの意図を知らない第三者として差分を読む。ただし「LLMに投げた」だけでは安心できない。どのツールをどの条件で使うかで、検出できるバグの種類と精度が大きく変わる。</p>



<h3 class="wp-block-heading"><span id="toc3">副業・個人開発でのリスク</span></h3>



<p class="wp-block-paragraph">副業でサービスを運用している場合、バグの影響は直接収益・信用に直結する。SQLインジェクション1本でユーザーデータが流出すれば、個人サービスとして終わりに近い。ロジックバグで二重投稿が発生すれば、SNS連携を使ったシステムが誤動作し続ける。</p>



<p class="wp-block-paragraph"><a href="https://shumatsu-lab.com/claude-code-personal-service-development/">Claude Codeを使った個人サービス開発の正直な話</a>でも触れたが、実装速度が上がるほどレビューの抜け漏れリスクも比例して増える。</p>



<h2 class="wp-block-heading"><span id="toc4">ベンチマーク設計 — 実バグ6本・4手法の条件</span></h2>



<h3 class="wp-block-heading"><span id="toc5">バグの仕込み方</span></h3>



<p class="wp-block-paragraph">実際に過去に発生した、または発生しうるバグを6本選定し、「正常な修正後コード」をmainブランチ、「バグを再導入したコード」をfeatureブランチとして、正規のPR形式で差分を作成した。PR titleとdescriptionは「意図的に無害に見える説明」を付けた。</p>



<figure class="wp-block-table"><table><thead><tr><th>PR</th><th>カテゴリ</th><th>隠したバグの内容</th></tr></thead><tbody><tr><td>Bug1</td><td>ロジック</td><td>XAutoPost 当日投稿チェックの削除 → 二重投稿</td></tr><tr><td>Bug2</td><td>null契約</td><td>null返却で白画面（PR説明はflash of content防止と記述）</td></tr><tr><td>Bug3</td><td>インフラ仕様</td><td>.remotionignore の親ディレクトリ除外 → 出力ファイル全消失</td></tr><tr><td>Bug4</td><td>リファクタ</td><td>mailer統合の後方互換なし → smtpReady=false で無音停止</td></tr><tr><td>Bug5</td><td>レジリエンス</td><td>例外を suitable=False に統一 → 判定不能時に生成スキップ</td></tr><tr><td>Bug6</td><td>セキュリティ</td><td>requireAdmin削除＋SQLi×3＋SELECT* → 認証バイパス・情報漏洩</td></tr></tbody></table></figure>



<h3 class="wp-block-heading"><span id="toc6">4手法の評価条件</span></h3>



<p class="wp-block-paragraph">各手法はそれぞれのPRのみを閲覧できる制限下で実施した。ground-truth（バグの正解）にアクセスできる情報は一切渡さない。</p>



<ul class="wp-block-list">
<li><strong>Claude Code code-reviewer</strong>: git worktreeに閲覧範囲を限定したsubagentで実行</li>



<li><strong>CodeRabbit Pro Plus</strong>: <code>@coderabbitai review</code> でPRに対してトリガー</li>



<li><strong>Codex CLI GPT-5.5</strong>: 各worktreeでCLIインタラクティブモードで実行</li>



<li><strong>/security-review</strong>: 同じworktreeで <code>/security-review</code> スラッシュコマンド</li>
</ul>



<h2 class="wp-block-heading"><span id="toc7">4手法の結果比較</span></h2>



<h3 class="wp-block-heading"><span id="toc8">全体スコア</span></h3>



<figure class="wp-block-table"><table><thead><tr><th>手法</th><th>検出率</th><th>6PR判定</th><th>月コスト概算</th></tr></thead><tbody><tr><td>Claude Code code-reviewer</td><td><strong>94%</strong> (22.5/24点)</td><td>BLOCK×3, WARNING×2, APPROVE×1</td><td>Max $100/月内</td></tr><tr><td>Codex CLI GPT-5.5</td><td><strong>77%</strong> (18.5/24点)</td><td>要修正×4, 要確認×1, APPROVE×1</td><td>従量 ~$0.6/PR</td></tr><tr><td>CodeRabbit Pro Plus</td><td><strong>42%</strong> (10/24点)</td><td>Critical指摘×3, 別観点×1, スルー×2</td><td>Pro $24/月～</td></tr><tr><td>/security-review</td><td><strong>専門特化</strong> (Bug6で7/7)</td><td>セキュリティ以外は対象外</td><td>Max内</td></tr></tbody></table></figure>



<h3 class="wp-block-heading"><span id="toc9">Claude Code code-reviewer の特徴</span></h3>



<p class="wp-block-paragraph">最も検出率が高く、偽陽性はゼロだった。gitignoreの「親ディレクトリ除外時に子を再includeできない」という仕様詳細（Bug3）を正確に引用して指摘できた点は他手法にはない強みだ。</p>



<p class="wp-block-paragraph">Bug4ではground-truthの4観点に加え、<code>(process.env.SMTP_PORT || '587') === '465'</code> という文字列比較バグ（数値と文字列の型不一致）をボーナス検出した。</p>



<p class="wp-block-paragraph">弱点はPR descriptionとdiffの論理整合性を重視する点。Bug2のように「PR説明が正しい場合に、それ以上の情報なしには判断できないバグ」はAPPROVEになった。</p>



<h3 class="wp-block-heading"><span id="toc10">Codex CLI GPT-5.5 の特徴</span></h3>



<p class="wp-block-paragraph">ロジック・セキュリティ・リファクタの全カテゴリで安定した検出を見せた。Bug6ではmodels/user.jsを実際に読み込み、「<code>db.prepare()</code>が内部でキャッシュしているため、raw SQL化によるパフォーマンス改善の主張が成り立たない」と技術的矛盾を指摘した。</p>



<p class="wp-block-paragraph">Claudeと同様にBug2は見逃した。Bug3は本質をカバーしたが1点未検出（3/4）。Bug5は判定不能と不適性の区別に触れたが、silent failure観点の指摘がCodeRabbitと差があった（3.5/4）。</p>



<p class="wp-block-paragraph">コストは従量制。Bug1〜6の5PR相当で約$3.10の消費（Bug1を2回実行したため）。1PRあたり$0.5〜0.8程度。</p>



<h3 class="wp-block-heading"><span id="toc11">CodeRabbit Pro Plus の特徴</span></h3>



<p class="wp-block-paragraph">セキュリティバグ（Bug6）では4つのCritical指摘を出した。requireAdmin削除・SQLi×3を endpoint 別に分離して指摘する細かさはむしろ他手法より詳細だった。</p>



<p class="wp-block-paragraph">一方、Bug3（.remotionignore仕様）とBug2（null白画面）は完全スルー。Bug4はground-truth外の観点（attachmentのBase64バリデーション、extrasオーバーライド）を指摘した。これはground-truthでは0点扱いだが、別の品質問題を発見しており補完的な価値はある。</p>



<div class="wp-block-cocoon-blocks-icon-box common-icon-box block-box information-box">
<p class="wp-block-paragraph">CodeRabbit Pro Plus の 14日トライアル終了後は月 $24/シートが発生する。Free版はCHATTY/AGGRESSIVEプロファイルになる可能性があり、同等評価ではない。</p>
</div>



<h3 class="wp-block-heading"><span id="toc12">/security-review の特徴</span></h3>



<p class="wp-block-paragraph">Bug6（セキュリティ3重）に対して7つのHigh脆弱性を検出した。各脆弱性に exploit scenario が付属し、「<code>GET /admin/users/search?q=%25'%20UNION%20SELECT%20...</code>でpassword_hashを全件奪取できる」という具体的な攻撃経路まで記述する。</p>



<div class="wp-block-cocoon-blocks-balloon-ex-box-1 speech-wrap sb-id-1 sbs-stn sbp-l sbis-cb cf block-box not-nested-style cocoon-block-balloon sbp-r"><div class="speech-person"><figure class="speech-icon"><img decoding="async" src="https://shumatsu-lab.com/wp-content/uploads/2026/03/murasaki_icon.png" alt="ムラサキ" class="speech-icon-image"/></figure><div class="speech-name">ムラサキ</div></div><div class="speech-balloon">
<p class="wp-block-paragraph">exploitシナリオ付きのレビューを見たのは初めてだった。pentest報告書に近い水準で、これは他手法では出てこない。</p>
</div></div>



<p class="wp-block-paragraph">Bug1〜5（非セキュリティ）に対しては全て「脆弱性なし」と正確に判定した。偽陽性はゼロ。Bug4では添付ファイル検証の問題をconfidence 7/10で近似検出したが、しきい値8未満としてレポートから除外する設計になっている。Bug5では「fail-closed化はセキュリティ的には改善」と観察まで付けた。</p>



<h2 class="wp-block-heading"><span id="toc13">全手法が見逃したバグ — Bug2が示す「LLMの壁」</span></h2>



<p class="wp-block-paragraph">Bug2のPRは以下の差分だった。</p>



<pre class="wp-block-code"><code>// 変更前
if (isMaintenance === null) return &lt;MaintenanceSplash /&gt;;

// 変更後（バグ）
if (isMaintenance === null) return null;</code></pre>



<p class="wp-block-paragraph">PR title は <code>fix(preview): メンテ確認中の flash of content を防止</code>。PR description は「null返却でコンテンツを非表示にし、確認中に本文がチラ見えする問題を修正」と記述されていた。</p>



<p class="wp-block-paragraph">この差分だけを見れば「null返却でコンテンツを非表示にする」という説明とコードは論理的に一致する。<strong>実際の問題は「変更前が白ページ防止のための修正であり、変更後がそれを打ち消している」</strong>という点だが、それを知るにはgit blameと元のissueを読む必要がある。</p>



<p class="wp-block-paragraph">全4手法がAPPROVEまたは「No actionable comments」を返した。LLMがPR単体で読める情報には構造的な限界がある。</p>



<div class="wp-block-cocoon-blocks-tab-box-1 blank-box bb-tab bb-check block-box">
<p class="wp-block-paragraph">検出不可能なバグのパターン:</p>



<ul class="wp-block-list">
<li>PR description の主張とdiffが論理的に一致している</li>



<li>バグが「元のコードのコメントや設計意図の反転」である</li>



<li>git history・issueを読まないと「修正方向が正しいか」判断できない</li>
</ul>



<p class="wp-block-paragraph">対策: commit message の品質向上・PR description に「変更前の問題の根本原因」を必ず記述する運用ルール</p>
</div>



<h2 class="wp-block-heading"><span id="toc14">月コストと推奨スタック</span></h2>



<h3 class="wp-block-heading"><span id="toc15">コスト比較</span></h3>


<div class="slb slb-roi">
  <div class="slb-roi__head">
    <span class="slb-mono slb-roi__label">ROI DASHBOARD</span>
      </div>
  <div class="slb-roi__grid">
        <div>
      <div class="slb-mono slb-roi__item-label">月額コスト (Claude Max): $100</div>
      <div class="slb-roi__item-val">
              </div>
      <div class="slb-mono slb-roi__item-note">&nbsp;</div>
    </div>
        <div>
      <div class="slb-mono slb-roi__item-label">/security-review 追加コスト: $0（Max内）</div>
      <div class="slb-roi__item-val">
              </div>
      <div class="slb-mono slb-roi__item-note">&nbsp;</div>
    </div>
        <div>
      <div class="slb-mono slb-roi__item-label">CodeRabbit Free: $0</div>
      <div class="slb-roi__item-val">
              </div>
      <div class="slb-mono slb-roi__item-note">&nbsp;</div>
    </div>
        <div>
      <div class="slb-mono slb-roi__item-label">Codex CLI 月10PR想定: ~$6</div>
      <div class="slb-roi__item-val">
              </div>
      <div class="slb-mono slb-roi__item-note">&nbsp;</div>
    </div>
        <div>
      <div class="slb-mono slb-roi__item-label">CodeRabbit Pro Plus: $24/シート</div>
      <div class="slb-roi__item-val">
              </div>
      <div class="slb-mono slb-roi__item-note">&nbsp;</div>
    </div>
      </div>
  </div>
    



<h3 class="wp-block-heading"><span id="toc16">3つの推奨スタック</span></h3>



<p class="wp-block-paragraph"><strong>パターンA: Claude Code Maxプランのみ（月$100）</strong></p>



<ul class="wp-block-list">
<li>code-reviewer: PR全件</li>



<li>/security-review: セキュリティ変更を含むPRのみ追加実行</li>



<li>検出率: 94%（非セキュリティ）＋ 専門セキュリティ</li>



<li>適合: 副業・個人開発でコストを抑えたい場合</li>
</ul>



<p class="wp-block-paragraph"><strong>パターンB: A + CodeRabbit Free（追加コスト$0）</strong></p>



<ul class="wp-block-list">
<li>code-reviewerでの自動レビュー ＋ CodeRabbitの自動トリガー</li>



<li>Bug4のような「観点の違う指摘」が追加される</li>



<li>適合: CI/CDにコードレビューを組み込みたい場合</li>
</ul>



<p class="wp-block-paragraph"><strong>パターンC: A + Codex CLI（月~$6追加）</strong></p>



<ul class="wp-block-list">
<li>重要PR・レビューを念入りにしたいPRのみCodexでダブルチェック</li>



<li>Bug3のような「2手法が独立して同じバグを検出した」ケースで信頼度が上がる</li>



<li>適合: ロジック系バグが多い開発フェーズ</li>
</ul>



<p class="wp-block-paragraph"><a href="https://shumatsu-lab.com/claude-code-cost-reduction-3tier-stack/">Claude Codeのコストを50〜75%削減する3層スタック実践</a>と組み合わせると、MaxプランをClaude Code全体の開発コストとして最適化しながらレビューも回せる。</p>



<p class="wp-block-paragraph">コードレビュー以外も含めた組織全体のAI導入を考えるなら、<a href="https://shumatsu-lab.com/enterprise-ai-comparison-dev/">ChatGPT・Claude・Geminiの開発業務向けプラン選定ガイド</a>で3社のエンタープライズ構造を9軸で比較している。</p>



<h2 class="wp-block-heading"><span id="toc17">よくある質問</span></h2>



<div class="wp-block-cocoon-blocks-faq faq-wrap blank-box block-box cocoon-block-faq"><dl class="faq"><dt class="faq-question faq-item"><div class="faq-question-label faq-item-label">Q</div><div class="faq-question-content faq-item-content">Claude Code code-reviewer と /security-review は何が違うのか</div></dt><dd class="faq-answer faq-item"><div class="faq-answer-label faq-item-label">A</div><div class="faq-answer-content faq-item-content">
<p class="wp-block-paragraph">code-reviewer は一般的なコードレビュー（ロジック・設計・品質）を行い、セキュリティ以外のバグも対象にする。/security-review はセキュリティ脆弱性（SQLi・XSS・認証バイパス等）に特化し、exploit scenario付きの報告を出す。両方を使うことで補完関係になる。今回のベンチマークでは code-reviewer が Bug1〜5 を94%カバーし、/security-review が Bug6 のセキュリティ観点を7/7検出した。</p>



<p class="wp-block-paragraph">モデルの世代でも検出力は変わり、Opus 4.8は自前コードの欠陥を見逃さず指摘する確率が4.7の約4倍とされる。世代差が副業にどう効くかは<a href="https://shumatsu-lab.com/claude-opus-4-8-side-job-guide/">Opus 4.8で何が変わったかの整理</a>にまとめた。</p>

</div></dd></dl></div>



<div class="wp-block-cocoon-blocks-faq faq-wrap blank-box block-box cocoon-block-faq"><dl class="faq"><dt class="faq-question faq-item"><div class="faq-question-label faq-item-label">Q</div><div class="faq-question-content faq-item-content">CodeRabbit Free と Pro Plus は検出率が変わるのか</div></dt><dd class="faq-answer faq-item"><div class="faq-answer-label faq-item-label">A</div><div class="faq-answer-content faq-item-content">
<p class="wp-block-paragraph">今回の検証はPro Plus（14日トライアル）で実施した。Freeプランは1日10回のPRレビュー制限があり、プロファイル設定（CHILL/CHATTY/AGGRESSIVE）がPro Plusと異なる可能性がある。同一バグに対する検出精度が変わるかは未検証。Freeはまず試してから判断するのが妥当。</p>
</div></dd></dl></div>



<div class="wp-block-cocoon-blocks-faq faq-wrap blank-box block-box cocoon-block-faq"><dl class="faq"><dt class="faq-question faq-item"><div class="faq-question-label faq-item-label">Q</div><div class="faq-question-content faq-item-content">Codex CLI は OpenAI のアカウントが必要か</div></dt><dd class="faq-answer faq-item"><div class="faq-answer-label faq-item-label">A</div><div class="faq-answer-content faq-item-content">
<p class="wp-block-paragraph">はい。OpenAI APIキーが必要で従量制課金になる。今回の6PR相当で約$3（Bug1を2回実行含む）。GPT-5.5（デフォルトモデル）での消費量は1PR当たり$0.5〜0.8程度。OpenAIのAPIクレジットをチャージしてから使う。</p>
</div></dd></dl></div>



<div class="wp-block-cocoon-blocks-faq faq-wrap blank-box block-box cocoon-block-faq"><dl class="faq"><dt class="faq-question faq-item"><div class="faq-question-label faq-item-label">Q</div><div class="faq-question-content faq-item-content">全手法が見逃したBug2のようなケースはどう対処するか</div></dt><dd class="faq-answer faq-item"><div class="faq-answer-label faq-item-label">A</div><div class="faq-answer-content faq-item-content">
<p class="wp-block-paragraph">PR descriptionに「変更前の問題の根本原因と修正の方向性」を必ず明記する運用ルールが有効。「flash of contentが起きているためnullで非表示にした」という説明では不十分で、「null返却ではなく空白のUIコンポーネントを返すべき設計だった」という意図まで書く必要がある。LLMはPR単体で読める情報しか使えない。</p>
</div></dd></dl></div>



<div class="wp-block-cocoon-blocks-faq faq-wrap blank-box block-box cocoon-block-faq"><dl class="faq"><dt class="faq-question faq-item"><div class="faq-question-label faq-item-label">Q</div><div class="faq-question-content faq-item-content">個人開発でどのパターンから始めるべきか</div></dt><dd class="faq-answer faq-item"><div class="faq-answer-label faq-item-label">A</div><div class="faq-answer-content faq-item-content">
<p class="wp-block-paragraph">Claude Code MaxプランのみのパターンAから始めるのが現実的。code-reviewer をサブエージェントで呼ぶ設定をCLAUDE.mdに1行追加するだけで、PRを作るたびに自動レビューが回せる。CodeRabbit FreeはGitHubに導入するだけで追加コストゼロなので、CI/CDがある場合は併用を推奨。<a href="https://shumatsu-lab.com/vibe-coding-claude-free-business-system/">バイブコーディングの実践記</a>のような実装速度優先の開発ほど、こういったレビュー網が効く。</p>
</div></dd></dl></div>



<h2 class="wp-block-heading"><span id="toc18">まとめ</span></h2>



<p class="wp-block-paragraph">実バグ6本・4手法のベンチマークで明らかになったことを3点に絞る。</p>



<ol class="wp-block-list">
<li><strong>Claude Code 内蔵 code-reviewer が検出率94%で最強</strong>。gitignore仕様など深い技術知識が必要な仕様系バグ（Bug3）を偽陽性ゼロで検出できる。Maxプランなら追加コストなし。</li>



<li><strong>/security-review はセキュリティ変更のある PRに必ず追加実行する価値がある</strong>。exploit scenarioと7分離された脆弱性報告はpentest相当の精度で、code-reviewerの検出内容と補完関係になる。</li>



<li><strong>「PR description + diff の整合性チェック」だけでは検出できないバグがある</strong>。Bug2のように元の設計意図の反転であるケースは、全LLMツールで見逃す構造的な限界がある。ツールへの過信ではなく、PRの書き方の改善（根本原因の明記）で対処する。</li>
</ol>



<p class="wp-block-paragraph">月$100のClaudeMaxプランに code-reviewer と /security-review を組み込めば、追加費用ゼロで実測94%＋セキュリティ専門レビューが完結する。外部LLM（Codex）は重要なPRのみに絞って使うのがコスパの良い選択肢だ。</p>




<div class="slb slb-profile">
  <div class="slb-profile__avatar">
          <img decoding="async" src="https://secure.gravatar.com/avatar/cb96d10a4f4bab829b35e83ca2b1d9cfa752aef03951f42b06f39ebc3b8019a4?s=128&#038;d=mm&#038;r=g" alt="ムラサキ">
      </div>
  <div class="slb-profile__body">
    <div class="slb-profile__name">ムラサキ</div>
    <div class="slb-mono slb-profile__title">SE歴20年 · 金融系システム開発課長 · 週末起業1年目</div>
    <div class="slb-profile__bio">システムエンジニア歴20年。金融系システム開発の課長として勤務する傍ら、AIと副業の最前線を実践レポート。Claude Code Max 5xプランを日常業務・副業開発に活用中。一次情報と実測値にこだわった記事を発信。</div>
    <div class="slb-profile__stats">
      <div>
        <span class="slb-profile__stat-val">20</span>
        <span class="slb-mono slb-profile__stat-label">YRS SE</span>
      </div>
      <div>
        <span class="slb-profile__stat-val">4</span>
        <span class="slb-mono slb-profile__stat-label">MOS 副業</span>
      </div>
      <div>
        <span class="slb-profile__stat-val">38</span>
        <span class="slb-mono slb-profile__stat-label">ARTICLES</span>
      </div>
    </div>
  </div>
</div>
    
]]></content:encoded>
					
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">1569</post-id>	</item>
	</channel>
</rss>
