{
  "title": "AIアプリケーションにおける強みを活かしたMVP",
  "excerpt": "AIアプリケーションにおけるミニマムバイアブルプロダクト(MVP)の概念を探求し、ユーザーのニーズを理解し効果的に対処することで価値を提供することに焦点を当てます。",
  "content_html": "<p>ミニマムバイアブルプロダクト(MVP)とは、初期顧客が使用できる最小限の機能を備えた製品のバージョンであり、それによって将来の製品開発のためのフィードバックを得ることができます。</p>\n\n<p>今日は、AIアプリケーションをリリースする際にそれがどのようなものかに焦点を当てたいと思います。そのためには、4つのことを理解するだけで十分です。</p>\n\n<ul>\n<li>80%とは実際に何を意味するのか?</li>\n<li>どのセグメントに優れたサービスを提供できるか?</li>\n<li>それを強化できるか?</li>\n<li>サービスが不十分なセグメントについてユーザーを教育できるか?</li>\n</ul>\n\n<p>パレートの法則、別名80/20の法則は依然として適用されますが、あなたが考えるのとは異なる方法で適用されます。</p>\n\n<h3>MVPとは何か?</h3>\n\n<p>この概念を理解するためによく使う例えは次のとおりです:地点Aから地点Bへ移動するための何かが必要です。おそらくビジョンは車を持つことでしょう。しかし、MVPは車輪やエンジンのないシャーシではありません。代わりに、スケートボードのようなものかもしれません。リリースして、製品にはブレーキやハンドルが必要だと気づきます。そこでスクーターをリリースします。その後、スクーターにはもっとテコの力が必要だと分かり、より大きな車輪を追加して自転車になります。人間として加えられる力に限界があるため、モーターについて考え始め、原付、電動自転車、オートバイへと展開できます。そしてある日、車をリリースします。</p>\n\n<h3>80/20の法則を考える</h3>\n\n<p>何かが80%完成している、または80%準備ができていると話すとき、それは通常、機械学習の意味です。この文脈では、各コンポーネントは決定論的であり、80%は10個の機能のうち8個が完成していることを意味します。残りの2つの機能が準備できたら、製品をリリースできます。しかし、80/20の法則に従いたい場合、80%の機能で製品をリリースし、残りの20%を後で追加することができるかもしれません。ラジオやエアコンのない車のようなものです。しかし、80%の意味は大きく異なる可能性があり、この定義はAI搭載アプリケーションには当てはまらないかもしれません。</p>\n\n<h4>要約統計の問題</h4>\n\n<p><img src=\"/assets/images/anscombes_quartet.png\" alt=\"Anscombe's quartet\" class=\"post-img\" /></p>\n\n<p>上の画像はAnscombeの四重奏の例です。これは、ほぼ同一の単純な記述統計を持ちながら、非常に異なる分布と外観を持つ4つのデータセットのセットです。これは、要約統計がいかに誤解を招く可能性があるかの古典的な説明です。</p>\n\n<p>次の例を考えてみましょう:</p>\n\n<table>\n    <thead>\n        <tr>\n            <th>Query_id</th>\n            <th>score</th>\n        </tr>\n    </thead>\n    <tbody>\n        <tr>\n            <td>1</td>\n            <td>0.9</td>\n        </tr>\n        <tr>\n            <td>2</td>\n            <td>0.8</td>\n        </tr>\n        <tr>\n            <td>3</td>\n            <td>0.9</td>\n        </tr>\n        <tr>\n            <td>4</td>\n            <td>0.9</td>\n        </tr>\n        <tr>\n            <td>5</td>\n            <td>0.0</td>\n        </tr>\n        <tr>\n            <td>6</td>\n            <td>0.0</td>\n        </tr>\n    </tbody>\n</table>\n\n<p>平均スコアは0.58です。しかし、セグメント内のクエリを分析すると、大多数のクエリに対して非常に優れたサービスを提供していることがわかるかもしれません!</p>\n\n<blockquote>\n<p><strong>苦手なことを認める</strong></p>\n\n<p>苦手なことに正直であることは、ユーザーとの信頼を築く素晴らしい方法です。何かがうまく機能しないときを正確に特定し、自信を持ってそれを拒否できるなら、アプリケーションの限界についてユーザーを教育しながら、優れた製品をリリースする準備ができているかもしれません。</p>\n</blockquote>\n\n<p>システムの限界を理解し、要約統計を超えてシステムの特性を自信を持って理解できることが非常に重要です。これは、すべてのシステムが同じように作られているわけではないためです。確率的システムの動作は、前の例とは大きく異なる可能性があります。次のデータセットを考えてみましょう:</p>\n\n<table>\n    <thead>\n        <tr>\n            <th>Query_id</th>\n            <th>Score</th>\n        </tr>\n    </thead>\n    <tbody>\n        <tr>\n            <td>1</td>\n            <td>.59</td>\n        </tr>\n        <tr>\n            <td>2</td>\n            <td>.58</td>\n        </tr>\n        <tr>\n            <td>3</td>\n            <td>.59</td>\n        </tr>\n        <tr>\n            <td>4</td>\n            <td>.57</td>\n        </tr>\n    </tbody>\n</table>\n\n<p>このようなシステムも同じ平均スコア0.58を持っていますが、リクエストのサブセットを拒否するのはそう簡単ではありません...</p>\n\n<h3>ノーと言うことを学ぶ</h3>\n\n<p>クエリの大部分がタイムラインクエリに関するRAGアプリケーションを考えてみましょう。検索エンジンがこの時間制約をサポートしていない場合、おそらく良いパフォーマンスを発揮できないでしょう。</p>\n\n<table>\n    <thead>\n        <tr>\n            <th>Query_id</th>\n            <th>Score</th>\n            <th>Query Type</th>\n        </tr>\n    </thead>\n    <tbody>\n        <tr>\n            <td>1</td>\n            <td>0.9</td>\n            <td>text search</td>\n        </tr>\n        <tr>\n            <td>2</td>\n            <td>0.8</td>\n            <td>text search</td>\n        </tr>\n        <tr>\n            <td>3</td>\n            <td>0.9</td>\n            <td>news search</td>\n        </tr>\n        <tr>\n            <td>4</td>\n            <td>0.9</td>\n            <td>news search</td>\n        </tr>\n        <tr>\n            <td>5</td>\n            <td>0.0</td>\n            <td>timeline</td>\n        </tr>\n        <tr>\n            <td>6</td>\n            <td>0.0</td>\n            <td>timeline</td>\n        </tr>\n    </tbody>\n</table>\n\n<p>リリースを急いでいる場合、これらの質問がタイムラインの質問かどうかを検出する分類モデルを構築し、警告を表示することができます。アルゴリズムをより良くするために常に努力する代わりに、ユーザーを教育し、製品の設計方法を変更することで彼らを教育することができます。</p>\n\n<blockquote>\n<p><strong>セグメントの検出</strong></p>\n\n<p>これらのセグメントの検出は、さまざまな方法で達成できます。分類器を構築したり、言語モデルを使用して分類したりできます。さらに、埋め込みを使用したクラスタリングアルゴリズムを利用して共通グループを特定し、各グループ内の平均スコアを分析することもできます。唯一の目的は、特定のサブグループ内の活動についての理解を深めることができるセグメントを特定することです。</p>\n</blockquote>\n\n<p>最悪なことの1つは、生産性をわずかしか向上させない機能の構築に数か月を費やし、ユーザーベースのより重要なセグメントを無視することです。</p>\n\n<p>アプリケーションを再設計し、その限界を認識することで、辞退できるタスクの種類を特定することにより、特定の条件下でパフォーマンスを向上させる可能性があります。このセグメントデータを何らかのシステム内観測性に入れることができれば、どの程度の質問が拒否されているかを安全に監視し、カバレッジを最大化するために作業の優先順位を付けることができます。</p>\n\n<h3>実行する前に実際に何をしようとしているのかを理解する</h3>\n\n<p>スタートアップと仕事をしていて気づいた危険なことの1つは、AIがそもそも機能すると考えがちだということです...その結果、正確に何を達成したいのかをあまり考えずに、大規模な汎用アプリケーションを提供できるようにしたいと思っています。</p>\n\n<p>私の意見では、これらの企業のほとんどは、1つか2つの重要な分野に焦点を当て、ターゲットとする良いニッチを特定すべきです。アプリケーションが1つか2つのタスクが得意であれば、アプリケーションをテストして迅速にフィードバックを得るための100人か200人のユーザーを見つけられないはずがありません。一方、アプリケーションが何も得意でなければ、記憶に残り、繰り返し使用されるものを提供することは難しくなります。バイラリティを得られるかもしれませんが、非常に早く、ユーザーの信頼を失い、チャーンを減らそうとする立場に立たされます。</p>\n\n<p>GPT-4を使用して予測を行う能力とフィードバックまでの時間が前倒しされている場合、それは非常に重要です。迅速にフィードバックを得ることができれば、迅速に反復できます。迅速に反復できれば、より良い製品を構築できます。</p>\n\n<h3>最終的な考え</h3>\n\n<p>AIアプリケーションのMVPは、機能の80%を備えた製品をリリースするほど単純ではありません。代わりに、優れたサービスを提供できるユーザーのセグメントを深く理解し、優れたサービスを提供できないセグメントについてユーザーを教育する能力が必要です。システムの限界を理解し、ニッチに絞り込むことで、記憶に残り、繰り返し使用されるものを提供する製品を構築できます。これにより、迅速にフィードバックを得て迅速に反復できるようになり、最終的には強みの分野を特定することで、より良い製品につながります。</p>",
  "source_hash": "sha256:bd2871ce1f7be1eb8b82f87af3b6a125ec8b75299b758ba02e9c9ff25c11df30",
  "model": "claude-sonnet-4-5-20250929",
  "generated_at": "2026-01-02T00:15:09.441198+00:00"
}