{ "title": "AI 应用的核心优势 MVP", "excerpt": "探讨 AI 应用中最小可行产品(MVP)的概念,重点关注如何通过理解和有效解决用户需求来交付价值。", "content_html": "

最小可行产品(MVP)是指产品的一个版本,它具有刚好足够的功能供早期客户使用,这些客户随后可以为未来的产品开发提供反馈。

\n\n

今天我想重点讨论在交付 AI 应用时这意味着什么。为此,我们只需要理解 4 件事。

\n

80% 实际上意味着什么?
我们能很好地服务哪些细分用户群?
我们能否加倍投入?
我们能否向用户说明我们不能很好服务的细分用户群?

\n\n

帕累托原则,也被称为 80/20 法则,仍然适用,但适用方式可能与你想的不同。

\n\n

什么是 MVP?

\n

我经常用一个类比来帮助理解这个概念:你需要某样东西来帮助你从 A 点到达 B 点。也许愿景是拥有一辆汽车。然而,MVP 不是一个没有轮子或引擎的底盘。相反,它可能看起来像一个滑板。你会发布产品并意识到产品需要刹车或转向。所以接下来你发布一个滑板车。之后,你发现滑板车需要更多的杠杆作用,所以你添加更大的轮子,最终得到一辆自行车。受限于人类所能施加的力量,你开始考虑马达,并可以拓展到轻便摩托车、电动自行车和摩托车。然后有一天,发布汽车。

\n\n

考虑 80/20 法则

\n

当谈论某件事完成了 80% 或准备好了 80% 时,通常是在机器学习的意义上。在这种情况下,每个组件都是确定性的,这意味着 80% 转化为 10 个功能中有 8 个已完成。一旦剩余的 2 个功能准备就绪,我们就可以发布产品。然而,如果我们想遵循 80/20 法则,我们可能能够用 80% 的功能发布产品,然后稍后添加剩余的 20%,就像一辆没有收音机或空调的汽车。然而,80% 的含义可能有很大差异,这个定义可能不适用于 AI 驱动的应用。

\n\n

汇总统计的问题

\n $\"Anscombe's$ \n

上图是 Anscombe 四重奏的一个例子。它是一组四个数据集,具有几乎相同的简单描述性统计数据,但分布和外观却非常不同。这是一个经典的例子,说明为什么汇总统计可能具有误导性。

\n\n

考虑以下示例:

\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n

Query_id	score
1	0.9
2	0.8
3	0.9
4	0.9
5	0.0
6	0.0

\n\n

平均分数是 0.58。然而,如果我们在细分群体中分析查询,我们可能会发现我们正在为大多数查询提供极好的服务!

\n\n

\n
承认你不擅长的地方
\n
坦诚地说出你不擅长的地方是与用户建立信任的好方法。如果你能准确识别什么时候某些东西会表现不佳并自信地拒绝它,那么你可能已经准备好发布一个优秀的产品,同时向用户说明你应用的局限性。
\n

\n\n

理解系统的局限性并能够自信地理解系统在汇总统计之外的特征非常重要。这是因为并非所有系统都是平等的。概率系统的行为可能与前面的例子非常不同。考虑以下数据集:

\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n

Query_id	Score
1	.59
2	.58
3	.59
4	.57

\n

这样的系统也具有相同的平均分数 0.58,但拒绝任何请求子集并不那么容易...

\n\n

学会说不

\n

考虑一个 RAG 应用,其中很大一部分查询是关于时间线查询的。如果我们的搜索引擎不支持这种时间约束,我们很可能无法表现良好。

\n\n\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n

Query_id	Score	Query Type
1	0.9	text search
2	0.8	text search
3	0.9	news search
4	0.9	news search
5	0.0	timeline
6	0.0	timeline

\n\n

如果我们急于发布,我们可以简单地构建一个分类模型来检测这些问题是否是时间线问题并抛出警告。我们可以通过改变产品设计方式来教育用户,而不是不断尝试推动算法做得更好。

\n\n

\n
检测细分群体
\n
检测这些细分群体可以通过各种方式完成。我们可以构建一个分类器或使用语言模型对它们进行分类。此外,我们可以利用聚类算法和嵌入来识别常见组,并可能分析每个组内的平均分数。唯一的目标是识别能够增强我们对特定子组内活动理解的细分群体。
\n

\n\n

你能做的最糟糕的事情之一是花费数月时间构建一个只能稍微提高生产力的功能,同时忽略用户群中一些更重要的细分群体。

\n\n

通过重新设计我们的应用并认识到其局限性,我们可以通过识别我们可以拒绝的任务类型,在某些条件下潜在地提高性能。如果我们能够将这些细分数据放入某种系统内可观察性中,我们就可以安全地监控有多少比例的问题被拒绝,并优先考虑我们的工作以最大化覆盖范围。

\n\n

在做之前先弄清楚你真正想做什么

\n

我在与初创公司合作时注意到的一件危险的事情是,我们经常认为 AI 根本就能工作...因此,我们希望能够提供一个大型通用应用,而没有过多考虑我们到底想要完成什么。

\n\n

在我看来,大多数这些公司应该尝试专注于一两个重要领域,并确定一个好的利基市场作为目标。如果你的应用擅长一两项任务,就不可能找不到一两百个用户来测试你的应用并快速获得反馈。而如果你的应用什么都不擅长,就很难让人记住并提供具有重复使用价值的东西。你可能会获得一些病毒式传播,但很快,你就会失去用户的信任,并发现自己处于试图减少流失的境地。

\n\n

当我们前期就能够使用 GPT-4 进行预测时,反馈时间非常重要。如果我们能快速获得反馈,我们就能快速迭代。如果我们能快速迭代,我们就能构建更好的产品。

\n\n

最后的思考

\n

AI 应用的 MVP 并不像发布一个具有 80% 功能的产品那么简单。相反,它需要深入理解你能很好服务的用户细分群体,以及向用户说明你不能很好服务的细分群体的能力。通过理解系统的局限性并专注于细分市场,你可以构建一个令人难忘且能提供重复使用价值的产品。这将使你能够快速获得反馈并快速迭代,最终通过识别你的核心优势来打造更好的产品。

", "source_hash": "sha256:bd2871ce1f7be1eb8b82f87af3b6a125ec8b75299b758ba02e9c9ff25c11df30", "model": "claude-sonnet-4-5-20250929", "generated_at": "2026-01-02T00:14:54.966344+00:00" }