{
  "title": "Um MVP de demonstração de força para Aplicações de IA",
  "excerpt": "Explorando o conceito de Produto Mínimo Viável (MVP) em aplicações de IA, focando em entregar valor através da compreensão e atendimento eficaz das necessidades dos usuários.",
  "content_html": "<p>Um produto mínimo viável (MVP) é uma versão de um produto com recursos suficientes para ser utilizável por clientes iniciais, que podem então fornecer feedback para o desenvolvimento futuro do produto.</p>\n\n<p>Hoje quero focar em como isso se parece para o lançamento de aplicações de IA. Para isso, precisamos entender apenas 4 coisas.</p>\n<ul>\n<li>O que 80% realmente significa?</li>\n<li>Quais segmentos podemos atender bem?</li>\n<li>Podemos redobrar esforços?</li>\n<li>Podemos educar o usuário sobre os segmentos que não atendemos bem?</li>\n</ul>\n\n<p>O princípio de Pareto, também conhecido como regra 80/20, ainda se aplica, mas de uma forma diferente do que você pode pensar.</p>\n\n<h3>O que é um MVP?</h3>\n<p>Uma analogia que costumo usar para ajudar a entender este conceito é a seguinte: Você precisa de algo para ajudar a ir do ponto A ao ponto B. Talvez a visão seja ter um carro. No entanto, o MVP não é um chassi sem rodas ou motor. Em vez disso, pode parecer um skate. Você vai lançar e perceber que o produto precisa de freios ou direção. Então você lança um patinete. Depois, você descobre que o patinete precisa de mais alavancagem, então você adiciona rodas maiores e acaba com uma bicicleta. Limitado pela força que você pode aplicar como ser humano, você começa a pensar em motores e pode se expandir para ciclomotores, e-bikes e motocicletas. Então um dia, lança o carro.</p>\n\n<h3>Considere a regra 80/20</h3>\n<p>Quando falamos sobre algo estar 80% pronto ou 80% completo, geralmente é em um sentido de aprendizado de máquina. Neste contexto, cada componente é determinístico, o que significa que 80% se traduz em 8 de 10 recursos estarem completos. Uma vez que os 2 recursos restantes estejam prontos, podemos lançar o produto. No entanto, se quisermos seguir a regra 80/20, talvez possamos lançar o produto com 80% dos recursos e depois adicionar os 20% restantes mais tarde, como um carro sem rádio ou ar condicionado. Porém, o significado de 80% pode variar significativamente, e esta definição pode não se aplicar a uma aplicação alimentada por IA.</p>\n\n<p><strong>O problema com Estatísticas Resumidas</strong></p>\n<img src=\"/assets/images/anscombes_quartet.png\" alt=\"Anscombe's quartet\" class=\"post-img\" />\n<p>A imagem acima é um exemplo do quarteto de Anscombe. É um conjunto de quatro conjuntos de dados que têm estatísticas descritivas simples quase idênticas, mas distribuições e aparências muito diferentes. Esta é uma explicação clássica de por que estatísticas resumidas podem ser enganosas.</p>\n\n<p>Considere o seguinte exemplo:</p>\n\n<table>\n    <thead>\n        <tr>\n            <th>Query_id</th>\n            <th>score</th>\n        </tr>\n    </thead>\n    <tbody>\n        <tr>\n            <td>1</td>\n            <td>0.9</td>\n        </tr>\n        <tr>\n            <td>2</td>\n            <td>0.8</td>\n        </tr>\n        <tr>\n            <td>3</td>\n            <td>0.9</td>\n        </tr>\n        <tr>\n            <td>4</td>\n            <td>0.9</td>\n        </tr>\n        <tr>\n            <td>5</td>\n            <td>0.0</td>\n        </tr>\n        <tr>\n            <td>6</td>\n            <td>0.0</td>\n        </tr>\n    </tbody>\n</table>\n\n<p>A pontuação média é 0.58. No entanto, se analisarmos as consultas dentro de segmentos, podemos descobrir que estamos atendendo a maioria das consultas excepcionalmente bem!</p>\n\n<blockquote>\n<p><strong>Admitindo no que você é ruim</strong></p>\n<p>Ser honesto sobre no que você é ruim é uma ótima maneira de construir confiança com seus usuários. Se você conseguir identificar com precisão quando algo terá um desempenho ruim e rejeitá-lo com confiança, então você pode estar pronto para lançar um ótimo produto enquanto educa seus usuários sobre as limitações da sua aplicação.</p>\n</blockquote>\n\n<p>É muito importante entender as limitações do seu sistema e ser capaz de entender com confiança as características do seu sistema além das estatísticas resumidas. Isso ocorre porque nem todos os sistemas são iguais. O comportamento de um sistema probabilístico pode ser muito diferente do exemplo anterior. Considere o seguinte conjunto de dados:</p>\n\n<table>\n    <thead>\n        <tr>\n            <th>Query_id</th>\n            <th>Score</th>\n        </tr>\n    </thead>\n    <tbody>\n        <tr>\n            <td>1</td>\n            <td>.59</td>\n        </tr>\n        <tr>\n            <td>2</td>\n            <td>.58</td>\n        </tr>\n        <tr>\n            <td>3</td>\n            <td>.59</td>\n        </tr>\n        <tr>\n            <td>4</td>\n            <td>.57</td>\n        </tr>\n    </tbody>\n</table>\n<p>Um sistema como este também tem a mesma pontuação média de 0.58, mas não é tão fácil rejeitar qualquer subconjunto de solicitações...</p>\n\n<h3>Aprendendo a dizer não</h3>\n<p>Considere uma aplicação RAG onde uma grande proporção das consultas são sobre consultas de linha do tempo. Se nossos mecanismos de busca não suportam essa restrição de tempo, provavelmente não conseguiremos ter um bom desempenho.</p>\n\n<table>\n    <thead>\n        <tr>\n            <th>Query_id</th>\n            <th>Score</th>\n            <th>Query Type</th>\n        </tr>\n    </thead>\n    <tbody>\n        <tr>\n            <td>1</td>\n            <td>0.9</td>\n            <td>text search</td>\n        </tr>\n        <tr>\n            <td>2</td>\n            <td>0.8</td>\n            <td>text search</td>\n        </tr>\n        <tr>\n            <td>3</td>\n            <td>0.9</td>\n            <td>news search</td>\n        </tr>\n        <tr>\n            <td>4</td>\n            <td>0.9</td>\n            <td>news search</td>\n        </tr>\n        <tr>\n            <td>5</td>\n            <td>0.0</td>\n            <td>timeline</td>\n        </tr>\n        <tr>\n            <td>6</td>\n            <td>0.0</td>\n            <td>timeline</td>\n        </tr>\n    </tbody>\n</table>\n\n<p>Se estivermos apertados para lançar, poderíamos simplesmente construir um modelo de classificação que detecta se essas perguntas são ou não perguntas de linha do tempo e lançar um aviso. Em vez de constantemente tentar forçar o algoritmo a fazer melhor, podemos educar o usuário e educá-los mudando a forma como podemos projetar o produto.</p>\n\n<blockquote>\n<p><strong>Detectando segmentos</strong></p>\n<p>Detectar esses segmentos pode ser realizado de várias maneiras. Poderíamos construir um classificador ou empregar um modelo de linguagem para categorizá-los. Além disso, podemos utilizar algoritmos de clustering com os embeddings para identificar grupos comuns e potencialmente analisar as pontuações médias dentro de cada grupo. O único objetivo é identificar segmentos que possam melhorar nossa compreensão das atividades dentro de subgrupos específicos.</p>\n</blockquote>\n\n<p>Uma das piores coisas que você pode fazer é passar meses construindo um recurso que aumenta sua produtividade apenas um pouco enquanto ignora algum segmento mais importante da sua base de usuários.</p>\n\n<p>Ao redesenhar nossa aplicação e reconhecer suas limitações, podemos potencialmente melhorar o desempenho sob certas condições identificando os tipos de tarefas que podemos recusar. Se formos capazes de colocar esses dados de segmento em algum tipo de Observabilidade no Sistema, podemos monitorar com segurança que proporção de perguntas está sendo recusada e priorizar nosso trabalho para maximizar a cobertura.</p>\n\n<h3>Descubra o que você está realmente tentando fazer antes de fazê-lo</h3>\n<p>Uma das coisas perigosas que notei trabalhando com startups é que muitas vezes pensamos que a IA funciona de fato... Como resultado, queremos ser capazes de servir uma grande aplicação geral sem muito pensamento sobre o que exatamente queremos realizar.</p>\n\n<p>Na minha opinião, a maioria dessas empresas deveria tentar focar em uma ou duas áreas significativas e identificar um bom nicho para mirar. Se seu aplicativo é bom em uma ou duas tarefas, não há como você não conseguir encontrar uma ou duas centenas de usuários para testar sua aplicação e obter feedback rapidamente. Enquanto que, se sua aplicação não é boa em nada, vai ser difícil ser memorável e fornecer algo que tenha uso repetido. Você pode conseguir alguma viralidade, mas muito rapidamente, você vai perder a confiança dos seus usuários e se encontrar em uma posição onde está tentando reduzir a rotatividade.</p>\n\n<p>Quando estamos com antecedência, a capacidade de usar GPT-4 para fazer previsões, e o tempo para feedback é muito importante. Se conseguirmos obter feedback rapidamente, podemos iterar rapidamente. Se podemos iterar rapidamente, podemos construir um produto melhor.</p>\n\n<h3>Considerações finais</h3>\n<p>O MVP para uma aplicação de IA não é tão simples quanto lançar um produto com 80% dos recursos. Em vez disso, requer um profundo entendimento dos segmentos dos seus usuários que você pode atender bem e a capacidade de educar seus usuários sobre os segmentos que você não atende bem. Ao entender as limitações do seu sistema e se especializar, você pode construir um produto que seja memorável e forneça algo que tenha uso repetido. Isso permitirá que você obtenha feedback rapidamente e itere rapidamente, levando em última análise a um produto melhor, identificando suas demonstrações de força.</p>",
  "source_hash": "sha256:bd2871ce1f7be1eb8b82f87af3b6a125ec8b75299b758ba02e9c9ff25c11df30",
  "model": "claude-sonnet-4-5-20250929",
  "generated_at": "2026-01-02T00:14:49.619207+00:00"
}