IA em testes: produtividade com governança
Reportado pela TI INSIDE, o Itaú Unibanco elevou a cobertura de testes em 50% ao usar IA para gerar e manter testes de código (fonte). A oportunidade: acelerar qualidade sem aumentar risco.
Por que importa
- Velocidade: PRs menores, menos retrabalho
- Qualidade: bugs evitados antes do merge
- Custo: menos horas manuais em cenários repetitivos
- Risco: trilhas de auditoria de prompts, seeds e diffs
Stack mínimo
- Geração de testes com LLM sobre diffs: foco em funções mudadas e caminhos críticos
- Mutação: score de mutantes mortos para medir eficácia real da suite
- Contratos de API: casos derivados do schema + exemplos reais anonimizados
- CI com gates: cobertura no diff, tempo de execução e flakiness
- Governança: Data‑BOM de código, prompts versionados, reprodutibilidade por seed
Plano 30–60–90
- 30 dias: baseline de cobertura e flakiness; piloto em 2 serviços; LLM com policy e revisão humana
- 60 dias: mutação ativa; contratos de API; thresholds progressivos por módulo
- 90 dias: rollout por domínio; testes não funcionais (perf/segurança leve); painel de KPIs e custo por bug evitado
KPIs de verdade
- Cobertura no diff (linha e ramo)
- Score de mutação por módulo
- Tempo de ciclo de PR e taxa de reabertura
- Flakiness e MTTD/MTTR de regressões
- Bugs em produção por 1.000 deploys
Comece pequeno, meça tudo, promova o que reduz risco com menor atrito.









