Este é o segundo artigo de uma série de três sobre data fallacies, os erros mais comuns ao interpretar dados que, longe de nos ajudar, podem nos levar a decisões equivocadas.
No primeiro, falamos sobre a armadilha das métricas resumidas — você pode ver aqui —; hoje exploramos uma ainda mais perigosa porque se disfarça de perfeição: o overfitting.
Imagine alguém estudando para uma prova memorizando todas as perguntas dos anos anteriores. No dia do exame, pode tirar nota 10… mas se as perguntas mudarem, não saberá o que responder.
É exatamente isso que acontece com modelos de dados que caem no overfitting: parecem impecáveis porque se ajustam ao passado com total precisão, mas fracassam quando enfrentam novas situações.
Em outras palavras: os dados decoram, mas não aprendem a lição.
Previsão do tempo
Um modelo que se ajusta em detalhes a um único mês pode parecer preciso. Mas no mês seguinte, os padrões mudam e a previsão perde toda validade.
O GPS autoconfiante
Um GPS que memoriza cada buraco e cada semáforo do seu trajeto diário será perfeito… apenas naquele caminho. Se você viajar para outra cidade, torna-se inútil.
No mundo da gestão de pessoas, o overfitting aparece mais do que imaginamos:
Um modelo que explica perfeitamente os resultados de uma pesquisa… mas apenas para um período ou uma área. Ao aplicá-lo em outro contexto, falha.
Um indicador de rotatividade tão específico que reflete apenas casos particulares, sem ajudar a antecipar tendências reais.
Predições de desempenho com variáveis demais — muitas delas irrelevantes — que geram modelos frágeis e impossíveis de replicar.
O problema é que a precisão aparente nos engana: acreditamos ter o “modelo perfeito”, quando na verdade construímos um castelo de areia.
O overfitting nos lembra que o passado não garante o futuro. Em People Analytics — e em qualquer disciplina baseada em dados — não buscamos explicações que se encaixem perfeitamente no que já aconteceu, mas sim modelos robustos que nos permitam antecipar o que está por vir.
Às vezes, a perfeição nos dados não é uma conquista, mas uma armadilha.
Por Yoel Kluk, sócio da Olivia México.