Este es el segundo artículo de una serie de tres sobre data fallacies, los errores más comunes al interpretar datos que, lejos de ayudarnos, pueden llevarnos a decisiones equivocadas.
En el primero hablamos de la trampa de las métricas resumidas —pueden verlo aquí—; hoy exploramos una más peligrosa porque se disfraza de perfección: el sobreajuste o overfitting.
Imagina que alguien estudia para un examen memorizando todas las preguntas de años anteriores. El día de la prueba puede sacar un 10… pero si cambian las preguntas, no sabrá qué responder. Eso mismo pasa con los modelos de datos que caen en el overfitting: parecen impecables porque se ajustan al pasado con total precisión, pero fracasan cuando se enfrentan a nuevas situaciones.
En otras palabras: los datos aprenden de memoria, no la lección.
En el mundo de la gestión de personas, el overfitting aparece más de lo que creemos:
El problema es que la precisión aparente nos engaña: creemos tener el “modelo perfecto”, cuando en realidad hemos construido un castillo de arena.
El overfitting nos recuerda que el pasado no garantiza el futuro. En People Analytics —y en cualquier disciplina basada en datos— no buscamos explicaciones que encajen como guante en lo que ya pasó, sino modelos robustos que nos permitan anticipar lo que viene.
A veces, la perfección en los datos no es un logro, sino una trampa.
Por Yoel Kluk, socio de Olivia México.