
En julio de 2022, publiqué en LinkedIn este artículo sobre clases desbalanceadas y cómo tratarlas con «R».
Para mi proyecto final del curso Professional Certificate in Data Science, decidí abordar el desafío de predecir accidentes cerebrovasculares (ACV). El principal problema que encontré fue un severo desbalance de clases en el conjunto de datos: solo el 4% de los casos eran positivos para ACV. Esto hacía que cualquier modelo simple fuera inútil, ya que podía lograr un 96% de precisión simplemente prediciendo «no-stroke» en todos los casos.
Read More