archivo

Conceptos básicos de estadística

En septiembre de 2024 publiqué el segundo artículo de la serie sobre ciencia de datos. En él se repasan las tablas de frecuencias y su representación gráfica en forma de histogramas.

A partir de un conjunto de datos ficticios, pensados para ejemplificar los conceptos, explico qué es una tabla de frecuencias y cómo se construye definiendo sus elementos uno por uno:

  • Frecuencia absoluta (n_i): número de veces que aparece un valor
  • Frecuencia absoluta acumulada (N_i): suma de las frecuencias absolutas de los valores iguales o inferiores.
  • Frecuencia relativa (f_i​): proporción de veces que aparece un valor sobre el total.
  • Frecuencia relativa acumulada (F_i​): Suma de las frecuencias relativas, indicando la proporción de valores iguales o inferiores.

Cuando la variable adquiere muchos valores distintos, como es el caso en los datos de ejemplo, es conveniente agrupar los datos con el objetivo de simplificar el análisis. En el texto presento un procedimiento adecuado de agrupación de variables.

Finalmente, repaso en detalle los gráficos de frecuencia, en concreto los histogramas, y muestro los métodos más comunes para establecer el número óptimo de contenedores:

  • Método de la raíz cuadrada (adecuado para conjuntos de datos pequeños)
  • Criterio de Sturges (para conjuntos de datos grandes).

Enlace al artículo original completo

El 29 de julio de 2024 inicié la publicación de una serie de artículos sobre Ciencia de Datos, en el blog de Datarmony. En el primero se repasan los conceptos estadísticos básicos, y se subraya la necesidad de dominar los conceptos estadísticos fundamentales antes de abordar herramientas avanzadas de modelización de datos.

Enlace al artículo completo en Datarmony