Medidas de dispersión

 

Medidas de dispersión

Las medidas de dispersión, también conocidas como medidas de variabilidad, son herramientas estadísticas que nos ayudan a cuantificar qué tan dispersos están los datos alrededor de su valor central. En otras palabras, nos indican qué tan "agrupados" o "esparcidos" están los datos.

Las medidas de dispersión más comunes son:

1. Rango: El rango es la diferencia entre el valor máximo y el valor mínimo del conjunto de datos. Es una medida simple y fácil de calcular, pero puede ser sensible a los valores atípicos. Se calcula como:

Rango = Valor máximo - Valor mínimo

2. Varianza: La varianza es el promedio de los cuadrados de las desviaciones de cada dato respecto a la media. Se representa matemáticamente como:

Para una población:

Varianza = Σ[(xᵢ - μ)²] / n 

Para una muestra:

Varianza = Σ[(xᵢ - μ)²] / (n - 1)

3. Desviación estándar: La desviación estándar es la raíz cuadrada de la varianza. Se representa como:

Desviación estándar = √Varianza

¿Cuándo usar cada medida?

La elección de la medida de dispersión más adecuada depende de las características del conjunto de datos y del objetivo del análisis.

  • El rango: es una medida simple y rápida de calcular, pero puede ser sensible a los valores atípicos. Se recomienda su uso cuando se quiere tener una idea general de la dispersión de los datos, pero no es la medida más precisa.
  • La varianza: es una medida más precisa que el rango, ya que no es tan sensible a los valores atípicos. Sin embargo, la varianza tiene unidades al cuadrado de las unidades de la variable original, lo que puede dificultar su interpretación.
  • La desviación estándar: es la medida de dispersión más utilizada, ya que tiene las mismas unidades que la variable original y es fácil de interpretar. Nos indica qué tan lejos, en promedio, se encuentran los datos de la media.

Ejemplo:

Supongamos que tenemos el mismo conjunto de datos de alturas de estudiantes que utilizamos en el ejemplo anterior:

{150 cm, 165 cm, 168 cm, 171 cm, 172 cm, 173 cm, 173 cm, 175 cm, 178 cm, 180 cm}

  • Rango: 180 cm - 150 cm = 30 cm
  • Varianza: [(150 - 171.4)² + (165 - 171.4)² + ... + (180 - 171.4)²] / 10 = 52.9 cm²
  • Desviación estándar: √52.9 cm² = 7.3 cm

En este caso, el rango nos indica que la altura de los estudiantes puede variar hasta 30 cm. La varianza nos dice que, en promedio, los datos se encuentran a 52.9 cm² de la media. La desviación estándar, por otro lado, nos informa que la altura promedio de los estudiantes se desvía 7.3 cm de la media.


Comentarios

Entradas más populares de este blog

El Teorema de Chebyshev y regla empírica

Calculo de la media con tabla de frecuencias y clases.

Medidas de forma: asimetría y curtosis