Medidas de forma: asimetría y curtosis

Momentos.

Las investigaciones estadísticas, en la mayoría de los casos, dan un conjunto grande de datos, los cuales a veces no permiten obtener la información solicitada. De ahí que sea necesario sustituir estos datos por unas pocas cantidades que representan adecuadamente ese conjunto. Estas cantidades se expresan comúnmente en forma de momentos. 

La teoría de los momentos se debe a Pearson y recibe este nombre por su semejanza con la teoría de los momentos que se estudian en mecánica. Los momentos se definen como promedios de potencias de las desviaciones de los valores de una serie de observaciones en relación con un valor arbitrario de ellos que bien puede ser la media aritmética. 

Se pudiera decir que existen n momentos, sin embargo, desde el punto de vista práctico, se utilizan solo los cuatro primeros.

Los momentos se miden mediante un origen A, ese origen deberá tener un sentido para la investigación.

Así un momento se calcula:

Donde:

  • M es el momento.
  • n el número de datos.
  • Xi el valor de cada dato
  • r el número del momento
  • A el origen.

De esta manera se tendrían los 4 momentos:

En el momento 1, cuando el origen A = 0, resulta:


Suponga ahora los siguientes datos {4, 7, 10, 13} y con un origen A = 9. La siguiente tabla muestra los cuatro momentos.


Ahora supongamos que el origen sea la media aritmética, es decir, A = 8.5, los momentos en este caso se ilustran en la siguiente tabla:


Para las propiedades de la media aritmética, tenemos que:

El momento 1 es cero y el momento 2 se aproxima a la varianza. El momento 3 también es cero, lo que nos indica que los datos son simétricos a la media.

Momentos para observaciones agrupadas.

Para observaciones agrupadas, la fórmula se debe ponderar con las frecuencias.

donde:

  • M es el momento.
  • n el número total de datos.
  • Yi la marca del grupo
  • r el número del momento
  • ni es la frecuencia del grupo.
  • A el origen.

Ejemplo: suponga los datos que se presentan en la tabla. 


El origen A se toma de la media aritmética y observamos los resultados de cada uno de los 4 momentos, como peso o marca del grupo se toma el valor medio entre el mínimo y máximo de cada uno de ellos.

Sesgo.

El sesgo es el grado de asimetría de una distribución.

Cuando la curva de la distribución tiende hacia la derecha con una cola a la izquierda se dice que la distribución está sesgada a la derecha o que tiene un sesgo positivo. En caso contrario se dice que tiene un sesgo negativo o que está sesgada a la izquierda.

En la imagen, se ilustra las propiedades que tiene cada uno de los sesgos con respecto a la media, mediana y moda.



El sesgo se puede medir de las siguientes formas:


Una forma es tomar la media aritmética restar la moda y el resultado se divide entre la desviación típica, o también a la diferencia entre la media aritmética y la mediana, se multiplica por 3, el resultado se divide entre la desviación estándar.

Existe también para estimar el Sesgo es usando el tercer momento.


En este caso el coeficiente se determina dividiendo el momento 3 entre el cubo de la desviación estándar, aunque igual se puede usar la raíz cuadrada del momento 2.

Recuerda que el momento dos se aproxima a la varianza.

Curtosis.

La curtosis mide que tan alta es la curva. Este medida se compara con la curva normal. Cuando la curva tiene un pico más alto a la normal se le conoce como leptocúrtica, si es más plana se le conoce como platicúrtica y mesocúrtica cuando se asemeja a la normal.



Una medida de la curtosis que utiliza el cuarto momento respecto a la media en forma adimensional:


Para la curva normal (mesocúrtica) el coeficiente es igual a 3, para leptocúrtica mayor que 3 y para platicúrtica menor que 3.

Bibliografía.

Guerra Bustillo, C. W. (2003). Estadística: ( ed.). Ciudad de la Habana, Cuba: Editorial Félix Varela. 

Comentarios

Entradas más populares de este blog

El Teorema de Chebyshev y regla empírica

Cuartiles, deciles y percentiles