Diagrama de caja

Diagrama de caja.

Un diagrama de caja, también conocido como box plot, es una representación gráfica que muestra la distribución de un conjunto de datos numéricos a través de sus cuartiles. Este tipo de diagrama es útil para visualizar la mediana, los cuartiles y los valores extremos de los datos, proporcionando una forma rápida de identificar la dispersión y la simetría de los datos, así como los valores atípicos.

 

Diagrama de caja


Diagrama de caja


Componentes de un diagrama de caja:

  1. Valor mínimo: El valor más pequeño del conjunto de datos.
  2. Primer cuartil (Q1): El 25% de los datos están por debajo de este valor.
  3. Mediana (Q2): El valor central que divide el conjunto de datos en dos partes iguales.
  4. Tercer cuartil (Q3): El 75% de los datos están por debajo de este valor.
  5. Valor máximo: El valor más grande del conjunto de datos.
  6. Bigotes: Líneas que se extienden desde los extremos de la caja hasta los valores mínimos y máximos, excluyendo los valores atípicos.

Ejemplo:

Supongamos que tenemos el siguiente conjunto de datos: [1, 2, 2, 4, 6, 6.8, 7.2, 8, 8.3, 9, 10, 10, 11.5] son 13 valores

Para construir el diagrama de caja:

  • Valor mínimo: 1
  • Primer cuartil (Q1): 2
  • Mediana (Q2): 7
  • Tercer cuartil (Q3): 9
  • Valor máximo: 11.5

El diagrama de caja se vería así:


  • La caja se extiende desde Q1 (2) hasta Q3 (9).
  • La línea dentro de la caja marca la mediana (7).
  • Los bigotes se extienden desde el valor mínimo (1) hasta el valor máximo (11.5).


Este diagrama proporciona una visión clara de la distribución de los datos, mostrando la concentración de los valores y la presencia de posibles valores atípicos.

Comentarios

Entradas más populares de este blog

El Teorema de Chebyshev y regla empírica

Calculo de la media con tabla de frecuencias y clases.

Medidas de forma: asimetría y curtosis