Gráficas

 

Los Histogramas: Una Ventana a la Distribución de Frecuencias

Los histogramas son herramientas gráficas de gran utilidad en el ámbito de la estadística, pues nos permiten visualizar la distribución de frecuencias de un conjunto de datos de manera clara y concisa. A través de barras verticales de alturas proporcionales a la frecuencia de cada intervalo de valores, los histogramas revelan cómo se reparten los datos a lo largo de un rango determinado.

    "Un histograma es una gráfica con barras de la misma anchura, dibujadas una junto a la otra (sin espacios entre sí). La escala horizontal representa clases de valores de datos cuantitativos, en tanto que la escala vertical representa frecuencias. Las alturas de las barras corresponden a los valores de frecuencia."[1]

¿Cómo funcionan los histogramas?

La construcción de un histograma implica seguir estos pasos:

  1. Agrupar los datos: Se dividen los datos en intervalos o clases, los cuales deben ser contiguos y de la misma amplitud. El número de clases dependerá de la cantidad y variabilidad de los datos.

  2. Determinar frecuencias: Se calcula la frecuencia absoluta o relativa para cada intervalo, es decir, la cantidad de datos o la proporción de datos que caen dentro de cada clase.

  3. Eje horizontal: Se define el eje horizontal (X) del gráfico, donde se ubican los intervalos o clases. Se pueden utilizar las marcas de clase, que representan el punto medio de cada intervalo.

  4. Eje vertical: Se define el eje vertical (Y), donde se representan las frecuencias. La escala del eje debe ser adecuada para abarcar todas las frecuencias.

  5. Dibujar las barras: Se dibujan barras verticales sobre cada intervalo, con una altura proporcional a la frecuencia absoluta o relativa correspondiente.

Ejemplo práctico: Distribución de las estaturas de un grupo de estudiantes

Supongamos que tenemos un conjunto de datos que representa las estaturas (en cm) de un grupo de 30 estudiantes:

{150, 152, 151, 153, 155, 154, 150, 152, 156, 157, 155, 153, 157, 154, 160, 159, 158, 154, 153, 152, 151, 156, 158, 155, 152, 154, 157, 153, 156}

  1. Agrupando los datos: Decidimos agrupar los datos en intervalos de 3 cm, obteniendo las siguientes clases:
ClaseFrecuencia absolutaFrecuencia relativa (%)
147 - 150413.33%
151 - 1531033.33%
154 - 156826.67%
157 - 159516.67%
160 - 162310.00%
  1. Ejes y escala: En el eje X ubicamos las clases (147-150, 151-153, etc.) y en el eje Y las frecuencias (que pueden ir de 0 a 10 o 15, según la cantidad de datos).

  2. Dibujando las barras: Dibujamos barras verticales sobre cada clase, con altura proporcional a la frecuencia correspondiente.


Figura 1. Histograma y polígono de frecuencias


Interpretación del histograma:

El histograma nos permite observar que la mayoría de los estudiantes se encuentran entre las estaturas de 151 cm y 156 cm. Además, podemos identificar una ligera asimetría hacia la derecha, lo que indica que hay una mayor cantidad de estudiantes con estaturas más altas que la media.

Los histogramas como herramientas valiosas:

Los histogramas son herramientas útiles para:

  • Visualizar la distribución de frecuencias de una variable cuantitativa continua.
  • Identificar la forma general de la distribución (simétrica, asimétrica, bimodal, etc.).
  • Estimar medidas de tendencia central (media, mediana) y dispersión (rango, desviación estándar).
  • Comparar distribuciones de diferentes conjuntos de datos.

Polígono de frecuencias.


    "Un polígono de frecuencias utiliza segmentos lineales conectados a puntos que se localizan directamente por encima de los valores de las marcas de clase. El polígono de frecuencias se construye a partir de una distribución de frecuencias, tal como se observa en la figura 1."[1]

Ojiva.

    "Una ojiva es una gráfica estadística que representa frecuencias acumuladas, y sirve para determinar el número de valores que se ubican por debajo de algún valor específico, tal como se ilustra en el ejemplo 3. Una ojiva es una gráfica lineal que describe frecuencias acumuladas y utiliza fronteras de clase a lo largo de la escala horizontal, y frecuencias acumuladas a lo largo del eje vertical."[1]

Figura 2. Ojiva

En resumen, los histogramas son herramientas gráficas de gran valor en el análisis de datos, ya que nos permiten comprender de manera visual y sencilla la distribución de frecuencias de una variable, facilitando la toma de decisiones y la realización de inferencias.

Ejercicio 1.

1. Elabore una tabla de distribución de frecuencias de las 20 temperaturas corporales (°F) que se listan a continuación.

97.1    97.2    97.5    97.6     97.6     97.8     98.0     98.0     98.2     98.2     98.2     98.3     98.4     98.6     98.6     98.7     98.7     98.9     99.1     99.4

Agrupe: Utilice una anchura de clase de 0.5 °F y un valor inicial de 97.0 °F.  

2. Histograma de temperaturas corporales: Elabore el histograma que corresponde a la distribución de frecuencias del ejercicio. Utilice los puntos medios de clase para la escala horizontal. ¿El histograma sugiere que los datos provienen de una población con distribución normal? ¿Por qué sí o por qué no? 

3. Gráfica de puntos de temperaturas corporales. Elabore una gráfica de puntos de las temperaturas corporales listadas en el ejercicio y una los puntos con líneas (Polígono de frecuencias) 

4. ¿Cuál es la mejor manera de ilustrar la distribución de los datos: el histograma del ejercicio o el polígono de frecuencias? 

5. Elabora la ojiva.

Ejercicio 2.

Los tiempos totales de juego en casa (horas) para todos los equipos de Grandes Ligas en un año reciente (con base en los datos de Baseball Prospectus):

236     237     238     239     241     241     242     245     245     245     246     247     247     248     248     249     250     250     250     251     252     252     253     253     258     258     258     260     262     264

1. Elabore una tabla de distribución de frecuencias. Utilice una anchura de clase de 5 horas y un tiempo de inicio de 235 horas. 

2. Distribución de frecuencias, busque lo siguiente. 

    a. Límites de la primera clase
    b. Fronteras de la primera clase
    c. Punto medio de la primera clase 

3. Histograma. Elabore el histograma correspondiente a la distribución de frecuencias del ejercicio 1. Para los valores en el eje horizontal, utilice los puntos medios de clase. ¿Cuál de las siguientes expresiones describe de mejor manera la distribución: uniforme, normal, asimétrica a la izquierda, asimétrica a la derecha? 

4. Elabore un polígono de frecuencias

5. Elabore una ojiva.

Referencias

  1. Triola, M. F. (2013). Estadística: (11 ed.). Pearson Educación. https://elibro.net/es/ereader/anahuacbiblio/37906?page=84

Comentarios

Entradas más populares de este blog

El Teorema de Chebyshev y regla empírica

Calculo de la media con tabla de frecuencias y clases.

Medidas de forma: asimetría y curtosis