Gráficas
Los Histogramas: Una Ventana a la Distribución de Frecuencias
Los histogramas son herramientas gráficas de gran utilidad en el ámbito de la estadística, pues nos permiten visualizar la distribución de frecuencias de un conjunto de datos de manera clara y concisa. A través de barras verticales de alturas proporcionales a la frecuencia de cada intervalo de valores, los histogramas revelan cómo se reparten los datos a lo largo de un rango determinado.
"Un histograma es una gráfica con barras de la misma anchura, dibujadas una junto a la otra (sin espacios entre sí). La escala horizontal representa clases de valores de datos cuantitativos, en tanto que la escala vertical representa frecuencias. Las alturas de las barras corresponden a los valores de frecuencia."[1]
¿Cómo funcionan los histogramas?
La construcción de un histograma implica seguir estos pasos:
Agrupar los datos: Se dividen los datos en intervalos o clases, los cuales deben ser contiguos y de la misma amplitud. El número de clases dependerá de la cantidad y variabilidad de los datos.
Determinar frecuencias: Se calcula la frecuencia absoluta o relativa para cada intervalo, es decir, la cantidad de datos o la proporción de datos que caen dentro de cada clase.
Eje horizontal: Se define el eje horizontal (X) del gráfico, donde se ubican los intervalos o clases. Se pueden utilizar las marcas de clase, que representan el punto medio de cada intervalo.
Eje vertical: Se define el eje vertical (Y), donde se representan las frecuencias. La escala del eje debe ser adecuada para abarcar todas las frecuencias.
Dibujar las barras: Se dibujan barras verticales sobre cada intervalo, con una altura proporcional a la frecuencia absoluta o relativa correspondiente.
Ejemplo práctico: Distribución de las estaturas de un grupo de estudiantes
Supongamos que tenemos un conjunto de datos que representa las estaturas (en cm) de un grupo de 30 estudiantes:
{150, 152, 151, 153, 155, 154, 150, 152, 156, 157, 155, 153, 157, 154, 160, 159, 158, 154, 153, 152, 151, 156, 158, 155, 152, 154, 157, 153, 156}
- Agrupando los datos: Decidimos agrupar los datos en intervalos de 3 cm, obteniendo las siguientes clases:
| Clase | Frecuencia absoluta | Frecuencia relativa (%) |
|---|---|---|
| 147 - 150 | 4 | 13.33% |
| 151 - 153 | 10 | 33.33% |
| 154 - 156 | 8 | 26.67% |
| 157 - 159 | 5 | 16.67% |
| 160 - 162 | 3 | 10.00% |
Ejes y escala: En el eje X ubicamos las clases (147-150, 151-153, etc.) y en el eje Y las frecuencias (que pueden ir de 0 a 10 o 15, según la cantidad de datos).
Dibujando las barras: Dibujamos barras verticales sobre cada clase, con altura proporcional a la frecuencia correspondiente.
Interpretación del histograma:
El histograma nos permite observar que la mayoría de los estudiantes se encuentran entre las estaturas de 151 cm y 156 cm. Además, podemos identificar una ligera asimetría hacia la derecha, lo que indica que hay una mayor cantidad de estudiantes con estaturas más altas que la media.
Los histogramas como herramientas valiosas:
Los histogramas son herramientas útiles para:
- Visualizar la distribución de frecuencias de una variable cuantitativa continua.
- Identificar la forma general de la distribución (simétrica, asimétrica, bimodal, etc.).
- Estimar medidas de tendencia central (media, mediana) y dispersión (rango, desviación estándar).
- Comparar distribuciones de diferentes conjuntos de datos.
Polígono de frecuencias.
Ojiva.
En resumen, los histogramas son herramientas gráficas de gran valor en el análisis de datos, ya que nos permiten comprender de manera visual y sencilla la distribución de frecuencias de una variable, facilitando la toma de decisiones y la realización de inferencias.
Ejercicio 1.
1. Elabore una tabla de distribución de frecuencias de las 20 temperaturas corporales (°F) que se listan a continuación.
97.1 97.2 97.5 97.6 97.6 97.8 98.0 98.0 98.2 98.2 98.2 98.3 98.4 98.6 98.6 98.7 98.7 98.9 99.1 99.4
Agrupe: Utilice una anchura de clase de 0.5 °F y un valor inicial de 97.0 °F.
2. Histograma de temperaturas corporales: Elabore el histograma que corresponde a la distribución de frecuencias del ejercicio. Utilice los puntos medios de clase para la escala horizontal. ¿El histograma sugiere que los datos provienen de una población con distribución normal? ¿Por qué sí o por qué no?
3. Gráfica de puntos de temperaturas corporales. Elabore una gráfica de puntos de las temperaturas corporales listadas en el ejercicio y una los puntos con líneas (Polígono de frecuencias)
4. ¿Cuál es la mejor manera de ilustrar la distribución de los datos: el histograma del ejercicio o el polígono de frecuencias?
5. Elabora la ojiva.
Ejercicio 2.
Los tiempos totales de juego en casa (horas) para todos los equipos de Grandes Ligas en un año reciente (con base en los datos de Baseball Prospectus):
236 237 238 239 241 241 242 245 245 245 246 247 247 248 248 249 250 250 250 251 252 252 253 253 258 258 258 260 262 264
1. Elabore una tabla de distribución de frecuencias. Utilice una anchura de clase de 5 horas y un tiempo de inicio de 235 horas.
2. Distribución de frecuencias, busque lo siguiente.
a. Límites de la primera clase
b. Fronteras de la primera clase
c. Punto medio de la primera clase
3. Histograma. Elabore el histograma correspondiente a la distribución de frecuencias del ejercicio 1. Para los valores en el eje horizontal, utilice los puntos medios de clase. ¿Cuál de las siguientes expresiones describe de mejor manera la distribución: uniforme, normal, asimétrica a la izquierda, asimétrica a la derecha?
4. Elabore un polígono de frecuencias
5. Elabore una ojiva.
Referencias
- Triola, M. F. (2013). Estadística: (11 ed.). Pearson Educación. https://elibro.net/es/ereader/anahuacbiblio/37906?page=84


Comentarios
Publicar un comentario