Estadística MAT-G8-DBA5

Grado 8 · Matemáticas


La estadística profundiza en Grado 8 con las medidas de dispersión, complementarias a las medidas de tendencia central ya conocidas: media, mediana y moda. Mientras una medida central describe el valor representativo del conjunto, las medidas de dispersión describen qué tan compactos o esparcidos están los valores alrededor de ese centro.

La media aritmética se calcula sumando todos los valores y dividiendo entre el número total de datos n. Esta operación, descrita en grados anteriores, queda aquí formalizada como el primer paso para construir medidas más sofisticadas. La media es sensible a valores extremos, mientras la mediana resiste mejor su efecto.

La varianza mide la dispersión calculando el promedio de las diferencias al cuadrado entre cada dato y la media. Se obtiene la diferencia entre cada valor y la media, se eleva al cuadrado, y se promedian los cuadrados. La desviación estándar es la raíz cuadrada de la varianza y expresa la dispersión en las mismas unidades que los datos originales, lo cual la hace más interpretable.

Considérese el conjunto {4, 8, 6, 5, 7}. La media es (4 + 8 + 6 + 5 + 7)/5 = 6. Las diferencias al cuadrado son: 4, 4, 0, 1, 1. Se promedian: (4 + 4 + 0 + 1 + 1)/5 = 2. La desviación estándar es √2 ≈ 1.41. El lector observa que, en promedio, los datos se alejan de la media unas 1.41 unidades.

Al analizar dos variables simultáneamente, se examina la correlación mediante un diagrama de dispersión. Si los puntos tienden a alinearse hacia arriba, existe correlación positiva; si hacia abajo, negativa; y si no muestran patrón, no hay correlación. El estudio cuantitativo del grado de correlación se aborda en cursos posteriores.

0 10 20 30 40 50 3 6 9 5 2 media Intervalo de datos

Práctica

Dado el conjunto {10, 12, 14, 16, 18}, calcula la media aritmética, la varianza y la desviación estándar paso a paso, indicando cada operación. La media es (10 + 12 + 14 + 16 + 18)/5 = 70/5 = 14. Las diferencias al cuadrado son: (10−14)² = 16, (12−14)² = 4, (14−14)² = 0, (16−14)² = 4, (18−14)² = 16. La varianza es (16 + 4 + 0 + 4 + 16)/5 = 40/5 = 8. La desviación estándar es √8 ≈ 2.83.
Justifica por qué dos conjuntos pueden tener la misma media pero desviaciones estándar muy diferentes. Da un ejemplo y argumenta usando la definición de dispersión. La media describe el valor central, mientras que la desviación estándar describe la dispersión alrededor de ese centro. Por ejemplo, {4, 5, 6, 7, 8} y {1, 3, 6, 9, 11} tienen ambos media 6, pero el primero presenta datos compactos y el segundo, datos esparcidos. Por lo tanto la desviación estándar del primero es menor que la del segundo.
Según el histograma de arriba, ¿en qué intervalo se concentra la mayor parte de los datos? Identifica el intervalo modal y razona cómo se relaciona con la posición de la media. El intervalo modal es 20-30, con frecuencia 9 (la barra más alta). La línea vertical roja, que indica la media, se ubica precisamente en ese intervalo, lo cual es coherente: en distribuciones aproximadamente simétricas la media se sitúa cerca del intervalo de mayor frecuencia.