Tema 4. Medidas de posición y variabilidad

De CNB
Ir a la navegación Ir a la búsqueda
Busca en cnbGuatemala con Google

Aprendo y Enseño Conjunto, Sistemas Númericos y Operaciones icono1.jpg

Inicio[editar | editar código]

Aprendo y Enseño Conjunto, Sistemas Númericos y Operaciones icono4.jpg

Indicador de logro

  1. Calcula medidas de posición y medidas de dispersión o de variabilidad de una distribución de frecuencias agrupadas en intervalos.

1. Calcule la media, moda y mediana.

  • Explique los hallazgos.

En la tabla 1 se muestra la tabulación de las estaturas de 60 niños de segundo grado.

Límites reales Marca de clase (xs) Frecuencia (f) Frecuencia acumulada (fa)
Inferior Superior
101.25 104.51 102.88 9 9
104.51 107.67 106.04 19 28
107.67 110.83 109.2 21 49
110.83 113.99 112.36 7 56
113.99 117.15 115.52 4 60
Aprendo y enseño - Matemáticas 6 pag(21).jpg
Figura 1

Razonamiento matemático

Para calcular la media [math]\displaystyle{ \overline{X}=\frac{\sum fx_s}{N} }[/math], se suman todos los productos de las frecuencias con su respectiva marca de clase:[math]\displaystyle{ \sum fx_s=6482.48 }[/math], y se divide entre el número total de datos [math]\displaystyle{ N=60 }[/math]; entonces, [math]\displaystyle{ \overline{X}= 108.04 cm }[/math], significa que el promedio de estatura está en [math]\displaystyle{ 1.07 metros }[/math]. Para calcular la moda [math]\displaystyle{ Mo=L_{RI}+\frac{f_p}{f_p+f_a}a }[/math], se identifica la frecuencia absoluta mayor para ubicar que [math]\displaystyle{ L_{RI}=107.67 }[/math]; la frecuencia absoluta posterior es [math]\displaystyle{ f_p=7 }[/math] y la frecuencia absoluta anterior es [math]\displaystyle{ f_a=19 }[/math]; la amplitud es [math]\displaystyle{ a=104.51–101.25–0.1=3.16 }[/math] (se resta 0.1 por ser los límites reales), entonces [math]\displaystyle{ Mo= 108.52 cm }[/math], que es la medida la que más se repite en el grupo de [math]\displaystyle{ 60 }[/math] alumnos.

Para calcular la mediana [math]\displaystyle{ Me=L_{RI}+\frac{N/_2^{-f a^a}}{f} a }[/math]; N/2=30; entonces, la frecuencia absoluta que se acerca es [math]\displaystyle{ f_a=49 }[/math], se identifica [math]\displaystyle{ fa_a=28 }[/math], la frecuencia absoluta es [math]\displaystyle{ f=21 }[/math], el limite real inferior [math]\displaystyle{ L_{RI}=107.67 }[/math] y la amplitud es [math]\displaystyle{ a=3.16 }[/math] (calculada con anterioridad). La mediana es [math]\displaystyle{ Me=107.97cm }[/math]. Este valor divide al grupo en dos partes: 50% mide más y 50%, menos.

Desarrollo[editar | editar código]

Aprendo y Enseño Conjunto, Sistemas Númericos y Operaciones icono4.jpg

Nuevos conocimientos[editar | editar código]

1. Resuelva.

La tabla 2 muestra las puntuaciones de un examen diagnóstico de matemáticas.

  • Calcule el percentil 27.
  • ¿Entre qué valores se encuentra el 50% central de los individuos?
  • Calcule la desviación media y la desviación típica para las notas del examen diagnóstico.
Figura 2
Notas f fa
0 a 10 8 8
10 a 20 22 30
20 a 30 32 62
30 a 40 44 106
40 a 50 28 134
50 a 60 20 154
60 a 70 6 160

Nuevos aprendizajes[editar | editar código]

El percentil (P) El percentil es una medida de posición usada en estadística que indica, una vez ordenados los datos de menor a mayor, el valor de la variable por debajo del cual se encuentra un porcentaje dado de observaciones en un grupo de observaciones.
Los cuartiles (Q) Son los valores que dividen a los datos en cuatro partes iguales. Estos valores, representados por Q1, Q2 y Q3, se llaman primer, segundo y tercer cuartil.
Desviación media Es la distancia entre cualquier porcentaje no procesado y su media, también podemos decir que la desviación de un dato es la diferencia entre este y la media aritmética del grupo o de la distribución de la cual se extrae.
Desviación estándar o típica También llamada desviación cuadrática media, la podemos definir como la raíz cuadrada de la media de las desviaciones de la media de una distribución elevada al cuadrado. Representa la variabilidad promedio de una distribución porque mide el promedio de las desviaciones de la media. Debemos tomar en cuenta que mientras mayor sea la dispersión alrededor de la media, mayor será la desviación estándar. Por ejemplo, s=4.4 indica una mayor variabilidad que si s=2.4.

Cálculo de percentiles y cuartiles[editar | editar código]

Para datos agrupados, se emplea la siguiente expresión para calcular los percentiles: [math]\displaystyle{ P_y=L+\frac{\frac{yN}{100}-fai}{f}i }[/math]

yN= determina el intervalo donde se encuentra el percentil en la columna de la frecuencia acumulada.

L= es el límite inferior del intervalo donde se encuentra el percentil buscado.

y = percentil buscado.

N= total de los casos o suma de las frecuencias.

fai= frecuencia acumulada anterior al intervalo en donde se encuentra el percentil buscado.

f= frecuencia del intervalo en donde se encuentra el percentil buscado.

i= amplitud del intervalo.

yN= 0.27*160=43.2, se busca el valor igual o próximo mayor en la columna de frecuencia acumuladas; en este caso es 62. El percentil 27 está en el intervalo 20 a 30, entonces:

[math]\displaystyle{ P_27=20+\frac{43.2-30}{32} 10=24.125 }[/math], las notas de la prueba son inferiores a [math]\displaystyle{ 24 }[/math] puntos.

Para datos agrupados, se emplea la siguiente expresión para calcular los cuartiles: [math]\displaystyle{ Q_1=L+\frac{N/_4 -fai}{f}i Q_2=L+\frac{2N/_4 -fai}{f}i Q_3=L+\frac{3N/_4 -fai}{f}i }[/math]

Se trata de calcular el primer cuartil, que dejará por debajo el 25% inferior, y el tercer cuartil, que dejará por encima el 25% superior. De esta forma, entre ambos valores se encontrará el 50% central.

Para el primer cuartil: [math]\displaystyle{ N/4=160/4=40 }[/math]. La primera frecuencia acumulada que supera este valor es 62; por consiguiente, el primer cuartil se encuentra en el intervalo de 20 a 30, aplicamos la fórmula para su determinación:[math]\displaystyle{ Q_1=20+\frac{40-30}{43}10=23.125 }[/math]

Las tres cuartas partes del tamaño de la muestra son 3N/4= 120. La primera frecuencia acumulada que supera este valor es 134; por tanto, el tercer cuartil se encuentra en el intervalo de 40 a 50 y su valor es:[math]\displaystyle{ Q_3=40+\frac{120-106}{28}10=45 }[/math]

El 50% central de notas está arriba de 23 puntos y por debajo de 45 puntos.

N/n: determina el intervalo donde se encuentra el cuartil buscado.

L= es el límite inferior del intervalo donde se encuentra el cuartil buscado.

y = percentil buscado.

N= total de los casos.

fai= frecuencia acumulada anterior al intervalo en donde se encuentra el cuartil buscado.

f= frecuencia del intervalo en donde se encuentra el cuartil buscado.

i= amplitud del intervalo.

Desviación media y desviación estándar[editar | editar código]

Para datos agrupados, se emplea la siguiente expresión para calcular desviación media y desviación estándar o típica:

[math]\displaystyle{ D.M.=\frac{\sum f\mid x_s -\overline{x}\mid}{N} }[/math]

Desviación media

[math]\displaystyle{ S=\sqrt{\frac{{\sum f\mid x_s -\overline{x}\mid}^2}{N}} }[/math]

Desviación estándar o típica

[math]\displaystyle{ \overline{x} }[/math]= media de los datos

[math]\displaystyle{ x_s }[/math]= marca de clase

[math]\displaystyle{ f }[/math]= frecuencia

[math]\displaystyle{ N }[/math]= total de datos en la muestra

Las rayas verticales de la fórmula nos indican que se deben sumar los valores absolutos de las desviaciones; es decir, debemos sumar todos los valores sin tomar en cuenta el signo negativo.

2. Observe la tabla 3 y realice lo que se le indica.

  • Calcule la media.

[math]\displaystyle{ \overline{X}=\frac{\sum fx_s}{N} = \overline{X}\frac{5460}{160}=34.125 }[/math]

[math]\displaystyle{ D.M.=\frac{\sum f\mid x_s -\overline{x}\mid}{N} D.M=\frac{1891.5}{160}=11.82 }[/math]

Tabla 3
Límite inferior Límite superior [math]\displaystyle{ f }[/math] [math]\displaystyle{ x_s }[/math] [math]\displaystyle{ f*x_s }[/math] [math]\displaystyle{ \overline{X} }[/math] [math]\displaystyle{ x_s − \overline{X} }[/math] [math]\displaystyle{ f\mid x_s -\overline{x}\mid }[/math] [math]\displaystyle{ {f\mid x_s -\overline{x}\mid}^2 }[/math]
0 10 8 5 40 34.125 -29.125 233 6786.125
10 20 22 15 330 34.125 -19.125 420.75 8046.844
20 30 32 25 800 34.125 -9.125 292 2664.5
30 40 44 35 1540 34.125 0.875 38.5 33.688
40 50 28 45 1260 34.125 10.875 304.5 3311.438
50 60 20 55 1100 34.125 20.875 417.5 8715.313
60 70 6 65 390 34.125 30.875 185.25 5719.594
[math]\displaystyle{ \sum }[/math] 5460 [math]\displaystyle{ \sum }[/math] 1891.5 35277.5
  • Con los datos de la tabla 3, calcule la desviación media (D.M.).

El resultado de la desviación media indica que el promedio de las desviaciones entre los datos y la media es 11.82.

  • Calcule la desviación estándar o típica. [math]\displaystyle{ S=\sqrt{\frac{{\sum f\mid x_s -\overline{x}\mid}^2}{N}} }[/math]

[math]\displaystyle{ S=\sqrt{\frac{35277.5}{160}}=14.85 }[/math]

La desviación estándar o típica indica que la dispersión a la que están los datos con respecto de la media es 14.85.

Cierre[editar | editar código]

Ejercicios del tema[editar | editar código]

Aprendo y Enseño Conjunto, Sistemas Númericos y Operaciones icono2.jpg

1. Resuelva el siguiente problema.

Los datos que se observan en la tabla 4 corresponden a los tiempos, medidos en minutos, que hicieron 33 jóvenes al participar en la maratón organizada por la municipalidad de la comunidad.

a. Realice los cálculos para completar la tabla 4 (observe la tabla 3).
b. Si descontamos el 15 % de los individuos que hicieron menos tiempo y el 15% de los que hicieron más tiempo, ¿en qué intervalo de puntuación se encuentran los restantes?
c. ¿Entre qué valores se encuentra el 50% central de los individuos?
d. Calcule la desviación media y la desviación típica para los tiempos.
Tabla 4
Límite inferior Límite superior [math]\displaystyle{ f }[/math] [math]\displaystyle{ fa }[/math] [math]\displaystyle{ x_s }[/math] [math]\displaystyle{ f*x_s }[/math] [math]\displaystyle{ \overline{X} }[/math] [math]\displaystyle{ x_s − \overline{X} }[/math] [math]\displaystyle{ f\mid x_s -\overline{x}\mid }[/math] [math]\displaystyle{ f\mid x_s -\overline{x}\mid^2 }[/math]
45 51 4 4 48 192 13.27 53.08 704.3716
51 57 6 10 54 324 7.27 43.62 317.1174
57 63 11 21 60 660 1.27 13.97 17.7419
63 69 3 24
69 75 9 33
[math]\displaystyle{ \sum }[/math] [math]\displaystyle{ \sum }[/math]

Razonamiento matemático a. Las marcas de clase son [math]\displaystyle{ 66 }[/math] y [math]\displaystyle{ 72 }[/math]; los productos de [math]\displaystyle{ f*x_s }[/math] son [math]\displaystyle{ 198 }[/math] y [math]\displaystyle{ 648 }[/math], la sumatoria es [math]\displaystyle{ 2022 }[/math]. La media es [math]\displaystyle{ 61.27 }[/math]. Las diferencias de marca de clase menos media son [math]\displaystyle{ 4.73 }[/math] y [math]\displaystyle{ 10.73 }[/math]. Los productos de frecuencia por las diferencias son [math]\displaystyle{ 14.19 }[/math] y [math]\displaystyle{ 96.57 }[/math], la sumatoria es [math]\displaystyle{ 221.43 }[/math]. Los productos de la frecuencia por la diferencia al cuadrado son: [math]\displaystyle{ 67.20 }[/math] y 1[math]\displaystyle{ 036.20 }[/math], la sumatoria es [math]\displaystyle{ 2142.56 }[/math].

b. Para obtener el intervalo de puntuación, se deben de calcular el percentil [math]\displaystyle{ 15 }[/math] y el percentil [math]\displaystyle{ 85:P_15+\frac{4.95-4}{4} 6=52.43 }[/math] y [math]\displaystyle{ P_85=69+\frac{28.05-20}{69} 6=74.37 }[/math], el intervalo de los restantes es [math]\displaystyle{ 57 al 69 }[/math].

c. Para encontrar los valores en los que está el [math]\displaystyle{ 50% }[/math], se debe calcular el primer cuartil, que dejará por debajo el [math]\displaystyle{ 25% }[/math] inferior, y el tercer cuartil, que dejará por encima el 25% superior.

[math]\displaystyle{ Q_1=51+\frac{8.25-4}{6}6=55.25 }[/math] y [math]\displaystyle{ Q_3=69+\frac{24.75-24}{9}6=69.5 }[/math]. El intervalo donde está el [math]\displaystyle{ 50% }[/math] central de los tiempos es de [math]\displaystyle{ 57 a 69 }[/math].

d. La desviación media es:[math]\displaystyle{ D.M=\frac{211}{33}=6.39 }[/math]. La desviación típica es:[math]\displaystyle{ s=\sqrt{\frac{2181.95}{33}}=8.13 }[/math]

Identificación de una enfermedad a partir de sus síntomas. También: acción y efecto de recoger y analizar datos para evaluar problemas de diversa naturaleza.