Significado de la diferencia entre los medios

Después de leer este artículo, aprenderá sobre el significado de la diferencia entre los medios.

Supongamos que deseamos probar si los niños de 12 años y las niñas de 12 años de las Escuelas Públicas difieren en capacidad mecánica. Como las poblaciones de estos niños y niñas son demasiado grandes, tomamos una muestra aleatoria de tales niños y niñas, administramos una prueba y computamos los medios de los niños y niñas por separado.

Supongamos que la puntuación media de estos niños es 50 y la de esas niñas es 45. Marcamos una diferencia de 5 puntos entre los medios de niños y niñas. Puede ser un hecho que tal diferencia podría haber surgido debido a las fluctuaciones de muestreo.

Si tomamos otras dos muestras, una de la población de niños de 12 años y otra de la población de niñas de 12 años, encontraremos alguna diferencia entre los medios si continuamos repitiéndola durante un gran número de tiempo en el dibujo de muestras de Los niños de 12 años y las niñas de 12 años encontraremos que la diferencia entre dos conjuntos de medios variará.

A veces, esta diferencia será positiva, a veces negativa y, a veces, cero. La distribución de estas diferencias formará una distribución normal alrededor de una diferencia de cero. La SD de esta distribución se denomina error estándar de diferencia entre medias.

Para esto se utilizan los siguientes símbolos:

SEM 1 - M 2 o SE D o σ DM

Surgen dos situaciones con respecto a las diferencias entre medias:

(a) Aquellos en los cuales los medios no están correlacionados / son independientes, y

(b) Aquellos en los que los medios están correlacionados.

(a) SE de la diferencia entre dos medios independientes:

Los medios no están correlacionados o son independientes cuando se calculan a partir de diferentes muestras o de pruebas no correlacionadas administradas a la misma muestra.

En tal caso pueden surgir dos situaciones:

(i) Cuando los medios no están correlacionados o son independientes y las muestras son grandes, y

(ii) Cuando los medios no están correlacionados o son independientes y las muestras son pequeñas.

(i) SE de la diferencia (SE D ) cuando los medios no están correlacionados o son independientes y las muestras son grandes:

En esta situación, la SE D se puede calcular mediante la fórmula:

en la que SE D = error estándar de la diferencia de medias

SEm 1 = Error estándar de la media de la primera muestra

SEm 2 = error estándar de la media de la segunda muestra

Ejemplo 1:

Dos grupos, uno formado por 114 hombres y el otro de 175 mujeres. Las puntuaciones medias de hombres y mujeres en una prueba de construcción de palabras fueron de 19.7 y 21.0 respectivamente y las SD de estos dos grupos son de 6.08 y 4.89 respectivamente. Compruebe si la diferencia observada de 1.3 a favor de las mujeres es significativa a nivel .05 y .01.

Solución:

Es una prueba de dos colas → Como la dirección no está clara.

Para probar el significado de una diferencia obtenida entre dos medias de muestra, podemos continuar con los siguientes pasos:

Paso 1:

En el primer paso, debemos dejar claro si debemos realizar una prueba de dos colas o una prueba de una cola. Aquí queremos probar si la diferencia es significativa. Así que es una prueba de dos colas.

Paso 2:

Establecimos una hipótesis nula (H 0 ) de que no hay diferencia entre las medias poblacionales de hombres y mujeres en la construcción de palabras. Suponemos que la diferencia entre las medias poblacionales de dos grupos es cero, es decir, H o : D = 0.

Paso 3:

Entonces tenemos que decidir el nivel de significación de la prueba. En nuestro ejemplo, debemos probar la diferencia a un nivel de significancia de .05 y .01.

Etapa 4:

En este paso tenemos que calcular el error estándar de la diferencia entre medias, es decir, SE D.

Como nuestro ejemplo es un medio no correlacionado y muestras grandes, tenemos que aplicar la siguiente fórmula para calcular SE D :

Paso 5:

Después de calcular el valor de SE D, debemos expresar la diferencia de medias muestrales en términos de SE D. Como nuestro ejemplo es una facilidad de muestras grandes, tendremos que calcular Z donde,

Paso 6:

Con referencia a la naturaleza de la prueba en nuestro ejemplo, debemos averiguar el valor crítico para Z de la Tabla A tanto en .05 como en .01 de nivel de significancia.

De la Tabla A, Z.05 = 1.96 y Z.01 = 2.58. (Esto significa que el valor de Z para ser significativo a un nivel de .05 o menos debe ser 1.96 o más).

Ahora 1.91 <1.96, la diferencia marcada no es significativa a un nivel de .05 (es decir, se acepta H 0 ).

Interpretación:

Como la muestra es grande, podemos suponer una distribución normal de Z. La Z obtenida simplemente no alcanza el nivel de significancia de .05, que para muestras grandes es de 1.96.

En consecuencia, no rechazamos la hipótesis nula y diríamos que la diferencia obtenida no es significativa. En realidad, puede haber alguna diferencia, pero no tenemos suficiente seguridad de ello.

Una conclusión más práctica sería que no tenemos pruebas suficientes de cualquier diferencia de sexo en la capacidad de construir palabras, al menos en el tipo de población muestreada.

Ejemplo 2:

Los datos sobre el rendimiento de niños y niñas se dan como:

Compruebe si los niños o las niñas se desempeñan mejor y si la diferencia de 1.0 a favor de los niños es significativa a nivel de .05. Si aceptamos que la diferencia sea significativa, ¿cuál sería el error de Tipo 1?

Solución:

1.85 <1.96 (Z .05 = 1.96). Por lo tanto, se acepta H 0 y la marcada diferencia de 1.0 a favor de los niños no es significativa a nivel de .05.

Si aceptamos que la diferencia sea significativa, cometemos un error de Tipo 1. Al leer la Tabla A, encontramos que ± 1.85 Z incluye el 93.56% de los casos. Por lo tanto, al aceptar que la diferencia marcada es significativa, estamos equivocados en un 6.44% (100 - 93.56), por lo que el error de Tipo 1 es 0644.

Ejemplo 3:

La clase A se enseñó en un centro de entrenamiento intensivo, mientras que la clase B en una clase normal. Al final de un año escolar, las clases A y B promediaron 48 y 43 con SD 6 y 7.40 respectivamente.

Compruebe si el entrenamiento intensivo ha obtenido un aumento en la puntuación media para la Clase A. La clase A constituye 60 y la clase B 80 estudiantes.

. . . 4.42 es más que Z.01 o 2.33. Así que H o es rechazado. La marcada diferencia es significativa a nivel .01.

Por lo tanto, concluimos que el entrenamiento intensivo obtuvo buenas puntuaciones medias de Clase A.

(ii) El SE de la diferencia (SE D ) cuando los medios no están correlacionados o son independientes y las muestras son pequeñas:

Cuando las N de dos muestras independientes son pequeñas, la SE de la diferencia de dos medias se puede calcular utilizando las siguientes dos fórmulas:

Cuando se dan las puntuaciones:

donde x 1 = X 1 - M 1 (es decir, desviación de las puntuaciones de la primera muestra con respecto a la media de la primera muestra).

X 2 = X 2 - M 2 (es decir, la desviación de las puntuaciones de la segunda muestra de su media)

Cuando se dan los medios y las SD de ambas muestras:

Ejemplo 4:

Se administra una prueba de interés a 6 niños en una clase de formación profesional y a 10 niños en una clase de latín. ¿Es la diferencia de medias entre los dos grupos significativa a nivel .05?


Tabla de entrada:

D encontramos que con df = 14 el valor crítico de t en el nivel .05 es 2.14 y en el nivel .01 es 2.98. El valor calculado de 1.78 es inferior a 2.14 a un nivel de significancia de .05.

Por lo tanto, se acepta H 0 . Concluimos que no hay una diferencia significativa entre las puntuaciones medias de la Prueba de Interés de dos grupos de niños.

Ejemplo 5:

Se administra un inventario de personalidad en una escuela privada a 8 niños cuyos registros de conducta son ejemplares, y a 5 niños cuyos registros son muy pobres.

Los datos se dan a continuación:

¿La diferencia entre grupo significa significativa en el nivel .05? en el nivel 01?

Al ingresar a la Tabla D, encontramos que con df 11 el valor crítico de t en el nivel de .05 es 2.20 y en el nivel de .01 es 3.11. El valor calculado de 2.28 es solo más de 2.20 pero menos de 3.11.

Concluimos que la diferencia entre las medias de los grupos es significativa a nivel de .05 pero no significativa a nivel de .01.

Ejemplo 6:

En una prueba de razonamiento aritmético, 11 niños de diez años y 6 niñas de diez años obtuvieron los siguientes puntajes:

¿Es la diferencia de media de 2.50 significativa en el nivel de .05?

Solución:

Aplicando la fórmula (43 b).

Al ingresar a la Tabla D, encontramos que con df 15 el valor crítico de t en el nivel de .05 es 2.13. El valor obtenido de 1.01 es menor que 2.13. Por lo tanto, la marcada diferencia de 2.50 no es significativa a nivel .05.

(b) SE de la diferencia entre dos medios correlacionados:

(i) El método de grupo único:

Ya hemos tratado el problema de determinar si la diferencia entre dos medios independientes es significativa.

Ahora nos preocupa el significado de la diferencia entre los medios correlacionados. Los medios correlacionados se obtienen de la misma prueba administrada al mismo grupo en dos ocasiones.

Supongamos que hemos administrado una prueba a un grupo de niños y después de dos semanas repetiremos la prueba. Deseamos medir el efecto de la práctica o del entrenamiento especial en el segundo conjunto de puntuaciones. Para determinar la importancia de la diferencia entre los medios obtenidos en las pruebas iniciales y finales.

Debemos utilizar la fórmula:

en la que σ M1 y σ M2 = SE de los medios de prueba iniciales y finales

r 12 = Coeficiente de correlación entre las puntuaciones obtenidas en las pruebas iniciales y finales.

Ejemplo 7:

Al comienzo del año académico, el puntaje promedio de 81 estudiantes en una prueba de rendimiento educativo en lectura fue de 35 con un SD de 5.

Al final de la sesión, el puntaje promedio en una forma equivalente de la misma prueba fue de 38 con una SD de 4. La correlación entre los puntajes obtenidos en la prueba inicial y final fue de .53. ¿La clase ha hecho un progreso significativo en lectura durante el año?

Podemos tabular nuestros datos de la siguiente manera:

(Prueba a .01 nivel de significancia)

Solución:

Como solo nos preocupa el progreso o la ganancia, esta es una prueba de una cola.

Aplicando la fórmula:

Como hay 81 estudiantes, hay 81 pares de puntajes y 81 diferencias, de modo que el df se convierte en 81 - 1 u 80. En la Tabla D, la t para 80 df es 2.38 en el nivel de .02. (La tabla muestra 2.38 para la prueba de dos colas que es .01 para la prueba de una cola).

La t obtenida de 6.12 es mucho mayor que 2.38. De ahí que la diferencia sea significativa. Parece cierto que la clase hizo un progreso sustancial en la lectura durante el año escolar.

(ii) Método de diferencia:

Cuando los grupos son pequeños, utilizamos el "método de diferencia" para hacer cálculos fáciles y rápidos.

Ejemplo 8:

Diez sujetos reciben 5 ensayos sucesivos en una prueba de símbolos de dígitos de los cuales solo se muestran las puntuaciones de los ensayos 1 y 5. ¿Es significativa la ganancia media desde la prueba inicial hasta la final?

La columna de diferencia se encuentra a partir de la diferencia entre pares de puntuaciones. Se encuentra que la diferencia de medias es 4, y la SD en torno a esta media (SD D )

Calculando SE de la diferencia de medias:

En la que SE MD = Error estándar de la diferencia media

SD = Desviación estándar alrededor de la diferencia de medias.

La t obtenida de 5.26> 2.82. Nuestra t de 5.26 es mucho más grande, que el nivel .01 de 2.82 y hay pocas dudas de que la ganancia de la Prueba 1 a la Prueba 5 es significativa.

(iii) El método de grupos equivalentes:

Emparejamiento por pares:

A veces se nos puede pedir que comparemos el rendimiento medio de dos grupos equivalentes que se emparejan por pares.

En el método de grupos equivalentes, el emparejamiento se realiza inicialmente por pares para que cada persona en el primer grupo tenga una coincidencia en el segundo grupo.

En tales casos, el número de personas en ambos grupos es el mismo, es decir, n 1 = n 2 .

Aquí podemos calcular SE D usando la fórmula:

en el que SE M1 y SE M2 = errores estándar de las puntuaciones finales del Grupo — I y el Grupo — II respectivamente.

r 12 = Coeficiente de correlación entre los puntajes finales del grupo I y el grupo II.

Ejemplo 9:

Se formaron dos grupos sobre la base de los puntajes obtenidos por los estudiantes en una prueba de inteligencia. A uno de los grupos (grupo experimental) se le dio alguna instrucción adicional por un mes y al otro grupo (grupo controlado) no se le dio tal instrucción.

Después de un mes, ambos grupos recibieron la misma prueba y los datos relacionados con los puntajes finales se dan a continuación:

Interpretación:

Al ingresar a la tabla de t (Tabla D) con df 71, el valor crítico de t en el nivel de .05 en el caso de una prueba de una cola es 1.67. La t obtenida de 2.34> 1.67. De ahí que la diferencia sea significativa a nivel .05.

. . . La media ha aumentado debido a la instrucción adicional.

Con df de 71, el valor crítico de t en el nivel de .01 en el caso de la prueba de una cola es 2.38. Se obtiene así una t de 2, 34 <2, 38. De ahí que la diferencia no sea significativa a nivel .01.

Error estándar de la diferencia entre otras estadísticas:

(i) SE de la diferencia entre medianas no corregidas:

La importancia de la diferencia entre dos medianas obtenidas de muestras independientes se puede encontrar en la fórmula:

(ii) SE de la diferencia entre desviaciones estándar: