Medición de la variabilidad: una visión general

Medición de la variabilidad: una visión general!

Significado de la variabilidad:

Variabilidad significa 'Dispersión' o 'Propagación'. Por lo tanto, las medidas de variabilidad se refieren a la dispersión o dispersión de las puntuaciones en torno a su tendencia central. Las medidas de variabilidad indican cómo la distribución se dispersa por encima y por debajo de la oferta central.

Del siguiente ejemplo podemos obtener una idea clara sobre el concepto de medidas de variabilidad:

Supongamos que hay dos grupos. En un grupo hay 50 niños y en otro grupo 50 niñas. Se administra una prueba a ambos grupos. La puntuación media de los varones y de 54.4 y niñas es que comparamos la puntuación media de ambos grupos, encontramos que no hay diferencia en el rendimiento de los dos grupos. Pero supongamos que los puntajes de los varones varían de 20 a 80 y los puntajes de las niñas de 40 a 60.

Esta diferencia en el rango muestra que los niños son más variables, porque cubren más territorio que las niñas. Si el grupo contiene individuos con capacidades muy diferentes, los puntajes se dispersarán de alto a bajo, el rango será relativamente amplio y la variabilidad aumentará.

Esta situación puede ilustrarse gráficamente en las siguientes figuras:

La figura anterior muestra dos distribuciones de frecuencia de algunas áreas (N) y otras medias (50) pero de variabilidad muy diferente. El grupo A varía de 20 a 80 y el grupo B de 40 a 60. El grupo A es tres veces más variable que el grupo B-Spreads en tres veces la distancia en la escala de puntajes, aunque ambas distribuciones tienen cierta tendencia central.

Definiciones de variabilidad:

Diccionario de educación — CV bueno. "La dispersión o variabilidad de las observaciones de una distribución sobre alguna medida de la tendencia central". Collins Dictionary of Statistics: "La dispersión es la propagación de una distribución"

AL Bowley:

"La dispersión es la medida de la variación de los elementos".

Brooks y Dicks:

“Dispersión o dispersión es el grado de dispersión o variación de las variables sobre un valor central”. Por lo tanto, la propiedad que denota la medida en que los valores se dispersan sobre los valores centrales se llama dispersión. También indica la falta de uniformidad en el tamaño de los artículos de una distribución.

Necesidad de variabilidad:

1. Ayuda a verificar las medidas de desviación.

Las medidas de variabilidad nos ayudan a medir el grado de desviación que existe en los datos. De esta forma, se pueden determinar los límites dentro de los cuales se navegarán los datos en una variedad o calidad mensurable.

2. Ayuda a comparar diferentes grupos:

Con la ayuda de medidas de validez podemos comparar los datos originales expresados ​​en diferentes unidades.

3. Es útil complementar la información proporcionada por las medidas de tendencia central.

4. Es útil calcular estadísticas avanzadas adicionales basadas en las medidas de dispersión.

Medidas de variabilidad:

Hay cuatro medidas de variabilidad:

1. El rango

2. La desviación del cuartil

3. La desviación media

4. La desviación estándar

Estos son:

1. El rango:

El rango es la diferencia entre una serie. Es la medida más general de propagación o dispersión. Es una medida de la variabilidad de las variedades u observación entre sí y no da una idea sobre la difusión de las observaciones en torno a algún valor central.

Rango = H — L

Aquí H = puntaje más alto

L = puntaje más bajo

Ejemplo:

En una clase, 20 estudiantes han obtenido las siguientes calificaciones:

22, 48, 43, 60, 55, 25, 15, 45, 35, 68, 50, 70, 35, 40, 42, 48, 53, 44, 55, 52

Aquí: la puntuación más alta es 70

La puntuación más baja es 15

Rango = H - L = 70 –15 = 55

Si el rango es más alto que el grupo, indica una mayor heterogeneidad y si el rango es más bajo que el grupo indica una mayor homogeneidad. Por lo tanto, el rango nos proporciona una indicación instantánea y aproximada de la variabilidad de una distribución.

Méritos de rango:

1. El rango se calcula fácilmente y se comprende fácilmente.

2. Es la medida más simple de variabilidad.

3. Proporciona una estimación rápida de la medida de variabilidad.

Deméritos de rango:

1. El rango se ve muy afectado por la fluctuación de las puntuaciones.

2. No se basa en todas las observaciones de la serie. Solo se tienen en cuenta las puntuaciones más altas y más bajas.

3. En el caso de distribuciones abiertas, no se puede utilizar el rango.

4. Se ve afectado en gran medida por las fluctuaciones en el muestreo.

5. Se ve afectado en gran medida por puntajes extremos.

6. La serie no está verdaderamente representada por rango. Una distribución simétrica y una distribución simétrica pueden tener el mismo rango pero no la misma dispersión.

Usos de la gama:

1. El rango se usa como una medida de dispersión cuando las variaciones en el valor de la variable no son muchas.

2. El rango es la mejor medida de la variabilidad cuando los datos están muy dispersos o son muy escasos.

3. El rango se usa cuando se desea el conocimiento de puntaje extremo o distribución total.

4. Cuando se utiliza una estimación rápida de la variabilidad, se utiliza el rango.

2. La desviación del cuartil (Q):

Junto al rango de desviación del cuartil hay otra medida de variabilidad. Se basa en el intervalo que contiene el cincuenta por ciento medio de los casos en una distribución dada. Un cuarto significa 1/4 de algo, cuando una escala se divide en cuatro partes iguales. "La desviación del cuartil o Q es la mitad de la distancia de la escala entre los percentiles 75 y 25 en una distribución de frecuencia".

De la figura 9.2, encontramos que el primer cuartil o Q 1 es la posición en una distribución por debajo del cual el 25% de los casos, y por encima del cual el 75% se encuentra. El segundo cuartil o Q2 es una posición por debajo y por encima de la cual se encuentra el 50% de los casos. Es la mediana de la distribución.

El tercer cuartil o Qg es el percentil 75, por debajo del cual se encuentra el 75% de los casos y por encima del cual se encuentra el 25%. Entonces, la desviación del cuartil (Q) es la mitad de las distancias de escala entre el tercer cuartil (Q 3 ) y el primer cuartil (Q 1 ). También se conoce como la rabia semi-intercuartil.

Simbólicamente

Por lo tanto, para calcular la desviación del cuartil, primero debemos calcular el primer cuartil (Q 1 ) y el tercer cuartil (Q 3 )

Donde = L = Límite inferior de la clase del primer cuartil,

La clase del primer cuartil es esa clase, cuya frecuencia acumulada es mayor que el valor de N / 4 cuando se calcula desde el extremo inferior.

N / 4 = Un cuarto del número total de casos.

F = Frecuencia acumulada del intervalo de clase por debajo de

1er cuartil de clase.

Fq 1 = La frecuencia de la clase Q 1

i = Tamaño del intervalo de clase 3N

Donde: L = Límite inferior de la clase del tercer cuartil

La clase del tercer cuartil es aquella clase cuya frecuencia acumulada (C f ) es mayor que el valor de 3N / 4, es decir, Cf> 3N / 4, cuando Cf se calcula desde el extremo inferior.

3N / 4 = th de N o 75% del número total de casos.

F = Frecuencia acumulada de la clase debajo de la clase.

fq 2 = La frecuencia de la clase Q 3 .

i = Tamaño del intervalo de clase.

Cálculo del cuartil a partir de datos de grupo:

Ejemplo:

Descubre la desviación del cuartil de los siguientes datos:

Pasos para calcular la desviación del cuartil:

Paso 1:

Calcule N / 4, es decir, el 25% de la distribución y 3N / 4, es decir, el 75% de la distribución.

Aquí –N = 50 entonces N / 4 = 12.5

y 3N / 4 = 37.5

Paso 2:

Calcular la C f desde el extremo inferior. Como en la tabla-9.1 columna-3.

Paso 3:

Descubre las clases Q 1 y Q 3 .

En este ejemplo:

Ci, 60—64 es clase Q1 porque C f > N / 4

Ci 75—79 es clase Q 3 porque

los Cf> 3N / 4

Etapa 4:

Averigüe F para Q 1 clase y Q 3 clase. En este ejemplo

F para Q 1 clase = 10

F para la clase Q3 = 30 pasos

Paso 5:

Averigüe Q1 poniendo los valores anteriores en la fórmula.

Q 1 = L + N / 4 - F / fq1 xi

Aquí L = 59.5 porque los límites exactos de Q 1 clase 60—64 es 59.5-64.5.

F = 10 el Cf debajo de la clase Q 1

Fq 1 = 4: la frecuencia exacta de la clase Q 1

i = 5, tamaño del intervalo de clase

N / 4 = 12.5

Ahora Q 1 = 59.5+ 12.5-10 / 4 x 5

= 59.5 + 2.5 / 4 x 5

= 59.5 + 0.63 x 5

= 59.5 + 3.13 = 62.63

Paso 6:

Descubre el Q 3 poniendo los valores en la fórmula.

Aquí L = 74.5 porque los límites exactos de la clase Q 3 75—79 es 74.5—79.5.

F = 30 el Cf debajo de la clase Q 3 .

3N / 4 = 37.5

Fq 1 = 8 la frecuencia exacta de la clase Q 3 .

i = 5 tamaño de los intervalos de clase.

Q 3 = 74.5 + 37.5-30 / 8 x 5

= 74.5 + 7.5 / 8 x 5 = 74.5 + .94 x 5

= 74.5 + 4.7 = 79.2

Paso 7:

Averigüe Q poniendo el valor anterior en la fórmula.

Q = Q 3 -Q 1/2 = 79.2 - 62.63 / 2

= 16.5 / 2 = 8.285 = 8.29

Méritos de la desviación del cuartil:

1. La desviación del cuartil es simple de calcular y fácil de entender.

2. Es más representativo y digno de confianza que el alcance. En el caso de intervalos de clase abiertos se utiliza en el estudio de medidas de dispersión.

3. En el caso de intervalos de clase abiertos, se utiliza en el estudio de medidas de dispersión.

4. Es un buen índice de densidad de puntuación en la mitad de la distribución.

5. Cuando tomamos Mediana como la medida de la tendencia central en ese momento, se prefiere Q como la medida de la dispersión.

6. Al igual que el rango no se ve afectado por puntajes extremos.

Deméritos de desviación del cuartil:

1. No se basa en todas las observaciones de datos. Ignora el primer 25% y el último 25% de las puntuaciones.

2. No es posible un tratamiento algebraico adicional en el caso de Q. Es solo un promedio posicional. No estudia la variación de los valores de una variable de ningún promedio. Simplemente indica una distancia en una escala.

3. Se ve afectado por la fluctuación de las puntuaciones. Su valor se ve afectado en cualquier caso, por un cambio en el valor de una sola puntuación.

4. Q no es una medida adecuada de dispersión, cuando en una serie hay una variación considerable en los valores de varias puntuaciones.

Usos de la desviación del cuartil:

1. Cuando Mediana es la medida de la tendencia central, en ese momento se usa Q como medida de la dispersión.

2. Cuando las puntuaciones extremas afectan la SD o las puntuaciones se dispersan en ese momento, Q se utiliza como medida de variabilidad.

3. Cuando nuestro principal interés es conocer la concentración alrededor de la mediana, el 50% de los casos, en ese momento se usa Q.

4. Cuando los intervalos de clase son abiertos, Q se usa como medida de dispersión.

3. La desviación media (AD):

Hemos discutido acerca de dos variabilidad, rango y desviación del cuartil. Pero ninguna de estas dispersiones indica la composición de la distribución. Se debe a que ambas dispersiones no tienen en cuenta todas las puntuaciones individuales. Podemos superar algunas de las deficiencias graves del rango y la desviación del cuartil usando otra dispersión llamada desviación media o desviación media.

"La desviación media es la media aritmética de todas las desviaciones de diferentes puntuaciones del valor medio de las puntuaciones sin tener en cuenta el signo de la desviación".

De este modo, la desviación media es la media aritmética de las desviaciones de una serie calculada a partir de alguna medida de tendencia central. Por lo tanto, la desviación promedio es la media de las desviaciones tomadas de su media (a veces de la mediana y la moda).

Definiciones:

Diccionario Collins de Estadísticas:

"La desviación promedio es la media de los valores absolutos de las diferencias entre los valores de una variable y la media de su distribución".

Diccionario de Educación, CV Bueno:

"Una medida que expresa la cantidad promedio por la cual los elementos individuales en una distribución se desvían de una medida de tendencia central, como la media de la mediana".

SE Garrett:

"La desviación promedio o AD es la media de las desviaciones de todas las puntuaciones separadas en una serie tomada de su media (ocasionalmente de la mediana o el modo)".

Por lo tanto, se puede decir que la desviación promedio o la desviación media como se le llama es la media de las desviaciones de todas las puntuaciones.

No se tienen en cuenta los signos y todas las desviaciones, ya sean + ve o - se consideraron positivas.

donde AD = desviación media

£ = Capital Sigma, Significa la suma total de

II = Modular en breve Mod, significa que no hay respeto al signo negativo.

x = desviación, (X — M)

Cálculo de la desviación media:

Hay dos situaciones para calcular la desviación media:

(a) Cuando los datos se desagrupan.

(b) Cuando los datos están agrupados.

Cálculo de AD a partir de datos desagrupados.

Ejemplo:

Encuentra AD de los siguientes 10 puntajes que se dan a continuación:

23, 34, 16, 27, 28, 39, 45, 26, 18, 27

Solución:

Paso 1:

Descubre la media de las puntuaciones con fórmula.

∑X / N

Paso 2:

Averigüe la desviación de todas las puntuaciones deduciendo la media de las puntuaciones.

Paso 3:

Averigüe la desviación absoluta como se muestra en la tabla 9.2 y luego ∑ | x |

Etapa 4:

Pon los valores en fórmula.

El AD = 7.58.

Cálculo de AD a partir de datos agrupados:

Ejemplo:

Averigua el AD de los siguientes datos:

Solución :

Paso 1:

Descubre la media de la distribución.

Media = 70.80

Paso 2:

Encuentra el punto medio para cada intervalo de clase. Como en la columna —3 de la tabla —9.3

Paso 3:

Averigüe la x deduciendo la media del punto medio (X). Como se muestra en la columna —5 de la tabla — 9.3.

Etapa 4:

Encuentra la desviación absoluta o | x |. Como columna —6 arriba.

Paso 5:

Averiguar | f x |. multiplicando f con | x. Como se muestra en la columna —7 y averigüe Σ | f x |.

Paso 6:

Ponga los valores anteriores en la fórmula.

La fórmula para AD a partir de datos agrupados.

Donde = AD = Desviación media

Σ = Suma total de

f = frecuencia

x = desviación, es decir (X — M)

N = Número total de casos, es decir, ∑ f .

Poniendo los valores en fórmula

Méritos de AD:

1. La desviación media está rígidamente definida y su valor es preciso y definido.

2. Es fácil de calcular.

3. Es fácil de entender. Porque es el promedio de las desviaciones de una medida de tendencia central.

4. Se basa en todas las observaciones.

5. Es menos afectado por el valor de puntajes extremos.

Deméritos de AD:

1. El inconveniente más serio con la desviación promedio es que ignora los signos algebraicos de las desviaciones que están en contra de las reglas fundamentales de las matemáticas.

2. El tratamiento algebraico adicional no es posible en el caso de AD.

3. Se usa muy raramente. Debido a la desviación estándar se utiliza generalmente como una medida de dispersión.

4. Cuando se calcula a partir del modo AD no proporciona una medida precisa de la dispersión.

Usos de la desviación media:

1. La desviación media se utiliza cuando se desea ponderar todas las desviaciones de la media según su tamaño.

2. Cuando las puntuaciones extremas influyen en la desviación estándar en ese momento, AD es la mejor medida de la dispersión.

3. AD se usa cuando queremos saber hasta qué punto las medidas se extienden a ambos lados de la media.

4. La desviación estándar (SD):

Hemos discutido tres medidas de variabilidad, a saber, rango, desviación del cuartil y desviación media. También encontramos que todos ellos sufren serios inconvenientes.

El rango que se acaba de tomar solo tiene en cuenta la puntuación más alta y la puntuación más baja. La desviación del cuartil tiene en cuenta solo el 50% de las puntuaciones medias y, en caso de desviación media, ignoramos los signos.

Por lo tanto, para superar todas estas dificultades, utilizamos otra medida de dispersión llamada Desviación Estándar. Se usa comúnmente en la investigación experimental, ya que es el índice de variabilidad más estable. Simbólicamente se escribe como σ (sigma en letras pequeñas griegas).

Definiciones:

Diccionario de estadísticas de Collin.

“La desviación estándar es una medida de propagación o dispersión. Es la desviación cuadrática media.

Diccionario de educación — CV bueno.

"Una medida de variabilidad ampliamente utilizada, que consiste en la raíz cuadrada de la media de las desviaciones al cuadrado de las puntuaciones de la media de la distribución".

La desviación estándar es la raíz cuadrada del valor promedio de las desviaciones al cuadrado de las puntuaciones de su media aritmética.

La SD se calcula sumando la desviación al cuadrado de cada medida de la media, dividida por el número de casos y extrayendo la raíz cuadrada. Para ser más claros, debemos tener en cuenta que al calcular el SD, cuadramos todas las desviaciones por separado, encontramos su suma, dividimos la suma por el número total de puntajes y luego encontramos la raíz cuadrada de la media de la desviación al cuadrado. Por lo que también se llama la "desviación cuadrática media".

El cuadrado de la desviación estándar se llama Varianza (σ 2 ). Se le conoce como la desviación cuadrática media. También se le llama como el segundo momento de dispersión.

Cálculo de SD a partir de datos desagrupados:

Ejemplo:

Descubre la SD de los siguientes datos:

6, 8, 10, 12, 5, 8, 9, 17, 20, 11.

Solución:

Paso 1:

Averigua la media de las puntuaciones.

Paso 2:

Descubre la desviación (x) de cada puntuación.

Cálculo de SD a partir de datos agrupados:

En datos agrupados, la SD se puede calcular de dos maneras:

1. Método directo o método largo

2. Método corto o método de media supuesta

1. Método directo o método largo:

Ejemplo:

Descubre la SD de la siguiente distribución:

Solución:

Paso 1:

Encuentra el punto medio de cada intervalo de clase. (Colum-3 Tabla 9.4)

Paso 2:

Descubre la media de la distribución:

Aquí M = ∑ f x / N = 3540/50

= 70.80

Paso 3:

Averigüe la desviación (x) deduciendo la media de los puntos.

Etapa 4:

Encuentra la f x multiplicando f (col-2) por x (col-5)

Paso 5:

Encuentra la f x multiplicando f x (col-2) con x (col-5)

Paso 6:

Calcule ∑ f x agregando los valores en col-7.

Paso 7:

Pon los valores en fórmula.

2. Método corto o método medio supuesto:

En resumen, el cálculo de la SD es fácil y requiere menos tiempo. Si los puntos medios de los intervalos de clase son números decimales, se vuelve más complicado calcular el SD en un método largo. Este método consiste esencialmente en "adivinar" o suponer una media y luego aplicar una corrección para obtener la media real. De modo que se le llama como método medio asumido.

Ejemplo:

Calcule el SD, de la siguiente distribución:

Solución:

Paso 1:

Suponga que el punto medio de cualquier intervalo de clase es 'Promedio Asumido'. Pero es mejor asumir el punto medio del intervalo de clase en el medio que tiene la frecuencia más alta como media asumida. Aquí vamos a suponer = 72 como media Supuesta.

Paso 2:

Averigüe x (desviación de las puntuaciones de la media supuesta) como se muestra en col-3.

x '= X - M / i

Paso 3:

Calcule f x ', multiplicando x' con f (col-4).

Etapa 4:

Calcula f x 2 multiplicando x '(col-3) por f x (col-5).

Paso 5:

Averigüe ∑ f x 'y ∑ f x ' 2 it 'agregando los valores en col-4 y col-5 respectivamente. '

Paso 6:

Ponga los valores en la fórmula:

Fórmula para SD en método corto es:

Donde i = Tamaño del intervalo de clase

∑ = Suma total de

f = frecuencia

x '= desviación de las puntuaciones de su media supuesta.

Ahora si vamos a sustituir ∑ f x '/ N en lugar de C.

La fórmula será la siguiente:

Ahora ponemos los valores en la fórmula que obtengamos.

1.Si se agrega un valor constante a cada puntaje o se resta de cada puntaje, el valor de SD permanece sin cambios:

Significa que la SD es independiente del cambio de origen (suma, resta). Por lo tanto, si se agrega o se resta un valor constante de cada variedad, la SD permanece igual.

Podemos examinar esto desde el siguiente ejemplo:

En la tabla anterior se dan puntuaciones de 5 alumnos. Veamos qué sucede con el SD de las puntuaciones si sumamos un número constante, digamos 5 y restamos 5 de cada puntuación.

2. Si un valor constante se multiplica o se divide en las puntuaciones originales, el valor de SD también se multiplica o se divide por el mismo número:

Significa que la SD es independiente del cambio de escala (multiplicación, división). Si multiplicamos los puntajes originales por un número constante, la SD también se multiplica por el mismo número.

Nuevamente, si dividimos cada puntaje por un número constante, la SD también se dividirá por el mismo número.

Podemos ilustrar esto con el siguiente ejemplo:

En la tabla anterior se dan puntuaciones de 5 alumnos. Veamos qué sucede con el SD de las 5 puntuaciones si lo multiplicamos con un número constante, digamos 2 y lo dividimos con el mismo número constante.

Por lo tanto, a partir de esto, encontramos que si las puntuaciones se multiplican con un número constante, σ también se multiplica con eso. Si las puntuaciones se dividen por un número constante, entonces σ también se divide por el mismo número.

Méritos de SD:

1. La desviación estándar está definida rígidamente y su valor es siempre definido.

2. Se basa en todas las observaciones de datos.

3. Es capaz de un tratamiento algebraico adicional y posee muchas propiedades matemáticas.

4. A diferencia de Q y AD, se ve menos afectado por las fluctuaciones de las puntuaciones.

5. A diferencia de AD, no ignora los signos negativos. Al cuadrar de desviaciones supera estas dificultades.

6. Es la medida confiable y más precisa de la variabilidad. Siempre va con la media, que es la medida más estable de la tendencia central.

7. SD da una medida que tiene un significado comparable de una prueba a otra. Sobre todo las unidades de curva normal se expresan en una unidad.

Deméritos de SD:

1. La SD es difícil de entender y no es fácil de calcular.

2. La SD da más peso a los puntajes extremos y la pérdida a aquellos que están más cerca de la media. Se debe a que los cuadrados de las desviaciones, que son grandes en tamaño, serían proporcionalmente mayores que los cuadrados de aquellas desviaciones que son comparativamente pequeñas.

Usos de SD:

1. SD se utiliza cuando nuestro empuje es medir la variabilidad que tiene la mayor estabilidad.

2. Cuando las desviaciones extremas pueden afectar la variabilidad en ese momento se usa la SD.

3. La SD se utiliza para calcular estadísticas adicionales como el coeficiente de correlación, las puntuaciones estándar, los errores estándar, el Análisis de la varianza, el Análisis de la covarianza, etc.

4. Cuando la interpretación de las puntuaciones se realiza en términos del NPC, se usa SD.

5. Cuando queremos determinar la confiabilidad y la validez de los resultados de las pruebas, se utiliza SD.

Desviación estándar combinada:

Durante el trabajo de investigación a veces extraemos más de una muestra de la población. Por lo tanto obtenemos diferentes SD para cada grupo o muestra. Pero a veces necesitamos interpretar estos resultados como un solo grupo. Por lo tanto, cuando se han combinado diferentes conjuntos de puntuaciones en un solo lote, es posible calcular la desviación estándar de la distribución total a partir de las desviaciones estándar de los subgrupos.

La fórmula para calcular la desviación estándar combinada o es la siguiente:

N 1, N 2, N n = Número de puntajes en el grupo 1, el grupo 2 y así sucesivamente hasta el noveno grupo.

d = (Mean-M comb ) 'd' se encuentra al deducir M comb de la media del grupo en cuestión.

Igualmente se encuentran d 1, d 2 ... d n .

σ = Desviación estándar del grupo en cuestión σ 1, σ 2, σ 3 significa σ del grupo 1, grupo-2, grupo-3, etc.

Ejemplo:

Solución:

Ahora pon los valores en fórmula.