8 tipos importantes de muestreo probabilístico

Este artículo arroja luz sobre los ocho tipos importantes de muestreo probabilístico utilizados para realizar investigaciones sociales. Los tipos son: 1. Muestreo aleatorio simple 2. Muestreo sistemático 3. Muestreo aleatorio estratificado 4. Muestreo estratificado proporcional 5. Muestreo estratificado desproporcionado 6. Muestra de asignación óptima 7. Muestreo por grupos 8. Muestreo multifase.

Tipo # 1. Muestreo aleatorio simple:

El muestreo aleatorio simple es, en cierto sentido, el tema básico de todo muestreo científico. Es el diseño primario de muestreo probabilístico. De hecho, todos los otros métodos de muestreo científico son variaciones del muestreo aleatorio simple. Una comprensión de cualquiera de la variedad refinada o compleja del procedimiento de muestreo presupone una comprensión de muestreo aleatorio simple.

Una muestra aleatoria simple se selecciona mediante un proceso que no solo brinda a cada elemento de la población la misma posibilidad de ser incluido en la muestra, sino que también hace que la selección de todas las combinaciones posibles de casos en el tamaño de muestra deseado sea igualmente probable. Supongamos, por ejemplo, que uno tiene una población de seis hijos, a saber, A, B, C, D, E y F.

Habrá las siguientes combinaciones posibles de casos, cada uno con dos elementos de esta población, a saber, AB, AC, AD, AE, AF, BC, BD, BE, BF, CD, CE, EF, DE, DF y EF, es decir, en las 15 combinaciones.

Si escribimos cada combinación en tarjetas del mismo tamaño, las colocamos en una canasta, las mezclamos bien y dejamos que una persona con los ojos vendados elija una, cada una de las tarjetas tendrá la misma posibilidad de ser seleccionada / incluida en la muestra.

Los dos casos (la pareja) escritos en la tarjeta recogida por la persona ciega doblada constituirán la muestra aleatoria simple deseada. Si se desea seleccionar muestras aleatorias simples de tres casos de la población anterior de seis casos, las posibles muestras, cada uno de los tres casos, serán ABC, ABD, ABE, ABF, ACD, ACE, ACF, ADE, ADF, BCD, BCE, BCF, BDE, BDF, BEF, CDE, CDF, CEF y DEF, es decir, 20 combinaciones en total.

Cada una de estas combinaciones tendrá la misma posibilidad de selección en la muestra. Usando el mismo método, se puede seleccionar una muestra aleatoria simple de cuatro casos de esta población.

En principio, se puede usar este método para seleccionar muestras aleatorias de cualquier tamaño de una población. Pero en la práctica, se convertiría en una tarea muy complicada y, en algunos casos, imposible de enumerar todas las combinaciones posibles del número deseado de casos. El mismo resultado se puede obtener seleccionando elementos individuales, uno por uno, usando el método anterior (lotería) o usando un libro de números aleatorios.

El libro de tablas que comprende la lista de números aleatorios lleva el nombre de Tippet, quien fue el primero en traducir el concepto de aleatoriedad en un libro de números aleatorios.

Este libro se prepara mediante un procedimiento muy complicado de tal manera que los números no muestran ninguna evidencia de orden sistemático, es decir, nadie puede estimar el número siguiente, sobre la base del número anterior y viceversa. Vamos a discutir los dos métodos de dibujo de una muestra aleatoria simple.

Método de lotería:

Este método implica los siguientes pasos:

(a) A cada miembro o elemento de la 'población' se le asigna un número único. Es decir, no hay dos miembros que tengan el mismo número,

(b) Cada número se anota en una tarjeta separada o en un chip. Cada ficha o tarjeta debe ser similar a todas las demás con respecto al peso, tamaño y forma, etc.

(c) Las tarjetas o fichas se colocan en un recipiente y se mezclan bien,

(d) Se le pide a una persona con los ojos vendados que recoja cualquier ficha o tarjeta del bol.

En estas circunstancias, se puede esperar que la probabilidad de robar una carta sea la misma que la probabilidad de robar cualquier otra carta. Dado que cada carta representa un miembro de la población, la probabilidad de seleccionar cada una sería exactamente la misma.

Si después de seleccionar una tarjeta (chip), se reemplazó en el tazón y el contenido se mezcló nuevamente, cada chip tendría la misma probabilidad de ser seleccionado en el segundo, cuarto o noveno dibujo. Tal procedimiento en última instancia produciría una muestra aleatoria simple.

Selección de muestra con la ayuda de números aleatorios :

Ya hemos dicho qué son los números aleatorios. Estos números ayudan a evitar cualquier sesgo (oportunidades desiguales) para los elementos que comprenden una población, de ser incluidos en la muestra al seleccionar la muestra.

Estos números aleatorios están tan preparados que cumplen el criterio matemático de aleatoriedad completa. Cualquier libro estándar sobre estadísticas contiene algunas páginas de números aleatorios. Estos números generalmente se enumeran en columnas en páginas consecutivas.

Lo siguiente es una porción de un conjunto de números aleatorios:

El uso de las tablas de números aleatorios implica los siguientes pasos:

(a) A cada miembro de la población se le asigna un número único. Por ejemplo, un miembro puede tener el número 77 y otro 83, etc.

(b) La tabla de números aleatorios se ingresa en algún punto aleatorio (con una marca ciega en cualquier página del libro de tablas) y los casos cuyos números surgen a medida que uno se mueve desde este punto hacia la columna se incluyen en la muestra hasta Se obtiene el número de casos deseado.

Supongamos que nuestra población consta de quinientos elementos y deseamos extraer cincuenta casos como muestra. Supongamos que usamos los últimos tres dígitos en cada número de cinco dígitos (ya que el tamaño del universo es 500, es decir, tres digitales).

Continuamos por la columna comenzando con 42827; pero como hemos decidido usar solo tres dígitos (digamos los últimos tres), comenzamos con 827 (ignorando los dos primeros dígitos). Ahora anotamos cada número menos de 501 (ya que la población es de 500).

La muestra se tomaría para consistir en los elementos de la población que llevan los números correspondientes a los elegidos. Nos detenemos después de haber seleccionado 50 elementos (el tamaño decidido por nosotros). Sobre la base de la sección anterior de la tabla, elegiremos 12 números correspondientes a los elegidos. Elegiremos 12 casos correspondientes a los números 237, 225, 280, 184, 203, 190, 213, 027, 336, 281, 288, 251.

Características de la muestra aleatoria simple:

Comenzaremos considerando una propiedad muy importante de las muestras aleatorias simples; siendo este, que cuanto mayor sea el tamaño de la muestra, más probable será que su media (valor promedio) esté cerca de la media de la "población", es decir, el valor verdadero. Ilustremos esta propiedad suponiendo una población de seis miembros (niños).

Sean las edades de estos niños respectivamente: A = 2 años, B = 3 años, C = 4 años, D = 6 años, E = 9 años y F = 12 años. Tomemos muestras aleatorias de uno, dos, tres, cuatro y cinco miembros de cada una de esta población y veamos cómo en cada caso, las medias muestrales (promedios) se comportan con referencia a la verdadera media de la "población" (es decir, 2 + 3 + 4 + 6 + 9 + 12 = 36/6 = 6). La siguiente tabla ilustra el comportamiento de las medias de muestra asociadas con el tamaño de la muestra.

Tabla que muestra las posibles muestras de uno, dos, tres, cuatro y cinco elementos (niños, de la población de seis niños de 2, 3, 4, 6, 9 y 12 años respectivamente):

En la tabla dada, se muestran todas las posibles muestras aleatorias de varios tamaños (es decir, 1, 2, 3, 4 y 5) y sus medios correspondientes. La media real (población) es de 6 años. Esta media puede, por supuesto, calcularse sumando los valores medios de las combinaciones totales de los elementos en la población para cualquier tamaño de muestra dado.

En la tabla vemos, por ejemplo, que para el tamaño de muestra de tres elementos hay 20 combinaciones posibles de elementos, cada combinación tiene la misma posibilidad de ser seleccionada como muestra de acuerdo con el principio de probabilidad.

Sumando los valores medios de estas combinaciones posibles que se muestran en la tabla, obtenemos una puntuación total de 120. La media será de 120 ÷ 20 = 6, que también es, por supuesto, la media de la población. Esto es válido para otras columnas también.

Ahora examinemos la mesa con cuidado. Encontraremos que para las muestras de un elemento cada una (columna A) solo hay un valor medio que no se desvía en más de 1 unidad de la media real de la población de 6 años. Es decir, todos los demás, a saber, 2, 3, 4, 9 y 12, se desvían en más de una unidad de la media poblacional, es decir, 6. A medida que aumentamos el tamaño de la muestra, por ejemplo, en la columna B, donde el tamaño de la muestra es 2, encontramos una mayor proporción de medias (promedios) que no se desvían de la media poblacional en más de 1 unidad.

La tabla anterior muestra que para la muestra de dos, hay 15 combinaciones posibles y, por lo tanto, 15 medios posibles. De estos 15 medios, hay 5 medios que no se desvían de la media de la población en más de 1 unidad.

Es decir, hay un 33% de las medias muestrales que están cerca de la media poblacional dentro de +1 y -1 unidades. En la columna C de la tabla, vemos que hay 20 combinaciones posibles de elementos para el tamaño de muestra de tres elementos, cada uno.

De las 20 posibles medias muestrales, encontramos que 10, es decir, el 50% no se desvía de la media poblacional en más de 1 unidad. Para el tamaño de muestra de cuatro elementos, hay un 67% de las medias que están dentro del rango de +1 y -1 unidad de la media real (población).

Por último, para el tamaño de muestra de cinco elementos, hay mucho más, es decir, el 83% de dichos medios o estimaciones. La lección que surge de nuestras observaciones es bastante clara, es decir, cuanto mayor sea la muestra, más probable es que su media esté cerca de la media de la población.

Esto es lo mismo que decir que la dispersión de estimaciones (medias) disminuye a medida que aumenta el tamaño de la muestra. Podemos ver claramente esto en la tabla de arriba. Para el tamaño de muestra de uno (columna A), el rango de medias es el más grande, es decir, entre 2 y 12 = 10. Para el tamaño de muestra de dos, el rango está entre 2.5 y 10.5 = 8.

Para el tamaño de la muestra de tres, cuatro y cinco, el rango de variabilidad de las medias es respectivamente de 3 a 9 = 6, de 3.8 a 7.8 = 4 y de 4.8 a 6.8 = 2. También se verá en la tabla que cuanto más muestra una muestra la media difiere de la media poblacional cuanto menos frecuente es la probabilidad de que ocurra.

Podemos representar claramente este fenómeno relacionado con el muestreo aleatorio simple con la ayuda de una serie de curvas que muestran la relación entre la variabilidad de las estimaciones y el tamaño de la muestra. Consideremos una gran población de residentes. Uno puede imaginar que sus edades oscilarán entre menos de 1 año (como mínimo) y más de 80 años (como máximo).

Lo normal y razonable es que haya menos casos a medida que uno se acerca a los extremos y que el número de casos aumenta progresivamente y simétricamente a medida que nos alejamos de estos extremos.

La edad media de la población es, digamos, 40 años. Dicha distribución de residentes se puede representar mediante una curva conocida como curva normal o en forma de campana (A en el diagrama siguiente). Supongamos ahora que tomamos de esta población varias muestras aleatorias de diferentes tamaños, por ejemplo, 10, 100 y 10, 000. Para cualquiera de las muestras de tamaño, obtendremos una gran cantidad de muestras de la población.

Cada una de estas muestras nos dará una estimación particular de la media poblacional. Algunos de estos medios serán sobreestimaciones y otras subestimaciones de la característica de la población (edad media o media). Algunos medios estarán muy cerca de él, bastante pocos bastante lejos.

Si trazamos dichos medios de muestra para un tamaño de muestra particular y unimos estos puntos, en cada caso, obtendremos una curva normal. Diferentes curvas normales representarán los valores de las medias de muestra para muestras de diferentes tamaños.

El diagrama anterior se aproxima a una imagen de cómo se comportarían las medias de la muestra en relación con el tamaño de la muestra. La curva A representa las ubicaciones de las edades de individuos individuales. Las medias estimadas de muestras de 10 individuos, cada una, de la curva B que muestra una dispersión bastante amplia de la población verdadera (media de 40 años).

Las medias de muestras de 100 individuos cada una, forman una curva normal C que muestra una desviación mucho menor de la media de la población. Finalmente, las medias de las muestras de 10, 000 de una curva que casi se aproxima a la línea vertical correspondiente a la media de la población. La desviación de los valores que representan la curva D de la media poblacional sería despreciable, como se puede ver en el diagrama.

También se puede distinguir muy fácilmente de la figura anterior que para muestras de cualquier tamaño dado, la media de muestra más probable es la media de la población. Los siguientes más probables son los valores medios cercanos a la media de la población.

Por lo tanto, podemos concluir que cuanto más se desvía una media de la muestra de la media de la población, menos probable es que ocurra. Y, por último, también vemos lo que ya hemos dicho sobre el comportamiento de las muestras, es decir, cuanto más grande es la muestra, más probable es que su media esté cerca de la media de la población.

Es este tipo de comportamiento por parte de las muestras aleatorias simples (probabilidad) con respecto a la media así como a las proporciones y otros tipos de estadísticas, lo que nos permite estimar no solo las características de la población (por ejemplo, la media) pero también la probabilidad de que la muestra difiera del valor real de la población en una cantidad determinada.

Una de las características típicas del muestreo aleatorio simple es que cuando la población es grande en comparación con el tamaño de la muestra (por ejemplo, más de, por ejemplo, diez veces más grande), las variabilidades de las distribuciones muestrales están más influenciadas por el número absoluto de casos en el muestra que por la proporción de la población que la muestra incluye.

En otras palabras, la magnitud de los errores que probablemente surjan como consecuencia del muestreo, depende más del tamaño absoluto de la muestra que de la proporción que tiene con la población, es decir, de cuán grande o cuán pequeña es la parte de la población. población.

Cuanto mayor sea el tamaño de la muestra aleatoria, mayor será la probabilidad de que proporcione una estimación razonablemente buena de la característica de la población, independientemente de su proporción en comparación con la población.

Por lo tanto, la estimación de un voto popular en una encuesta nacional, dentro de los límites de un margen de error tolerable, no requeriría una muestra sustancialmente mayor que la que se requeriría para una estimación del voto de la población en una provincia en particular donde el resultado de la encuesta está en duda.

Para elaborar el punto, una muestra de 500 (muestra del 100%) dará una precisión perfecta si una comunidad tuviera solo 500 residentes. Una muestra de 500 dará una precisión ligeramente mayor para un municipio de 1000 residentes que para una ciudad de 10, 000 residentes. Pero más allá del punto en el que la muestra es una gran parte del "universo", no hay una diferencia apreciable en la precisión con los aumentos en el tamaño del "universo".

Para cualquier nivel dado de precisión, tamaños de muestra idénticos darían el mismo nivel de precisión para comunidades de diferentes poblaciones, por ejemplo, que van desde 10, 000 hasta 10 millones. La relación entre el tamaño de la muestra y las poblaciones de estas comunidades no significa nada, aunque esto parece ser importante si procedemos por intuición.

Tipo # 2. Muestreo sistemático:

Este tipo de muestreo es para todos los propósitos prácticos, una aproximación del muestreo aleatorio simple. Requiere que la población pueda ser identificada únicamente por su orden. Por ejemplo, los residentes de una comunidad pueden aparecer en la lista y sus nombres se pueden reorganizar alfabéticamente. Cada uno de estos nombres puede recibir un número único. Este índice se conoce como el "marco" de la población en cuestión.

Supongamos que este marco consta de 1, 000 miembros cada uno con un número único, es decir, de 1 a 1, 000. Digamos que queremos seleccionar una muestra de 100. Podemos comenzar seleccionando cualquier número entre 1 y 10 (ambos incluidos). Supongamos que hacemos una selección al azar ingresando a la lista y obtenemos 7.

Luego procedemos a seleccionar los miembros; comenzando desde 7, con un intervalo regular de 10. El seleccionado para seleccionar miembros: comenzando desde con un intervalo regular de 10. La muestra seleccionada consistiría así en elementos que llevan los números 7, 17, 27, 37, 47, … 977, 987, 997. Estos elementos juntos constituirían una muestra sistemática.

Debe recordarse que una muestra sistemática puede considerarse una muestra probabilística solo si el primer caso (p. Ej., 7) se seleccionó al azar y luego se seleccionó el décimo caso de la trama.

Si el primer caso no se selecciona al azar, la muestra resultante no será una muestra probabilística ya que, en la naturaleza del caso, la mayoría de los casos que no están a una distancia de diez del número elegido inicialmente tendrán un cero (0 ) Probabilidad de ser incluido en la muestra.

Cabe señalar que en el muestreo sistemático, cuando el primer caso se extrae al azar, no hay, de antemano, limitación en las posibilidades de que se incluya en la muestra algún caso determinado. Pero una vez que se selecciona el primer caso, las posibilidades de casos posteriores se ven afectadas o alteradas de manera decisiva. En el ejemplo anterior, los casos distintos de 17, 27, 37, 47 ... etc., no tienen posibilidad de ser incluidos en la muestra.

Esto significa que el plan de muestreo sistemático no ofrece todas las combinaciones posibles de casos, la misma posibilidad de ser incluido en la muestra.

Por lo tanto, los resultados pueden ser bastante engañosos si los casos en la lista están ordenados en algún orden cíclico o si la población no está completamente mezclada con respecto a las características en estudio (por ejemplo, ingresos u horas de estudio), es decir, de una manera que cada uno de los diez miembros tuviera las mismas posibilidades de ser elegido.

Tipo # 3. Muestreo aleatorio estratificado:

En el muestreo aleatorio estratificado, la población se divide primero en varios estratos. Dichos estratos pueden basarse en un solo criterio, por ejemplo, nivel educativo, produciendo una serie de estratos correspondientes a los diferentes niveles de logro educativo) o en la combinación de dos o más criterios (por ejemplo, edad y sexo), produciendo estratos tales como varones bajo 30 años y hombres mayores de 30 años, mujeres menores de 30 años y mujeres mayores de 30 años.

En el muestreo aleatorio estratificado, se toma una muestra aleatoria simple de cada uno de los estratos y dichas submuestras se reúnen para formar la muestra total.

En general, la estratificación del universo con el propósito de muestrear contribuye a la eficiencia del muestreo si establece clases, es decir, si puede dividir a la población en clases de miembros o elementos que son comparativamente homogéneos internamente y relativos entre sí, heterogéneos, con respecto a las características estudiadas. Supongamos que la edad y el sexo son dos posibles bases de la estratificación.

Ahora, si encontramos que la estratificación basada en el sexo (masculino / femenino) produce dos estratos que difieren notablemente entre sí respecto de las puntuaciones en otras características pertinentes en estudio, mientras que, por otro lado, la edad como base de la estratificación no los estratos de rendimiento que son sustancialmente diferentes entre sí en términos de las puntuaciones en las otras características significativas, entonces será aconsejable estratificar a la población en función del sexo en lugar de la edad.

En otras palabras, el criterio de sexo será la base más efectiva de la estratificación en este caso. Es bastante posible que el proceso de dividir la población en estratos que son internamente homogéneos y relativamente heterogéneos con respecto a ciertas características relevantes sea prohibitivamente costoso.

En tal situación, el investigador puede elegir seleccionar una muestra aleatoria simple grande y compensar el alto costo al aumentar (a través de una muestra aleatoria simple de gran tamaño) el tamaño total de la muestra y evitar los peligros asociados con la estratificación.

Debe entenderse claramente que la estratificación no tiene nada que ver con hacer de la muestra una réplica de la población.

De hecho, las cuestiones relacionadas con la decisión de si se va a efectuar la estratificación se relacionan principalmente con la homogeneidad anticipada de los estratos definidos con respecto a las características en estudio y los costos comparativos de los diferentes métodos para lograr la precisión. El muestreo aleatorio estratificado, como el muestreo aleatorio simple, implica planes de muestreo representativos.

Ahora vamos a discutir las formas principales o el muestreo estratificado. El número de casos seleccionados dentro de cada estrato puede ser proporcional a la intensidad del estrato o desproporcionado al mismo.

El número de casos puede ser el mismo de estrato a estrato o variar de un estrato a otro dependiendo del plan de muestreo. Ahora consideraremos brevemente estas dos formas, es decir, muestras estratificadas proporcionadas y desproporcionadas.

Tipo # 4. Muestreo estratificado proporcional :

En el muestreo proporcional, los casos se extraen de cada estrato en la misma proporción en que ocurren en el universo. Supongamos que sabemos que el 60% de la 'población' es masculina y el 40% femenina. El muestreo estratificado proporcional con referencia a esta "población" implicaría extraer una muestra de manera que se refleje esta misma división entre sexos, es decir, 60:40, en la muestra.

Si el procedimiento de muestreo sistemático se emplea en un estudio, la base sobre la cual se realiza la lista determina si la muestra resultante es una muestra estratificada proporcional o no. Por ejemplo, si cada séptimo nombre se selecciona en una secuencia regular de una lista de nombres ordenados alfabéticamente, la muestra resultante debe contener aproximadamente 1/7 de los nombres que comienzan con cada letra del alfabeto.

La muestra resultante en este caso sería una muestra alfabética estratificada proporcional. Por supuesto, si la disposición alfabética no tiene relación alguna y es irrelevante para el problema que se estudia, la muestra podría considerarse una muestra aleatoria con ciertas limitaciones típicas de las muestras sistemáticas mencionadas anteriormente.

Se pueden aducir varias razones para muestrear los diversos estratos en proporciones desiguales o diferentes. A veces, es necesario aumentar la proporción muestreada de estratos que tienen un número pequeño de casos para tener una garantía de que estos estratos se muestren en absoluto.

Por ejemplo, si uno estuviera planeando un estudio de las ventas minoristas de ropa en una determinada ciudad en un momento dado, una muestra aleatoria simple de tiendas minoristas de ropa podría no proporcionarnos una estimación precisa del volumen total de ventas, ya que una pequeña Número de establecimientos con una proporción muy grande del total de ventas, puede suceder que se excluyan de la muestra.

En este caso, sería prudente estratificar la población de tiendas de telas en términos de unas pocas tiendas de telas que tienen un gran volumen de ventas y constituirán el estrato más alto. El investigador haría bien en incluirlos a todos en su muestra.

Es decir, a veces puede hacer un buen trabajo para obtener una muestra del 100% de este estrato y un porcentaje de casos mucho menor de los otros estratos que representan un gran número de tiendas (con un volumen de ventas bajo o moderado). Un muestreo tan desproporcionado por sí solo probablemente proporcionará estimaciones confiables con respecto a la población.

Otra razón para tomar una mayor proporción de casos de un estrato en lugar de otros es que el investigador puede querer subdividir los casos dentro de cada estrato para un análisis más detallado.

Los subestratos así derivados pueden no contener todos el número suficiente de casos para muestrear y en la misma proporción que los otros subestratos, por lo tanto, no proporcionarían suficientes casos para servir como una base adecuada para un análisis adicional. Siendo este el caso, uno puede tener que muestrear una mayor proporción de casos del subestrato.

En términos generales, se puede decir que se puede obtener la mayor precisión y representación si las muestras de los diferentes estratos reflejan adecuadamente sus variabilidades relativas con respecto a las características en estudio en lugar de presentar sus tamaños relativos en la "población".

Es aconsejable realizar una muestra más extensa en los estratos donde el investigador tiene una razón para creer que la variabilidad sobre una característica dada, por ejemplo, las actitudes o la participación, sería mayor.

Por lo tanto, en un estudio realizado para predecir el resultado de las elecciones nacionales que emplean el método de muestreo estratificado, con los estados como base de la estratificación, se debe tomar una muestra más pesada de las áreas o regiones donde el resultado está muy nublado y en gran duda. .

Tipo # 5. Muestreo estratificado desproporcionado :

Ya hemos sugerido las características del muestreo desproporcionado y también algunas de las principales ventajas de este procedimiento de muestreo. Está claro que una muestra estratificada en la que el número de elementos extraídos de varios estratos es independiente de los tamaños de estos estratos puede denominarse muestra estratificada desproporcionada.

Este mismo efecto puede lograrse alternativamente extrayendo de cada estrato un número igual de casos, independientemente de cuán fuerte o débil se represente el estrato en la población.

Como corolario de la forma en que se selecciona, una ventaja del muestreo estratificado desproporcionado se relaciona con el hecho de que todos los estratos son igualmente confiables desde el punto de vista del tamaño de la muestra. Una ventaja aún más importante es la economía.

Este tipo de muestra es económico porque los investigadores se ahorran los problemas de obtener un volumen innecesariamente grande de información de los grupos más prevalentes en la población.

Sin embargo, una muestra de este tipo también puede traicionar las desventajas combinadas de un número desigual de casos, es decir, la pequeñez y la no representatividad. Además, una muestra desproporcionada requiere un profundo conocimiento de las características pertinentes de los distintos estratos.

Tipo # 6. Muestra de asignación óptima :

En este procedimiento de muestreo, el tamaño de la muestra extraída de cada estrato es proporcional tanto al tamaño como a la dispersión de los valores dentro de cualquier estrato dado. Un uso preciso de este procedimiento de muestreo implica el uso de ciertos conceptos estadísticos que aún no se han introducido de manera adecuada o convincente.

Ahora sabemos algo sobre el muestreo aleatorio estratificado y sus diferentes manifestaciones. Veamos ahora cómo deben planificarse las variables o criterios para la estratificación.

Las siguientes consideraciones idealmente entran en la selección de controles para la estratificación:

(a) La información relacionada con la institución de los estratos debe ser actualizada, precisa, completa, aplicable a la población y disponible para el investigador.

Muchas características de la población no pueden utilizarse como controles, ya que no se dispone de estadísticas satisfactorias sobre ellos. En una sociedad altamente dinámica caracterizada por grandes trastornos en la población, el investigador que emplea la estrategia de estratificación generalmente corre el riesgo de equivocarse en sus estimaciones sobre el tamaño de los estratos que efectúa en su muestra.

(b) El investigador debe tener razones para creer que los factores o criterios utilizados para la estratificación son significativos a la luz del problema en estudio.

(c) A menos que el estrato en consideración sea lo suficientemente grande y, por lo tanto, el muestreador y los trabajadores de campo no tengan grandes dificultades para ubicar a los candidatos, no se debe utilizar.

(d) Al seleccionar los casos para la estratificación, el investigador debe tratar de elegir aquellos que son homogéneos con respecto a las características que son significativas para el problema en estudio. Como se dijo anteriormente, la estratificación es efectiva en la medida en que los elementos dentro del estrato son similares entre sí y al mismo tiempo son diferentes en relación con los elementos en otros estratos.

Consideremos ahora los méritos y limitaciones del muestreo aleatorio estratificado de una manera general:

(1) Al emplear el procedimiento de muestreo aleatorio estratificado, el investigador puede estar seguro de que no se excluirán grupos o categorías esenciales de la muestra. De este modo se garantiza una mayor representatividad de la muestra y, por lo tanto, se evitan los percances ocasionales que ocurren en el muestreo aleatorio simple.

(2) En el caso de poblaciones más homogéneas, se puede lograr una mayor precisión con menos casos.

(3) En comparación con las aleatorias simples, las muestras estratificadas están más concentradas geográficamente, lo que reduce los costos en términos de tiempo, dinero y energía al entrevistar a los encuestados.

(4) Las muestras que elija el entrevistador pueden ser más representativas si su cuota se asigna mediante el procedimiento impersonal de estratificación que si se utiliza su propio criterio (como en el muestreo por cuotas).

La principal limitación del muestreo aleatorio estratificado es que para asegurar los beneficios máximos de la misma en el curso de un estudio, el investigador necesita saber mucho sobre el problema de la investigación y su relación con otros factores. Tal conocimiento no siempre está disponible y muy a menudo la espera es larga.

Debe recordarse que desde el punto de vista de la teoría del muestreo probabilístico, es esencialmente irrelevante si la estratificación se introduce durante el procedimiento de muestreo o durante el análisis de los datos, excepto en la medida en que la primera permite controlar el tamaño de la información. Muestra obtenida de cada estrato y por lo tanto para aumentar la eficiencia del diseño de muestreo.

En otras palabras, el procedimiento de dibujar una muestra aleatoria simple y luego dividirla en estratos es equivalente en efecto a dibujar una muestra aleatoria estratificada utilizando como marco de muestreo dentro de cada estrato, la población de ese estrato que se incluye en el simple dado. muestra aleatoria.

Tipo # 7. Muestreo en grupo :

Por lo general, el muestreo aleatorio simple y el muestreo aleatorio estratificado conllevan enormes gastos cuando se trata de poblaciones grandes y dispersas espacial o geográficamente.

En los tipos de muestreo anteriores, los elementos elegidos en la muestra pueden estar tan dispersos que entrevistarlos puede conllevar grandes gastos, una mayor proporción de tiempo no productivo (gastado durante el viaje), una mayor probabilidad de falta de uniformidad entre los entrevistadores. cuestionamientos, grabaciones y, por último, un gasto elevado en la supervisión del personal de campo.

También hay otros factores prácticos de ese muestreo. Por ejemplo, puede considerarse menos objetable y, por lo tanto, permisible administrar un cuestionario a tres o cuatro departamentos de una fábrica u oficina en lugar de administrarlo en una muestra extraída de todos los departamentos de forma aleatoria simple o estratificada, ya que este último procedimiento Puede ser mucho más disruptivo de las rutinas de fábrica.

Es por algunas de estas razones que los estudios de encuestas a gran escala rara vez utilizan muestras aleatorias simples o estratificadas; En su lugar, hacen uso del método de muestreo por conglomerados.

En el muestreo de conglomerados, la muestra toma muestras de la población, ciertos grupos grandes, es decir, "conglomerados". Estos conglomerados pueden ser barrios de la ciudad, hogares o varias unidades geográficas o sociales. El muestreo de grupos de la población se realiza mediante métodos de muestreo aleatorios simples o estratificados. De estos grupos seleccionados, los elementos constituyentes se muestrean recurriendo a procedimientos que garantizan la aleatoriedad.

Supongamos, por ejemplo, que un investigador desea realizar un estudio de muestra sobre los problemas de los estudiantes universitarios de las universidades en Maharashtra.

Puede proceder de la siguiente manera:

(a) Primero, prepara una lista de todas las universidades del estado y selecciona una muestra de las universidades de forma 'aleatoria'.

(b) Para cada una de las universidades del estado incluidas en la muestra, él hace una lista de colegios bajo su jurisdicción y toma una muestra de colegios de manera "aleatoria".

(c) Para cada una de las universidades que se incluyen en la muestra, hace una lista de todos los estudiantes de pregrado inscritos en ella. De entre estos estudiantes, selecciona una muestra del tamaño deseado de forma aleatoria (simple o estratificada).

De esta manera, el investigador obtiene una probabilidad o una muestra aleatoria de elementos, más o menos concentrados, geográficamente. De esta manera, es capaz de evitar grandes gastos en los que se habría incurrido si hubiera recurrido al muestreo aleatorio simple o estratificado, y sin embargo, no necesita sacrificar los principios y beneficios del muestreo probabilístico.

De manera característica, este procedimiento de muestreo se mueve a través de una serie de etapas. Por lo tanto, es, en cierto sentido, un muestreo de "múltiples etapas" y algunas veces conocido por este nombre. Este procedimiento de muestreo se mueve progresivamente de las unidades de muestreo más inclusivas a las unidades de muestreo menos inclusivas que el investigador finalmente llega a aquellos elementos de la población que constituyen su muestra deseada.

Cabe señalar que con el muestreo por conglomerados, ya no es cierto que cada combinación del número deseado de elementos en la población tiene la misma probabilidad de ser seleccionada como muestra de la población. Por lo tanto, el tipo de efectos que observamos en nuestro análisis de muestras aleatorias simples, es decir, el valor de la población es el valor de muestra más probable, no se puede ver aquí.

Pero tales efectos se materializan de una manera más complicada, aunque, por supuesto, la eficiencia del muestreo se ve obstaculizada en cierta medida. Se ha encontrado que, según el caso, el muestreo por conglomerados es mucho menos eficiente para obtener información que el muestreo aleatorio estratificado de eficacia comparable.

En términos relativos, en el muestreo por conglomerados, el margen de error es mucho mayor. Sin embargo, esta desventaja está más que equilibrada por las economías asociadas, que permiten el muestreo de un número suficientemente grande de casos a un costo total menor.

Dependiendo de las características específicas del plan de muestreo relacionado con los objetos de la encuesta, el muestreo por conglomerados puede ser más o menos eficiente que el simple muestreo aleatorio. Las economías asociadas con el muestreo de conglomerados generalmente inclinan el equilibrio a favor de emplear el muestreo por conglomerados en las encuestas a gran escala, aunque en comparación con el muestreo aleatorio simple, se necesitan más casos para el mismo nivel de precisión.

Tipo # 8. Muestreo de múltiples fases:

A veces es conveniente limitar ciertas preguntas sobre aspectos específicos del estudio a una fracción de la muestra, mientras que otra información se recopila de toda la muestra. Este procedimiento se conoce como 'muestreo multifase'.

La información básica registrada de toda la muestra permite comparar ciertas características de la submuestra con la de toda la muestra.

Un punto adicional que vale la pena mencionar es que el muestreo de varias fases facilita la estratificación de la submuestra, ya que la información recopilada de la muestra de la primera fase a veces se puede recopilar antes de que tenga lugar el proceso de submuestreo. Se recordará que los estudios de panel involucran muestreo multifase.