Construcción de una prueba estandarizada: 4 pasos

Este artículo arroja luz sobre los cuatro pasos principales involucrados en la construcción de una prueba estandarizada. Los pasos son: 1. Planificación 2. Preparación de la prueba 3. Prueba de la prueba 4. Evaluación de la prueba.

Paso # 1. Planificación:

“La planificación de pruebas abarca todas las operaciones variadas que intervienen en la producción de las pruebas. "No solo implica la operación de un esquema o tabla que especifique el contenido o las opciones a ser cubiertas por la prueba, sino que también debe incluir una cuidadosa atención a la dificultad del elemento, a los tipos de elementos, a la dirección al examinador, etc." (Lindquist )

Para la prueba estandarizada es necesaria una planificación sistemática y satisfactoria. En opinión de Ross, “las buenas pruebas no solo ocurren, ni son el resultado de unos pocos momentos de gran inspiración y exaltación”.

Es el constructor de pruebas quien es responsable por todos los medios de dar una forma adecuada a los elementos de su prueba y quien construye la prueba con todos los cuidados y sinceridad.

Incluye las siguientes actividades:

1. Fijación de los objetivos / propósitos.

2. Determinar la ponderación a diferentes objetivos instruccionales.

3. Determinación de la ponderación a diferentes áreas de contenido.

4. Determinación de los tipos de ítems a incluir.

5. Preparación de la tabla de especificación-Blue Print.

6. Tomar decisiones sobre sus aspectos mecánicos, como la duración, el tamaño de la prueba, las marcas totales, la impresión, el tamaño de las letras, etc.

7. Dar instrucciones para puntuar la prueba y su procedimiento de administración.

8. La ponderación de las diferentes categorías de nivel de dificultad de las preguntas debe fijarse.

(Las actividades especificadas en los puntos 1 a 5 necesitan una mayor aclaración)

1. Arreglando los Objetivos / Propósitos:

Antes de la construcción de la prueba es necesario que sus objetos estén formulados. Se debe prestar atención a la capacidad de las pruebas para medir de manera eficiente el alcance de los objetivos de la educación. Los objetivos de la educación pueden ser clasificados de muchas maneras. Pero cualquiera que sea la clasificación, el plan de estudios debe producir los cambios en el niño que se prevén a modo de objetivos.

La prueba debe estar enmarcada de tal manera que pueda indicar hasta qué punto los objetivos, para lograr cambios en el comportamiento del niño, se han logrado a través del currículo que se les ha enseñado.

La atención también debe dirigirse hacia el propósito que la prueba debe cumplir. Si la prueba se construye para clasificar a los estudiantes, en su construcción se debe prestar atención a su capacidad de clasificación. Pero si su propósito es de diagnóstico, entonces debería estar construido de modo que pueda diagnosticar las dificultades individuales de los estudiantes.

2. Determinación de la ponderación de los diferentes objetivos de instrucción:

El paso más importante en la planificación de una prueba es identificar los objetivos de instrucción. Cada materia tiene un conjunto diferente de objetivos de instrucción. En las asignaturas de Ciencias, Ciencias Sociales y Matemáticas, los principales objetivos se clasifican como conocimiento, comprensión, aplicación y destreza, mientras que en las lenguas los principales objetivos se clasifican como conocimiento, comprensión y expresión.

Se considera que el objetivo de conocimiento es el nivel más bajo de aprendizaje, mientras que la comprensión, la aplicación del conocimiento en ciencias o ciencias del comportamiento se consideran un nivel más alto de aprendizaje.

3. Determinación del peso en diferentes áreas de contenido:

La actividad más importante en la construcción de una prueba de rendimiento es especificar un esquema del área de contenido. Indica el área en la que se espera que los estudiantes muestren su desempeño. Ayuda a obtener una muestra representativa de toda el área de contenido.

También evita la repetición u omisión de cualquier unidad. Ahora surge la pregunta de cuánto peso debe asignarse a cada unidad. Algunos expertos dicen que el profesor interesado debe decidirlo teniendo en cuenta la importancia del capítulo.

Otros dicen que debe decidirse según el área cubierta por el tema en el libro de texto. En general, se decide sobre la base de las páginas del tema, el total de páginas del libro y la cantidad de elementos que se deben preparar.

4. Determinación de los tipos de elementos:

Los elementos utilizados en la construcción de prueba se pueden dividir en dos tipos: elementos de tipo objetivo y elementos de tipo ensayo. Para algunos propósitos de instrucción, los elementos de tipo objetivo son más eficientes, mientras que para otros las preguntas de ensayo resultan satisfactorias.

Los tipos de ítems apropiados deben seleccionarse de acuerdo con los resultados de aprendizaje a medir. Por ejemplo, cuando el resultado se escribe, los elementos de tipo de suministro son útiles.

Si el resultado es identificar una respuesta correcta, los tipos de selección o los elementos de tipo de reconocimiento son útiles. Por lo tanto, se debe decidir y planificar en esta etapa.

LA = Respuesta larga

SA = Respuesta corta

VSA = Respuesta muy corta

5. Preparación de "BLUEPRINT" o tabla tridimensional:

Preparar el plano o la tabla de especificación en el contenido del gráfico tridimensional, el objetivo y el tipo de elementos, indicando el número de elementos en cada celda o compartimento. Es solo un trabajo de marco que ofrece una imagen clara del diseño de la prueba y sirve como guía.

Las tres dimensiones del plan consisten en áreas de contenido en filas horizontales y objetivos y formas de preguntas en columnas verticales. Una vez que se haya preparado el plano, el colocador de papel puede escribir / seleccionar los elementos y preparar el documento de preguntas.

A continuación se muestra un formato de muestra de modelo:

Nota:

Por favor, ponga el número de pregunta entre corchetes y las marcas fuera de los corchetes.

E = pregunta de tipo de ensayo, SA = tipo de respuesta corta, VS A = respuesta muy corta.

Paso # 2. Preparando el examen:

El siguiente paso después de la finalización del plan es escribir las preguntas apropiadas de acuerdo con los parámetros generales establecidos en el plan. Uno debe tomar un bloque pequeño del plano a la vez y escribir las preguntas requeridas.

Por lo tanto, para cada bloque de planos que se rellena, las preguntas deben escribirse una por una. Una vez hecho esto, tenemos todas las preguntas que cumplen con los requisitos necesarios establecidos en el plan.

La prueba estandarizada de escritura requiere todo tipo de cuidados y consideraciones. Se debe dedicar tiempo suficiente para reflexionar sobre la ponderación de los contenidos y las áreas a cubrir.

En este paso, discutiremos las reglas específicas para construir diferentes tipos de elementos de prueba.

En esta etapa tenemos que preparar:

(i) Los elementos de prueba.

(ii) Las instrucciones para probar los artículos.

(iii) Las instrucciones para la administración.

(iv) Las instrucciones para anotar.

(v) Una tabla de análisis de preguntas.

(i) Preparación de artículos de prueba:

La preparación de los elementos de prueba es la tarea más importante en el paso de preparación. Por lo tanto, se debe tener cuidado al preparar un elemento de prueba. La construcción de artículos de prueba no es tan fácil. Es tarea de especialistas y expertos en pruebas. Un maestro experimentado que esté suficientemente capacitado en la construcción de exámenes puede preparar los elementos de examen apropiados.

Hay ciertas reglas y pautas para la construcción de artículos de prueba. Para esto, uno debe tener acceso a todas estas pautas y también un acceso a la taxonomía de los objetivos. En general, los elementos de prueba deben ser claros, completos y libres de ambigüedad.

El idioma de los elementos debe elegirse de modo que el contenido, y no la forma de los elementos, determine la respuesta. Los elementos que tienen significados ocultos, no deben ser incluidos. La declaración de los artículos no debe ser dada al azar de los libros. Todos los elementos de un tipo particular deben colocarse juntos.

El vocabulario utilizado en los ítems debe ser lo suficientemente simple para que todos lo entiendan. Debe evitarse una secuencia regular en el patrón de respuestas correctas. Puede haber más de un tipo de elementos de prueba en la prueba.

La prueba debe someterse a una revisión crítica a intervalos de tiempo. A menudo, será deseable que en la prueba se incluyan más elementos que el número que realmente se necesita. En el anteproyecto es mejor si se incluye el doble número de elementos necesarios.

En la construcción de los elementos de prueba, solo aquellos elementos no deben incluirse, lo que enfatiza la memoria o el reconocimiento. Los elementos deben elegirse de modo que los estudiantes aprendan el hábito de correlacionar sus conocimientos con su vida real.

Una vez que los elementos de la prueba se enmarcan, deben organizarse adecuadamente y ensamblarse en una prueba. Si se utilizan diferentes formas de elementos de prueba, deben agruparse preferiblemente en forma. Además, a los elementos fáciles se les debe dar un lugar al principio, los elementos de dificultad media en el medio y los elementos difíciles al final.

Los elementos de prueba se pueden organizar en orden de dificultad esperada. Por supuesto, hay varias formas de reunir las preguntas y podemos reunir las preguntas adecuadas a nuestro propósito y conveniencia de interpretación.

(ii) Preparación de la dirección a los artículos de prueba:

Este es el aspecto más descuidado de la construcción de prueba. En general, todo el mundo presta atención a la construcción de elementos de prueba. Así que los fabricantes de pruebas no adjuntan instrucciones con los elementos de prueba. Pero la validez y confiabilidad de los elementos de prueba en gran medida depende de las instrucciones para la prueba.

NE Gronlund ha sugerido que el fabricante de la prueba debe proporcionar una dirección clara sobre:

1. El propósito de la prueba.

2. El tiempo permitido para responder.

3. La base de la respuesta.

4. El procedimiento para registrar las respuestas.

5. Los métodos para tratar con adivinar.

A veces, las instrucciones para probar los ítems son tan ambiguas que el niño no puede seguirlos y, como tal, responde a los ítems de la manera que cree que encajan en ese instante o simplemente pasa el siguiente ítem sin contestar.

Debido a la falta de claridad en las instrucciones, el niño responderá de manera diferente en diferentes momentos, lo que disminuiría la confiabilidad de la prueba.

(iii) Preparación de instrucciones para la administración:

Se proporcionará una dirección clara y detallada sobre cómo se administrará la prueba. Las condiciones bajo las cuales se administrará la prueba, cuando se administrará la prueba (ya sea en medio de la sesión o al final de la sesión, etc.), dentro de qué límite de tiempo se administrará, etc. para ser declarado claramente.

Si la prueba tiene secciones separadas, se mencionarán los límites de tiempo para cubrir cada sección. Deben mencionarse los materiales requeridos (si los hay) para la prueba, tales como papeles de gráficos, tablas de logaritmos, etc.

Las instrucciones deben indicar claramente qué precauciones debe tomar el administrador en el momento de la administración. Por lo tanto, se debe preparar una dirección apropiada y clara para la administración de la prueba.

(iv) Preparación de la Dirección para la Puntuación:

Para facilitar la objetividad en la puntuación, se deben proporcionar "claves de puntuación". La clave de puntuación es una lista preparada de respuestas a un conjunto dado de preguntas de tipo objetivo. Se prepara una clave de puntuación enumerando en serie la clave (o la respuesta correcta) de cada pregunta en contra de cada elemento.

Para preguntas de tipo de respuesta corta y preguntas de tipo de ensayo, se deben preparar esquemas de calificación. Dichas claves de puntuación y esquemas de marcado deben prepararse cuidadosamente. Ayudan como guías a la hora de puntuar la prueba y aseguran objetividad en la puntuación.

(v) Preparación de una Tabla de Análisis Cuestionable:

Se puede preparar un cuadro de análisis de preguntas en el que se analicen todas las preguntas. Esta tabla muestra el área de contenido que cubre la pregunta, el objetivo (con especificación) que pretende medir, su tipo, las marcas que se le asignaron, el nivel de dificultad esperado y el tiempo necesario para responderla.

Esta tabla no solo analiza los elementos, sino que también nos brinda una imagen de la cobertura de contenidos, objetivos, tipo de pregunta y una cobertura de diferentes niveles de dificultad, etc. Además, esto nos da una idea del tiempo total que se debe tomar para tomar el prueba. Esta tabla nos ayuda a verificar si la prueba se ha preparado según el plan o no.

Paso # 3. Prueba de la prueba:

Dado que la prueba está siendo preparada por un grupo de personas y expertos, no puede estar completamente libre de errores. Por lo tanto, toda estandarización requiere la preparación de una forma de prueba de la prueba y su prueba sobre una población de muestra.

Los propósitos de la prueba son los siguientes:

1. Identificar los elementos defectuosos o ambiguos.

2. Descubrir la debilidad en el mecanismo de administración de pruebas.

3. Identificar los distractores que no funcionan o son inverosímiles en caso de pruebas de opción múltiple.

4. Proporcionar datos para determinar el nivel de dificultad de los elementos.

5. Proporcionar datos para determinar el valor discriminatorio de los artículos.

6. Para determinar el número de elementos que se incluirán en la forma final de la prueba.

7. Para determinar el límite de tiempo para la forma final.

El propósito principal de probar es seleccionar los artículos buenos y rechazar los artículos pobres.

La prueba se realiza en tres etapas:

1. Prueba preliminar.

2. Prueba adecuada.

3. Prueba final.

1. Prueba preliminar:

La prueba preliminar se realiza individualmente para mejorar y modificar las dificultades de lenguaje y la ambigüedad de los elementos. Esta prueba se realiza en 10 o 15 personas. Se observa la trabajabilidad de los artículos. Sobre la base de la observación y las reacciones de los individuos, los elementos pueden mejorarse y modificarse simultáneamente. Por lo tanto, el borrador inicial se prepara y se imprime o se cicla para la prueba adecuada o la prueba grupal.

2. La prueba adecuada:

La prueba adecuada se realiza en un grupo de al menos 40 estudiantes / individuos. El propósito es seleccionar buenos artículos para la prueba y rechazar artículos pobres.

Este paso incluye las siguientes actividades:

(A) Análisis de artículos.

(B) Preparación del borrador final de la prueba.

(A) Análisis del artículo:

Una prueba no debe ser ni demasiado fácil ni demasiado difícil; y cada elemento debe discriminar la validez entre los estudiantes de alto y bajo rendimiento. El procedimiento utilizado para juzgar la calidad de un artículo se denomina análisis de artículo.

El procedimiento de análisis de ítems sigue los siguientes pasos:

1. Los exámenes deben organizarse desde la puntuación más alta a la más baja.

2. Seleccione el 27% de los papeles de prueba del más alto y el 27% del extremo más bajo. Por ejemplo, si la prueba se administra a 120 estudiantes, seleccione 32 exámenes del final más alto y 32 exámenes del final más bajo.

3. Mantenga a un lado los otros documentos de prueba, ya que no son necesarios en el análisis del elemento.

4. Tabule el número de alumnos en el grupo superior e inferior que seleccionaron cada alternativa para cada elemento de prueba. Esto se puede hacer en la parte posterior del papel de prueba o se puede usar una tarjeta de elementos de prueba como se muestra en la Tabla (14.1).

Como sabemos, la calidad o el mérito de una prueba depende de los elementos individuales que la constituyen. Por lo tanto, solo aquellos artículos que se ajusten a nuestro propósito deben ser retenidos. El análisis de artículos es una parte integral de la confiabilidad y validez de una prueba.

El valor de un artículo se juzga desde tres ángulos principales, a saber:

(i) Índice de dificultad del ítem,

(ii) Poder discriminador del artículo,

(iii) Eficacia de los distractores.

Una ilustración hipotética:

Si se administra una prueba a 120 estudiantes, el 27% de los exámenes desde el extremo más alto es 32 y el 27% de los exámenes desde el extremo más bajo son 32.

(i) Índice de dificultad del elemento / dificultad del elemento:

El índice de dificultad del elemento es una parte importante de la construcción de la prueba. Si un artículo en particular es demasiado fácil, todos los estudiantes lo contestan. Si todos los alumnos obtienen puntajes iguales, el propósito mismo de la prueba es derrotado. Si un elemento no puede responder a un elemento, entonces el elemento es demasiado difícil o está mal construido. ¿Cuál es el uso de tener dichos elementos en una prueba? Así que es evidente que los artículos demasiado fáciles y demasiado difíciles deben ser descartados por completo.

Es deseable que los elementos de nivel de dificultad media se incluyan en una prueba. En el análisis realizado en la etapa de prueba, los evaluadores generalmente conservan elementos en el rango de 16% a 84% de nivel de dificultad.

La dificultad del ítem (ID) se calcula utilizando la fórmula.

ID = R / NX 100

donde R = No. de testados respondiendo correctamente.

N = Número total de alumnos que probaron el artículo.

En nuestro ejemplo, de los 64 estudiantes de los grupos superior e inferior, 40 estudiantes respondieron el elemento correctamente y 60 estudiantes lo probaron. Entonces la dificultad del ítem se calcula como

Dificultad del artículo = 40/60 x 100 = 66.67

Como es habitual seguir la regla del 16% al 84% para considerar la dificultad del elemento, nuestra ID calculada se encuentra dentro de ese rango. Por lo tanto, el elemento tiene un nivel de dificultad adecuado. Significa que si un artículo tiene una ID más del 84%, entonces es un artículo demasiado fácil, si es menos del 16%, entonces el artículo es un artículo demasiado difícil.

(ii) Poder discriminador del artículo:

El poder de discriminación (es decir, el índice de validez) de un elemento se refiere al grado en que un elemento determinado discrimina entre los estudiantes que difieren considerablemente en la función (es) medida por la prueba en su conjunto.

Se puede obtener una estimación del índice de discriminación de un artículo mediante la fórmula:

dónde

RU = No. de respuestas correctas del grupo superior.

RL = No. de respuestas correctas del grupo inferior.

N = Número total de alumnos que los probaron.

En nuestro ejemplo, 30 estudiantes del grupo superior respondieron correctamente el elemento y 10 del grupo inferior respondieron correctamente el elemento.

Así, R _U = 30, R _L = 10 y N = 60

Índice discriminatorio = (30 - 10) / (60/2) = 20 / 30.67

Un índice de discriminación generalmente se expresa como un decimal. Si tiene un valor positivo, el elemento tiene una discriminación positiva. Esto significa que una proporción mayor de los estudiantes con más conocimientos que los estudiantes pobres obtuvieron el elemento correcto. Si el valor es cero, el elemento tiene cero discriminación.

Esto puede ocurrir:

yo. Porque el artículo es demasiado fácil o demasiado duro; o

ii. Porque es ambiguo.

Si más estudiantes malos que buenos estudiantes obtengan el artículo correcto, uno obtendría una discriminación negativa. Con una pequeña cantidad de estudiantes, esto puede ser un resultado casual; pero puede indicar que el elemento es ambiguo o mal tecleado.

El ítem que tiene un índice de discriminación cero o negativo debe ser descartado o revisado. En general, cuanto más alto sea el índice de discriminación, mejor será el ítem.

(iii) Eficacia de los distractores:

Se considera que un distractor es un buen distractor cuando atrae a más alumnos del grupo inferior que del grupo superior.

Ejemplo:

Suponga un total de 40 libros de respuestas (tanto en el grupo superior como en el inferior, 20 en cada uno).

A continuación se presenta una ilustración hipotética, en la que un asterisco indica la respuesta correcta:

En la ilustración, las alternativas A y C son efectivas en el sentido de que atraen a más estudiantes del grupo inferior que del grupo superior. Pero la alternativa D es un distractor pobre porque no atrae a nadie y, por lo tanto, es inútil. El elemento solo tiene opciones, y las posibilidades de éxito por meras adivinanzas aumentan. La Alternativa E también es pobre porque atrae una mayor proporción de los buenos que de los malos estudiantes.

El artículo-escritor debe preguntarse:

“¿Por qué los estudiantes más brillantes se sintieron atraídos por E? ¿Fue por ambigüedad? ¿Se debió a que hubo dos respuestas igualmente correctas? ”En resumen, este elemento debe revisarse cambiando las alternativas D y E.

(B) Preparando el borrador final de la prueba:

Después del análisis de los ítems, solo se conservan los ítems buenos con el nivel de dificultad apropiado y con un poder de discriminación satisfactorio y estos ítems forman la prueba final. En consecuencia, los artículos buenos se seleccionan de la gran cantidad de artículos.

Algunos de ellos pueden modificarse y se selecciona el número deseado de elementos para el borrador final de acuerdo con el plano azul. Los artículos están ordenados por orden de dificultad en el borrador final. Se determina el tiempo requerido para la prueba. Ahora la prueba se administra a una gran muestra representativa y los documentos de prueba se califican.

3. Prueba final:

La prueba final se realiza en una gran muestra de aproximadamente 400 individuos para estimar la confiabilidad y la validez de la prueba. Su propósito es decidir la duración de la prueba también. El objetivo de esta prueba es identificar los defectos y deficiencias de los elementos de prueba. Durante el análisis del ítem, los ítems demasiado fáciles y demasiado difíciles se descartan. Solo se incluyen o retienen los elementos de nivel de dificultad promedio.

Casi todas las precauciones en la prueba para evitar que se tomen mientras se administra la prueba final. La hoja de respuestas completa debe puntuarse con la ayuda de la clave de puntuación y las puntuaciones se deben tabular para proporcionar un tratamiento estadístico.

Paso # 4. Evaluando la Prueba:

La estandarización y evaluación de la prueba se realiza de la siguiente manera:

1. Se imprime la forma final de la prueba. La hoja de respuestas también se imprime.

2. El tiempo requerido para la prueba se determina tomando el promedio de tiempo de tres alumnos al responder la prueba. Los alumnos seleccionados para este propósito representan tres grupos: brillante, promedio y por debajo del promedio.

3. Se prepara e imprime la instrucción a las personas que administrarán la prueba.

4. Las puntuaciones se tabulan y se encuentran varias medidas de las tendencias centrales media, mediana y modo y medidas de variabilidad (desviación estándar, desviación del cuartil, etc.).

Los puntajes se trazan en una hoja de gráfico para comparar la normalidad de la distribución y dibujar y dar para obtener varios puntajes percentiles. Se estiman las puntuaciones derivadas como la puntuación T y la puntuación Z, etc.

Las normas como las Normas de edad, las normas de clase, las normas de sexo, las normas rural-urbanas, etc., se calculan según el requisito.

5. La validez de los puntajes de las pruebas se calcula al correlacionar los puntajes de las pruebas con algún otro criterio. La validez de constructo se puede encontrar por análisis factorial. Diferentes métodos para determinar la validez han sido discutidos en una unidad separada.

6. Al evaluar la prueba de nueva construcción, también se estima la confiabilidad. En el caso de dos formas paralelas, podemos calcular la confiabilidad mediante la correlación de las puntuaciones en estas dos formas paralelas.

Si no se han preparado formas paralelas, la confiabilidad se puede determinar mediante el método de la mitad dividida o el método de equivalencia racional. La prueba se puede leer y ministrar y la confiabilidad se puede estimar mediante el método test-retest.

7. Finalmente, tendremos que evaluar hasta qué punto se puede utilizar una prueba desde el punto de vista de administración, puntaje, tiempo y economía. La prueba debe proporcionar normas de percentiles, normas de puntuación estándar, normas de edad y normas de grado que faciliten la interpretación de las puntuaciones.