Sistemas de elección forzada: utilizados para obtener evaluaciones del desempeño laboral

Uno de los métodos más populares para obtener evaluaciones de desempeño es a través de la técnica conocida como "elección forzada". Este método de calificación, que fue una consecuencia de los problemas habituales encontrados en el desarrollo de instrumentos de medición de personalidad, se adaptó rápidamente para su uso en desempeño evaluación.

Históricamente, el método parece haberse originado con Horst a principios de la década de 1940, y también fue utilizado por Wherry casi al mismo tiempo. El método se ha utilizado en una amplia variedad de situaciones y para una amplia variedad de propósitos. En una excelente crítica del método de elección forzada, Zavala (1965, p. 117) resume lo siguiente:

La técnica FC se ha utilizado para calificar al personal profesional, como los oficiales de la Fuerza Aérea y los militares (Gough, 1958; Wherry, 1959), patrulleros de carreteras y oficiales de policía (Peres, 1959; Stander, 1960), ingenieros (Lepkowski, 1963), maestros (Leftwich, 1962; Tolle y Murray, 1958), y médicos (Newman y Howell, 1961; Newman, Howell y Harris, 1957). El concepto FC también se ha utilizado para desarrollar pruebas para evaluar o medir intereses (Bendig, 1958; Peel, 1961), liderazgo y supervisión (Izard y Rosenberg, 1958; Wollack, 1959) y actitudes de los empleados (Miller y Gekoski, 1959) .

Gordon (1951), Denton (1954) y Hatch (1962) pusieron técnicas de FC para usar en la medición de la personalidad y para obtener medidas de empatía. El enfoque FC también se ha utilizado en problemas relacionados con la detección de la señal y los umbrales auditivos (Lukaszew-ski y Elliott, 1962; Swets, 1959). Blackwell (1952) utilizó el método FC para la medición psicofísica de las funciones sensoriales. Webster (1959) desarrolló una prueba de preferencia de figuras utilizando la técnica FC.

Construcción de la Escala de Calificación de Opción Forzada:

Guilford (1954, p. 275) ha delineado muy claramente los pasos apropiados a seguir para desarrollar un instrumento de elección forzada, tan claramente que vale la pena reiterarlos aquí.

Él sugiere los siguientes ocho pasos:

1. Se obtienen descripciones de personas que se consideran en los extremos más alto y más bajo del continuo de desempeño para el grupo en particular a calificar.

2. Las descripciones se analizan en cualidades de comportamiento simple, expresadas en oraciones o frases muy cortas o por nombres de rasgos, que pueden llamarse elementos que se usan para construir elementos.

3. Se determinan empíricamente dos valores para cada elemento: un valor de discriminación y un valor de preferencia. El valor de discriminación es un índice de validez, y el valor de preferencia es un índice del grado en que la calidad es valorada por personas como los evaluadores que usarán el instrumento.

4. Al formar un artículo, los elementos están emparejados. Dos declaraciones o términos con aproximadamente el mismo valor de alta preferencia están emparejados, uno de los cuales es válido y el otro no. Ambos deben tener una "validez nominal" para el evaluador, es decir, el evaluador debe pensar que ambos son favorables para un desempeño superior en el grupo calificado. Dos declaraciones o términos con un valor de preferencia igualmente bajo también están emparejados, uno es válido y el otro no.

5. Dos pares de declaraciones, un par con un valor de preferencia alto y otro con un valor de preferencia bajo, se combinan en una tétrada para formar un elemento. La razón de este tipo de combinación es que, aunque el evaluador promedio no se opondrá a elegir una de las dos descripciones favorables para una persona que conoce, a veces se resiste a elegir una de las dos descripciones desfavorables. A veces se agrega una quinta descripción neutral para formar una pentada, pero esto es menos común.

Un ejemplo de una tétrada sigue:

Descuidado

Serios de mente

Energético

Snob

Se habría encontrado que los rasgos "serios" y "enérgicos" tienen igual valor de preferencia porque se aplicaron con la misma frecuencia como rasgos favorables al describir el tipo de personal para el cual se desarrolló la escala. El rasgo "serio", sin embargo, se encontró que era válido, ya que se aplicó al grupo de alto criterio significativamente más a menudo que al grupo de bajo criterio. Los rasgos "descuidado" y "snob" se encontraron igualmente impopulares, pero "descuidado" discrimina el bajo del grupo de alto criterio.

6. Se prepara la instrucción al evaluador. El evaluador debe reaccionar ante cada tétrada como un elemento, diciendo cuál de los cuatro se ajusta mejor al evaluador y cuál de los cuatro es el menos apropiado.

7. Se prueba una forma experimental del instrumento en una muestra para la cual existe un criterio externo, con el propósito de validar las respuestas cuando las descripciones se configuraron en esta forma. Se determinan las respuestas discriminatorias y, si se desea, se asignan ponderaciones diferenciales.

8. Se diseña una clave de puntuación, basada en los resultados del Paso 7. Generalmente, un rasgo favorable válido marcado como el más descriptivo del evaluador recibe un peso positivo, también un rasgo válido y desfavorable, considerado como el menos descriptivo.

Razón fundamental:

Por supuesto, a partir de la descripción anterior, la lógica del nombre "forzado" es inmediatamente evidente, ya que el evaluador se ve obligado a seleccionar entre las alternativas igualmente favorables (o desfavorables). Supuestamente, esto evita que el evaluador verifique deliberadamente solo los rasgos más favorables al calificar a los trabajadores a los que le gustaría mostrar algún grado de favoritismo.

Si elige sus respuestas estrictamente sobre la base de lo favorables que parecen ser, entonces en teoría no tendrá ninguna razón para seleccionar un rasgo sobre el otro en cualquier par, ya que se han comparado de esta manera. Por lo tanto, su elección sería aleatoria y, por casualidad, terminará seleccionando el rasgo discriminante la mitad del tiempo.

Como cada tétrada tiene un par favorable (con un discriminador positivo en él) y un par desfavorable (con un discriminador negativo en él), una selección aleatoria en cada par significaría que el evaluador tendería a elegir un discriminador favorable aproximadamente la mitad del tiempo y un discriminador desfavorable alrededor de la mitad del tiempo.

Por lo tanto, un puntaje aleatorio o aleatorio sería cero (asumiendo que damos un +1 por cada discriminador positivo y un -1 por cada discriminador negativo marcado). En la medida en que el evaluador realmente intente dar una evaluación precisa del trabajador, tenderá a seleccionar rasgos que discriminen en el par positivo y no a seleccionar rasgos que discriminen en el par negativo (suponiendo que esté calificando a un buen trabajador) .

Si califica a un trabajador pobre, su patrón se revertiría en que tendería a seleccionar el rasgo discriminador más a menudo que el azar entre el par negativo y seleccionaría el rasgo no discriminatorio más a menudo que el azar en el par positivo. Los buenos trabajadores deben, por lo tanto, terminar con puntajes positivos altos y los trabajadores pobres con puntajes negativos altos.

Índices de elección forzada:

La clave para una escala de elección forzada exitosa radica en los diversos tipos de índices que se obtienen para cada rasgo antes de construir la versión final de la escala de calificación.

Los diferentes índices son los siguientes:

A. Índices discriminatorios.

B. igualar índices

1. Índice de preferencia

2. Índice de favorabilidad

3. Índice de importancia

4. Índice de deseabilidad

Índices discriminatorios:

El índice discriminativo es simplemente una medida del grado en que se encuentra un rasgo para diferenciar entre trabajadores buenos y pobres. Todos los índices que se emplean normalmente en el análisis de artículos son potencialmente apropiados para su uso como medidas de falta de criminalidad de rasgos, ya que uno se ocupa exclusivamente de cuán válido es cada rasgo para predecir qué tan bueno podría ser un empleado. Para una discusión de los métodos de análisis de ítems, consulte cualquier texto básico en pruebas psicológicas.

Índices de equiparación:

El razonamiento del sistema de elección forzada requiere que los rasgos estén emparejados de tal manera que sean igualmente "atractivos" para el evaluador. En otras palabras, un rasgo no debe poseer más de ninguna característica que pueda llevarlo a ser elegido sobre el otro rasgo por un evaluador que tenga un deseo de sesgar sus respuestas. La selección de rasgos en cualquier par debe basarse únicamente en su poder de discriminación en lugar de en términos de cualquier estereotipo de población sobre los rasgos en sí mismos.

Nos dirigimos inmediatamente al problema de intentar determinar qué tipo de características de los rasgos pueden influir en la respuesta de un evaluador que desea sesgar sus respuestas.

Cuatro de estas características podrían considerarse potencialmente importantes:

1. Preferencia por un rasgo:

Esto se puede definir mejor como la tendencia general de los evaluadores a usar el rasgo con todas las personas, sin importar si son trabajadores buenos o pobres. Sisson (1948) definió esta característica como "la medida en que las personas, en general, tienden a usarla para describir a otras personas". En cierto sentido, la preferencia de rasgos es una medida de lo común de un rasgo en el vocabulario descriptivo de los evaluadores. La combinación de pares de rasgos en términos de su preferencia general sin duda parecería un paso lógico si uno intentara eliminar características de elementos extraños que probablemente influyan en la elección de un evaluador.

2. Favorabilidad de un rasgo:

Los rasgos claramente difieren en términos de su aparente favorabilidad cuando se usan como descriptor de personas. Como se ha mencionado, el formato de elección forzada generalmente combina dos rasgos favorables con dos rasgos desfavorables. También es importante que los dos rasgos favorables parezcan igualmente favorables y los dos rasgos desfavorables igualmente desfavorables, o el evaluador puede verse tentado a seleccionar el más favorable en cada par en un intento de hacer que la tasa se vea lo mejor posible.

La favorabilidad de los rasgos es probablemente el índice más utilizado para igualar los pares de elección forzada. Es un índice que es relativamente fácil de obtener al tener un número de jueces que califican cada rasgo en términos de su favorecimiento para la persona a la que se va a usar para describir y usar el valor de la escala media como el índice de favorabilidad.

3. Índice de importancia:

Este índice ha sido mencionado por Zavala (1965) y es una medida de "la importancia de la declaración como una calificación para la posición en cuestión" (Zavala, 1965, p. 118). Este índice reconoce que una persona con una tendencia sesgada es más propensa a utilizar una situación específica como marco de referencia que una referencia más general. Es decir, un evaluador que desea hacer que una persona se vea bien puede ser más propenso a elegir ese rasgo específico que considera más importante para el trabajo en cuestión que a ese rasgo que es el descriptor general más favorable.

La elección del evaluador de qué rasgo es el mejor para usar es, por lo tanto, probable que sea específica para el trabajo. Para equiparar con éxito los rasgos en función de su importancia, es necesario que se obtengan valores de escala de importancia (generalmente de la misma manera general en que se obtienen valores de escala de valorabilidad) para cada situación de calificación diferente, una tarea que, en ocasiones, puede ser difícil realizar.

4. Índice de deseabilidad:

La noción de conveniencia social se discutió como una influencia en la determinación de las respuestas de los individuos a los inventarios de personalidad. El efecto de esta característica del rasgo es probablemente igualmente importante en situaciones de calificación. Diferenciar entre favorabilidad y deseabilidad social no siempre es algo fácil de hacer.

Ciertamente, los rasgos que se consideran favorables también pueden considerarse socialmente deseables. La distinción podría ilustrarse considerando la propiciación de un rasgo como la inteligencia que podría ser bastante alta, mientras que su conveniencia social podría ser algo menor debido a una reacción cultural general contra "cabezas de huevo", etc.

Marcos de referencia:

No solo hay una variedad de índices diferentes que pueden usarse para equiparar pares de rasgos en un formato de elección forzada, sino que también hay varios conjuntos instructivos o marcos de referencia que se pueden dar a los jueces al obtener valores de escala para propósitos de equiparación. . Como resultado, diferentes instrucciones tienden a ser bastante críticas.

Por ejemplo, si uno está interesado en obtener índices de importancia, podría dar a los jueces cualquiera de los siguientes conjuntos de instrucciones:

(I) Le otorga a cada rasgo un puntaje según la importancia que usted considere que es para el desempeño exitoso en el trabajo, o

(2) Asigne una puntuación a cada rasgo según la importancia que crea que el evaluador que finalmente usa la escala sentirá que el rasgo es para el desempeño exitoso en el trabajo.

En primera instancia, uno obtiene valores de escala basados ​​en el propio marco de referencia de los jueces. En la segunda instancia, se les pide a los jueces que se coloquen en los "zapatos" de la persona a la que finalmente se le pedirá que use el instrumento de evaluación de desempeño y que emita juicios como si fueran esa persona. Los valores de escala de importancia obtenidos en estos dos conjuntos de condiciones pueden resultar bastante diferentes.

La estrategia del "hombre ideal":

Un problema relacionado con el marco de referencia de la pregunta es la estrategia de evaluador conocida como la estrategia del "hombre ideal". Una forma muy típica de desviar las respuestas a una escala de calificación de elección forzada es que el evaluador seleccione a su mejor trabajador y sustituya mentalmente sus características por las del trabajador a quien realmente está calificando y a quien desea obtener una buena calificación.

Si no tiene un trabajador lo suficientemente bueno como para ser usado como guía en la calificación, el evaluador puede dibujar una imagen mental de un trabajador ideal y usar esto como su marco de referencia para hacer sus calificaciones. Este tipo de sesgo deliberado es extremadamente difícil de manejar ya que, en cierto sentido, el evaluador no presta atención a los tipos de características de los rasgos que la escala de elección forzada tiende a proteger.

Es decir, el evaluador tiende a hacer un trabajo de calificación "honesto", excepto que el "hombre" que califica cuando completa la escala es una persona muy diferente a la que se supone que califica. Cuando un evaluador es lo suficientemente inteligente como para adoptar esta estrategia de calificación como un método para elevar las calificaciones de desempeño de sus amigos, etc., es poco lo que se puede hacer para evitar el sesgo resultante, incluso con una elección forzada.

Investigación sobre el método de elección forzada:

El método de elección forzada ha sido objeto de una gran cantidad de investigaciones desde su introducción en la década de 1940. Al igual que con muchos métodos más nuevos, ha resultado ser un poco menos de curación de lo que muchos habían esperado, pero aún parece ser una de las formas más efectivas de reducir el sesgo de los evaluadores disponible para el psicólogo industrial. Una breve descripción de algunos de los hallazgos que tratan de varios aspectos del método de elección forzada dará una idea del estado general del método.

Formato de artículo de elección forzada:

En lo que se considera uno de los estudios clásicos sobre el método de elección forzada, Highland y Berkshire (1951) compararon seis tipos diferentes de formatos de elementos en términos de (1) su confiabilidad impar, incluso (2) su susceptibilidad a sesgo cuando los evaluadores fueron instruidos para asegurar un puntaje alto, (3) su validez frente a un criterio compuesto por los rangos de los instructores de los estudiantes, y (4) su popularidad general según lo determinado por los evaluadores.

Los seis tipos diferentes de formatos de elementos utilizados fueron:

1. Dos declaraciones por ítem, ambas favorables o desfavorables. Se pidió a Rater que seleccionara la más descriptiva del par de declaraciones.

2. Tres declaraciones por artículo, todas favorables o desfavorables. Se pidió a Rater que seleccionara la declaración más y la menos descriptiva.

3. Cuatro declaraciones por ítem, todas favorables. Se pidió a Rater que seleccionara las dos afirmaciones más descriptivas.

4. Cuatro declaraciones por ítem, todas favorables. Se pidió a Rater que seleccionara el más descriptivo y el menos descriptivo.

5. Cuatro declaraciones por ítem, dos favorables y dos desfavorables. Se pidió a Rater que seleccionara las declaraciones más descriptivas y las más descriptivas.

6. Cinco declaraciones por ítem, dos favorables, dos desfavorables y una neutral. Se pidió a Rater que seleccionara las declaraciones más descriptivas y las más descriptivas.

Los resultados del estudio llevaron a Highland y Berkshire a las siguientes conclusiones:

Confiabilidad:

Todos los formatos llevaron a coeficientes de alta confiabilidad, aunque se podría considerar que los formatos 5 y 6 dan el mejor resultado en este criterio.

Validez:

En general, se encontró que el formato 4 es el más válido, y el formato 3 se ejecuta en un segundo fuerte. Esto indica que el uso de solo alternativas favorables parece afectar la validez.

Preferencia del evaluador:

La preferencia de los evaluadores para los seis formatos como (de más a menos preferidos) 3, 1, 6, 5, 4 y 2.

Susceptibilidad al sesgo:

Las formas diferían considerablemente en cuanto al grado en que eran resistentes a los intentos deliberados de sesgo. El orden de resistencia al sesgo (de mayor a menor) fue 3, 2, 1, 4, 5 y 6.

Highland y Berkshire sugieren que el formato 3 es el mejor de los seis estudiados cuando se consideran los cuatro criterios enumerados anteriormente.

Validez comparativa de la elección forzada:

El estudio de Highland y Berkshire examinó diferentes formatos de elección forzada entre ellos. Una pregunta igualmente importante se refiere a la validez y confiabilidad del método cuando se compara con otros procedimientos de evaluación de desempeño.

Al revisar los estudios que pretendían examinar la ventaja de la elección forzada en términos de validez, Zavala (1965) hace los siguientes puntos:

1. Demasiados estudios sobre la validez de la elección forzada han tendido a utilizar otras formas de calificación como criterio. Esta es probablemente más una medida de confiabilidad que una medida de validez.

2. La mayoría de los estudios comparativos parecen mostrar una ligera superioridad para la elección forzada sobre los métodos de calificación convencionales.

3. Cuanto más largas sean las escalas de calificación, más adecuado será el método de elección forzada para ser superior.

4. La validez de una escala de elección forzada también puede ser una función del tipo de índice de igualación utilizado en la construcción de los elementos.

Susceptibilidad al sesgo:

Aunque la cuestión de la validez es probablemente la más importante que puede usarse para evaluar el método de elección forzada, la cuestión del grado en que el método está sujeto a sesgo o distorsión deliberada también es crítica. De hecho, el método fue diseñado específicamente para reducir el sesgo de respuesta, ya que el sesgo de respuesta tiende a reducir la validez.

La evidencia sobre la efectividad del procedimiento de elección forzada como reductor de sesgo es algo equívoca. Parece haber pocas dudas de que la falsificación sigue siendo posible en un formato de elección de fuerza, como lo indican Sisson (1948), Howe (1960), y Howe y Silverstein (1960).

Sin embargo, parece haber evidencia sustancial de que el grado de falsedad se reduce por los elementos de elección forzada. Karr (1959), Taylor y Wherry (1951), e Izard y Rosenberg (1958) ofrecen tres ejemplos de estudios de investigación que indican una resistencia a la falsificación por elección forzada que supera la de otros tipos de escalas.

Waters (1965) ha sugerido recientemente que una de las principales dificultades con la investigación sobre la falsedad de la elección forzosa ha sido que el "conjunto" para falsificar la prueba que se ha establecido generalmente difiere del "conjunto" bajo el cual se establecieron los índices de comparación. originalmente obtenido. Por lo tanto, los índices nunca son realmente completamente apropiados para la situación de evaluación real. Sugiere que hay tres conjuntos de respuestas diferentes bajo los cuales se pueden obtener índices de igualación (independientemente de qué índice se esté usando).

1. Evaluación honesta:

Respondiendo como el encuestado realmente cree que la declaración se aplica a la persona que está siendo evaluada

2. Aceptabilidad social:

Responder para parecer aceptable para uno mismo y para los demás en general.

3. Apariencia de éxito:

Responder para que la persona parezca poseer las cualidades necesarias o deseables en relación con un trabajo o actividad en particular.

Waters sugiere además que los estudios de fakabilidad pueden clasificarse en tres clases generales, dependiendo de cómo varíen el conjunto de respuestas y la composición del grupo.

Para citar de Waters (1965, p. 189), tenemos:

1. Estudios de fakabilidad:

Conjuntos y grupos al menos similares en las situaciones en las que se obtienen los índices de atractivo y se administra la escala.

2. Estudios de generalización:

Los conjuntos o grupos, pero no ambos, cambiaron de la situación en la que se obtienen los índices de atractivo a la situación en la que se administra la escala.

3. Estudios de extensión:

Ambos conjuntos y grupos cambiaron de la situación en la que se obtienen los índices de atractivo a la situación en la que se administra la escala.

Los estudios de falsedad no deben confundirse con los últimos tipos de estudios. Son el único tipo que proporciona directamente una prueba de cuán adecuados son los índices de equiparación para hacer su trabajo. Los dos últimos simplemente evalúan la generalidad del índice a otras situaciones. Desafortunadamente, según Waters, la mayoría de los estudios de fakability hasta la fecha han sido estudios de generalización o de extensión; hay una gran necesidad de algunas investigaciones que ataquen directamente la cuestión de la falsedad.

Estudio normando:

Uno de los estudios más interesantes sobre el problema de la falsificación y detección por elección forzada es el estudio de Norman (1963). Estaba preocupado por la dinámica de la popularidad de los ítems y los índices de discriminación de ítems en condiciones normales y en condiciones falsas. Además, estaba interesado en determinar hasta qué punto la falsificación, si ocurría, podía ser controlada y / o detectada.

Los principales hallazgos de la investigación en relación con el comportamiento de los índices de popularidad y discriminación se detallan a continuación:

1. Los índices de discriminación en condiciones normales y falsas se correlacionaron aproximadamente

2. Los índices de popularidad en condiciones normales y falsas se correlacionaron bajo (0, 24 y 0, 23).

3. La confiabilidad de los índices de discriminación bajo condiciones falsas fue cero.

4. La confiabilidad de los índices de discriminación en condiciones normales fue moderadamente alta.

5. La confiabilidad de los índices de popularidad fue casi perfecta tanto en condiciones normales como falsas (0, 97 y 0, 98).

El último de estos resultados (hallazgo número 5) implica que la diferencia de popularidad entre condiciones normales y falsas también debe ser muy confiable (el hallazgo número 2, que dice que hay diferencias sustanciales, puede modificarse para implicar que tales diferencias son confiables y consistente). Sin embargo, esto no fue evaluado directamente en el estudio.

Luego, Norman sugiere un procedimiento para desarrollar un instrumento de elección forzada que tendrá la misma media en condiciones falsas que en condiciones normales, tendrá una variación más pequeña en condiciones falsas y una escala de detección altamente sensible para identificar a los falsificadores.

Para lograr esto, él describe los siguientes pasos:

1. Seleccione artículos con índices de alta discriminación en condiciones normales (seleccione más de lo que eventualmente se requerirá).

2. Ordene los elementos seleccionados en función del tamaño de sus diferencias en popularidad en las condiciones normales y falsas (vea el número 2 en la lista anterior).

3. Seleccione elementos de ambos lados de cero (tantos como desee), asegurándose de que la suma algebraica de las diferencias de popularidad sea igual a cero cuando se complete.

El paso 3 asegurará (ya que sabemos que las diferencias de popularidad son confiables) que el puntaje promedio de la prueba de las personas en las condiciones normales será igual al de las condiciones falsas. Esto ocurre porque la media de la distribución de los resultados de las pruebas es igual a la suma de las popularidades del ítem. Por lo tanto, las puntuaciones medias en condiciones normales y falsas se equiparan. Las pruebas construidas con este procedimiento también tenderán a variaciones de sus distribuciones de puntaje de prueba cuando se toman bajo un conjunto para falsificar. Este es un resultado que tiende a reducir la posibilidad de que las personas que están dispuestas a falsificar obtengan puntuaciones suficientemente altas para ser aceptadas.

Para ilustrar, considere el diagrama que se muestra a continuación (Figura 7.4) en el que tenemos la distribución de los puntajes de las pruebas tomadas en condiciones normales. (7.4a), la distribución de los puntajes de las pruebas tomadas en un conjunto a falso (7.4b), y una distribución compuesta compuesta por fakers y no fakers (7.4c).

El examen de la figura 7.4c proporciona una indicación del efecto de control que este método ejerce sobre los farsantes deliberados. En la configuración de evaluación de desempeño habitual, estamos interesados ​​en recompensar a aquellas personas que obtienen puntajes altos en la forma de elección forzada. Dado que se reduce la varianza de la distribución falsa, se puede seleccionar a las personas con mejores calificaciones (las que se encuentran a la derecha de la línea de corte en 7.4c) sin el riesgo de que se incluyan demasiados farsantes entre el grupo seleccionado o recompensado.

La Figura 7.5 muestra cinco demostraciones empíricas diferentes de esta restricción en la varianza obtenida en el estudio de Norman.

Una característica final del método Norman es que es muy fácil construir una escala de "detección" para determinar quién está fingiendo y quién no.

Uno simplemente incluye en la escala una serie de elementos que cumplen los siguientes requisitos:

1. Deben tener validaciones cercanas a cero para las variables de criterio.

2. Deben haber mostrado un gran cambio en la popularidad de la condición normal a la falsa.

3. Su popularidad en condiciones normales debe ser muy alta o muy baja.

Luego, uno construye una clave que puntúa la respuesta infrecuente en la condición normal para cada elemento (es decir, la respuesta frecuente en la condición falsa), ya que una respuesta tiende a indicar falsificación y la otra respuesta indica una respuesta normal.

Otra forma de describir estos elementos de detección es que su popularidad se correlaciona con la tendencia a falsificar. La Figura 7.6 muestra las distribuciones de puntuaciones en la escala del detector obtenidas por Norman en condiciones normales y en condiciones falsas. Observe el gran cambio de puntajes cuando se les pidió a las personas que falsificaran Un punto de corte de alrededor de 20 tendería a identificar a la mayoría de los farsantes sin acusar falsamente a muchas de las normales.