Errores y sesgos que influyen en la evaluación del desempeño

Dado que el juicio humano está demasiado a menudo sujeto a la influencia de sesgos, prejuicios y otras influencias subjetivas y extrañas, el problema de obtener evaluaciones objetivas y precisas, incoloras por estas influencias, es tremendamente difícil. Guilford (1954) ha clasificado los diferentes tipos de errores constantes que pueden ocurrir en el proceso de calificación y sugiere ciertas precauciones que pueden tomarse. Los errores constantes son aquellos que resultan de un sesgo sistemático por parte del evaluador y generalmente son más fáciles de manejar que los errores de evaluador que son no sistemáticos o aleatorios.

1. Errores de indulgencia:

Cada evaluador tiende a llevar su propio conjunto de estándares o marcos de referencia integrados que utiliza para emitir juicios de evaluación de desempeño. Uno de los principales problemas es equiparar a los evaluadores diferentes para las diferencias en sus estándares para que puedan compararse sus calificaciones.

Algunos evaluadores pueden describirse mejor como generalmente "fáciles" o indulgentes, mientras que otros pueden ser clasificados como "duros" o severos en sus juicios o calificaciones. Cuando un evaluador es demasiado severo, se dice que está cometiendo un error de indulgencia negativa, mientras que los evaluadores fáciles cometen el error de indulgencia positiva. El siguiente diagrama ilustra las distribuciones de calificaciones que uno podría obtener de dos evaluadores diferentes: uno que es demasiado indulgente y el otro que es demasiado severo.

Hay varias formas en que los sistemas de clasificación pueden diseñarse para ayudar a evitar el error de indulgencia. El primer método es definir claramente las categorías o "puntos de anclaje" utilizados en la escala. Por ejemplo, si solicitáramos a los supervisores que clasificaran a sus subordinados en "competencia total", podríamos usar cualquiera de las dos escalas que se muestran a continuación.

La escala A no tiene puntos de anclaje o referencia que el evaluador pueda usar como guía; él debe establecer lo suyo. El riesgo es que diferentes calificadores definan los puntos de manera diferente. Con la Escala B, se ha definido un número de puntos para el evaluador, con la probabilidad de reducir el problema. Estos puntos de anclaje no resuelven completamente el problema de indulgencia, ya que el "bajo" de un evaluador podría ser el "promedio" de otro evaluador. Sin embargo, la escala verbal introduce la posibilidad de un marco de referencia común.

Un procedimiento de anclaje que es potencialmente más efectivo que el dado en la Escala B se conoce como el método "Hombre clave". Uno de los métodos más utilizados para combatir el error de clemencia es emplear la técnica de distribución forzada. Este es un procedimiento que requiere que el evaluador coloque una cierta proporción de sus respuestas en diferentes categorías. Dicha distribución se muestra en la Figura 7.1.

Exigir a todos los evaluadores que se adhieran a una distribución estándar en términos del número de personas que deben asignarse a cada categoría es un método eficaz para evitar errores de clemencia. Sin embargo, a menudo causa que los evaluadores se sientan un poco molestos por ser forzados a un patrón de respuesta tan estricto. También toma mucho más tiempo ya que se debe tener cuidado para tener el número correcto en cada categoría.

2. El efecto halo:

El error de halo es una tendencia a dejar que nuestra evaluación de un individuo sobre un rasgo influya en nuestra evaluación de esa persona sobre otros rasgos específicos. Por lo tanto, si consideramos que Worker X era un empleado de primera categoría en un aspecto, podríamos tender a calificarlo muy alto en todos los rasgos, a pesar de que puede ser bastante mediocre en algunos.

Este es un tipo de error muy común y también es muy difícil de corregir. Symonds (1925) ha sugerido que es más probable que ocurra con los siguientes rasgos:

1. Rasgos no fácilmente observados

2. Rasgos desconocidos

3. Rasgos no fácilmente definidos

4. Rasgos que implican reacciones interpersonales.

5. Rasgos de carácter

3. Errores de calificación lógica:

Este error es bastante similar al error de halo. En el error de halo, el evaluador, involuntariamente, deja que su juicio de ciertos rasgos se vea influenciado por su evaluación del individuo sobre otros rasgos. Un error lógico involucra a un evaluador que tiende a darle a una persona una puntuación alta en un rasgo específico simplemente porque siente que el individuo posee una gran cantidad de un segundo rasgo específico y siente que los dos rasgos están lógicamente relacionados. Cuando un evaluador tiende a sobreestimar la verdadera relación entre los rasgos, probablemente comete este error de calificación.

4. Contraste y errores de similitud:

El error de contraste es un tipo de sesgo bastante interesante. Se refiere a una tendencia general por parte de un evaluador a juzgar a otros en un marinero opuesto a la forma en que se percibe a sí mismo. Si se percibe a sí mismo como muy honesto, por ejemplo, su tendencia sería calificar a los demás ligeramente por debajo de lo normal en la dimensión de "honestidad".

Lo opuesto a un error de contraste, que podría llamarse error de similitud, es que el evaluador califique a otras personas de la misma manera que se percibe a sí mismo. Una ilustración de esto sería un evaluador, sintiéndose muy honesto, que también atribuye alta honestidad a todos los demás individuos. En otras palabras, los evaluadores deben estar capacitados para calificar a otros y no a ellos mismos.

5. Errores de tendencia central:

Algunos jueces o evaluadores suelen ser muy reacios a emitir juicios extremos sobre otras personas. Esta reticencia hace que tiendan a no usar los puntajes de escala extrema en el instrumento de calificación. Esto, a su vez, resulta en un cambio sustancial de forma en la distribución de puntajes para ese evaluador, como se puede ver en la Figura 7.2. Observe que la dispersión (variabilidad) de los juicios es mucho menor para el evaluador que comete un error de tendencia central. Por lo tanto, este tipo de error resulta en una restricción de rango de las puntuaciones de criterio, un artefacto que puede tener un efecto en los coeficientes de validez subsiguientes. Una de las mejores maneras de evitar este error es mediante el uso del sistema de distribución forzada descrito anteriormente.

6. Errores de proximidad:

El último error que consideraremos generalmente se debe a la forma en que se han colocado o pedido los distintos artículos en el formulario de calificación. A veces se lo denomina "efecto de orden", este error ilustra la influencia que tienen los elementos circundantes en la calificación que uno otorga a una persona en un artículo en particular.

Si el ítem anterior era un rasgo en el que el individuo recibió una calificación muy favorable, el evaluador puede tender a dejar que la respuesta favorable "set" se transfiera al siguiente ítem de la lista. El resultado será una calificación en el siguiente elemento ligeramente superior a la que podría darse de otra manera. Siempre existe la posibilidad de que ocurra la reacción inversa. Si los elementos anteriores han estado en rasgos en los que el trabajador fue generalmente calificado como alto, cuando el evaluador obtiene un rasgo en el que el trabajador realmente merece solo una clasificación "moderada", puede otorgar una calificación bastante desfavorable simplemente por el efecto de contraste de los elementos anteriores.

El procedimiento más común para minimizar el error de proximidad es tener varias formas diferentes de la escala de calificación, con los elementos en un orden diferente en cada formulario. Desafortunadamente, cuando el número de artículos aumenta, el control sistemático sobre el orden del artículo se vuelve extremadamente complejo y difícil en la mayoría de las situaciones prácticas. La práctica común para evitar este error generalmente se limita a construir solo dos formularios, con los elementos asignados a cada formulario utilizando una tabla de números aleatorios.