Determinación de la utilidad de un instrumento de selección en industrias

La utilidad de un dispositivo de predicción es el grado en que su uso mejora la calidad de las personas seleccionadas más allá de lo que habría ocurrido si ese dispositivo no hubiera sido utilizado. Validez y confiabilidad, las cuales desempeñan un papel importante en la determinación de la utilidad de cualquier instrumento de selección. Además, hay, sin embargo, varios otros factores que son igualmente críticos para determinar la utilidad en cualquier situación que involucre la selección de grupos.

Estas variables adicionales son:

(1) Criterio de fiabilidad,

(2) Relevancia de criterio,

(3) La relación de selección, y

(4) El porcentaje de empleados actuales considerado exitoso.

Se advierte al lector que tenga en cuenta que la predicción grupal es el proceso de selección sistemática de una submuestra de solicitantes que tienen más posibilidades de éxito, en promedio, que el grupo en su totalidad o cualquier subgrupo seleccionado al azar de la totalidad. Esto difiere del proceso de predicción individual cuando se trata de predecir la probabilidad de éxito de una persona en particular, en lugar de un grupo de personas.

Por supuesto, hay situaciones de selección que involucran aspectos de selección tanto individuales como de grupo. Un ejemplo es un programa de selección utilizado por la Marina de los Estados Unidos en su selección de cadetes de vuelo. La Armada utiliza técnicas de predicción grupal antes y durante las diferentes fases del entrenamiento de vuelo.

Además, también es necesario realizar predicciones para un cadete específico y su probabilidad individual de éxito en el programa. La necesidad de estos últimos tipos de predicciones ocurre cuando el historial de un cadete durante el entrenamiento ha sido lo suficientemente pobre como para llevarlo ante un comité de revisión. Para este programa de la Armada se usan los mismos predictores básicos tanto para el grupo como para las predicciones individuales.

Validez del Predictor:

El índice estadístico principal que influye en la utilidad de cualquier instrumento de predicción es su validez. Si bien se demostrará que las situaciones de validez baja e incluso nula pueden resultar en una selección bastante exitosa en condiciones especiales, el coeficiente de validez sigue siendo la variable central en la selección. Para ilustrar, considere los diagramas que se muestran en la Figura 2.10 en los que se muestran dos relaciones diferentes de predictor-criterio, una con una validez de 0, 00 y la otra con una validez de 0, 70. En ambos casos, se ha establecido un puntaje de corte en el predictor que nos permite tomar el 50% superior de las personas que toman la prueba.

¿Qué predictor resultará en el mayor aumento en la puntuación de criterio promedio del grupo seleccionado sobre lo que se ha logrado con métodos anteriores (es decir, selección aleatoria)? Observando primero el predictor A en términos de cómo se distribuye a las personas solo en la dimensión del criterio, encontramos que la puntuación media del criterio del grupo "aceptado" es exactamente la misma que el grupo "rechazado". Es decir, las personas que son aceptadas tomando la mitad superior de las calificaciones en la prueba A no tienden a tener puntuaciones de criterios más altas que el 50 por ciento más bajo de los anotadores en la prueba A, como se muestra en la Figura 2.11.

Sin embargo, cuando observamos el predictor B, obtenemos una imagen bastante diferente. Podemos ver de inmediato que las personas que están por encima del límite parecen hacerlo mejor en el criterio que las que están por debajo del límite. Es decir, las personas que están por encima del límite tienen un puntaje de criterio promedio más alto que los que están por debajo. Esto se muestra en la Figura 2.12, que nuevamente muestra las tres distribuciones de los valores de criterio.

Por lo tanto, parece que tenemos nuestro primer principio general en la utilidad de prueba: dado que cualquier corte definido arbitrariamente en una prueba, cuanto mayor sea la validez, mayor será el aumento en el puntaje promedio de criterio para el grupo seleccionado sobre el observado para el grupo total.

En otras palabras, la diferencia:

(X _{grupo seleccionado} ) - (X _{grupo total} )

Aumentará en proporción directa a la validez de la prueba. De hecho, se puede demostrar algebraicamente que esto es así (más adelante veremos ciertas excepciones a este primer principio). Recientemente, Naylor y Shine (1965) han publicado un conjunto de tablas que ofrecen un cálculo fácil del aumento en el puntaje de criterio promedio que se logrará con cualquier prueba, dado que la validez de la prueba y el punto de corte de la prueba se pueden especificar. Esta tabla se encuentra en el Apéndice junto con explicaciones y ejemplos de su uso.

Relación de selección y porcentaje de empleados exitosos:

Otras dos variables que juegan un papel importante en la determinación de la utilidad de un predictor son la proporción de selección y el porcentaje de empleados actuales considerados exitosos. El lector recordará que la utilidad de un predictor se definió como la mejora en la calidad de las contrataciones obtenidas utilizando un dispositivo de predicción en comparación con los métodos actuales de selección.

La calidad se define generalmente en términos de (1) la puntuación promedio de criterios del grupo, o (2) en términos de la proporción de personas en ese grupo que tienen puntuaciones de criterios por encima de algún valor que se considera mínimo para que uno pueda ser un empleado exitoso Para cualquier coeficiente de validez obtenido entre el criterio y el predictor, una manipulación de la proporción de selección y / o un cambio en el porcentaje de empleados actuales considerados exitosos resultará en cambios marcados en la calidad resultante de los empleados contratados (seleccionados).

Ratio de selección:

En pocas palabras, la relación de selección (SR) se puede expresar como:

n / N = SR

Donde n = número de ofertas de trabajo

N = número de solicitantes de empleo disponibles para la colocación

Cuando el SR es igual o mayor que 1.00, el uso de cualquier dispositivo de selección tiene poco significado. Con más ofertas de trabajo que solicitantes de empleo, el solicitante se encuentra en un mercado de vendedores donde la compañía puede necesitar comprar sus servicios independientemente de su calidad. Sin embargo, si el SR es menos de 1.00, entonces hay más solicitantes de empleo que puestos y el empleador está en condiciones de ser selectivo en cuanto a quién contrata.

La forma en que el SR puede influir en el proceso de selección se puede demostrar mejor consultando la Figura 2.13. En la Figura 2.13a, se muestra un diagrama de dispersión de puntuaciones que tiene aproximadamente la forma que podría esperarse con una gran muestra de personas y una correlación entre el predictor y el criterio de 0.70 (cuanto más alta es la correlación, más cerca del diagrama de dispersión). se aproximará a una línea recta; cuanto más baja sea la correlación, más se aproximará el círculo de dispersión a la parcela de dispersión). La proporción del óvalo que está sombreado representa la proporción de solicitantes que realmente son contratados, es decir, el SR. En la figura 2.13a, se presenta una RS de 100; Hay una oferta de trabajo para cada solicitante, por lo que todos serán contratados.

En la parte b de la Figura 2.13 vemos lo que sucede con la calidad promedio de las personas contratadas cuando la SR se convierte en 0.80. Debido a que hay empleos para solo el 80 por ciento de los solicitantes, el empleador contratará lógicamente al 80 por ciento que tenga los puntajes más altos de predictor, ya que el predictor está altamente relacionado con el desempeño del criterio posterior.

Estos 80 por ciento están representados por el área sombreada del óvalo que cae a la derecha del punto de corte en el predictor. Dado que los que se eliminan generalmente tienen puntajes de criterio bajos, es fácil ver cómo el puntaje promedio de criterio para aquellos contratados con un SR de 0.80 es mayor que si un grupo aleatorio de solicitantes se colocara en puestos de trabajo como se muestra en la Figura 2.13a. Este aumento en la calidad promedio se muestra aún más dramáticamente en la Figura 2.13c que ilustra una RS de 0.20. Ante una situación en la que hay diez solicitantes por cada dos trabajos, el empleador está "sentado bastante": ahora puede seleccionar el 20 por ciento más alto de los artistas. Estos individuos están representados por el área sombreada del óvalo que cae a la derecha del corte en la Figura 2.13c. La diferencia en la calidad promedio del puntaje de criterio para este subgrupo selecto en comparación con la de todo el grupo es muy grande. Los beneficios para el empleador en términos de dólares en esta situación deberían ser sustanciales.

El principio general de que una proporción de selección más baja siempre dará como resultado la contratación de empleados de mejor calidad siempre que la relación entre el predictor y el criterio sea algún valor mayor que cero (las r positivas o negativas son igualmente efectivas si son de igual magnitud) . De hecho, se puede demostrar que el principio de la proporción de selección se puede utilizar efectivamente en algunos casos, incluso si todos los solicitantes necesitan ser contratados. Esto puede ocurrir si hay al menos dos trabajos, cada uno con una serie de aperturas y cada uno de los cuales tiene su propio predictor con una validez superior a cero.

Porcentaje de empleados actuales que tienen éxito:

En nuestra discusión sobre la validez y la RS, hasta ahora hemos asumido que el criterio es continuo y, por lo tanto, cuanto más alto sea el puntaje del criterio, más satisfactorio será el trabajador. Supongamos ahora que existe un puntaje de criterio que define si un trabajador es satisfactorio o insatisfactorio, es decir, si se desempeña por encima de un estándar, se lo considera satisfactorio y si lo hace por debajo de este estándar, se lo considera insatisfactorio. Los diagramas en la Figura 2.14 ilustran esto.

En la parte a, se muestra una relación de alrededor de 0, 70 entre el criterio y el predictor. Tenga en cuenta que la línea horizontal, llamada corte de criterio, separa a todos los trabajadores en dos grupos: aquellos considerados exitosos y aquellos considerados sin éxito. Tal corte tendrá, por supuesto, que ser de naturaleza bastante arbitraria. Sin embargo, en muchos casos no es demasiado difícil llegar a un consenso sobre el rendimiento mínimo aceptable.

La parte b de la figura 2.14 muestra los mismos datos con un corte de predictor basado en una relación de selección de aproximadamente 0, 5. La última parte de la figura muestra ambos cortes juntos. Cuando se combina de esta manera, es posible distinguir entre las diversas sub-porciones de los datos que se forman por la intersección de las dos líneas de corte.

Parte A. Los solicitantes que se encuentran a la derecha del punto de corte de la prueba y que están por encima del límite de criterio se denominan verdaderos positivos. Son aquellos que, según la prueba, deberían tener éxito y, de hecho, tendrán éxito de acuerdo con el criterio. Representan decisiones correctas basadas en la prueba.

Parte B. Este segmento incluye a aquellos solicitantes que tienen puntuaciones por debajo del límite de predictor y por debajo del criterio de corte. Llamados los verdaderos negativos, estos solicitantes, como los verdaderos positivos, representan decisiones correctas basadas en el predictor.

Parte C. Estos solicitantes tienen puntuaciones por debajo del límite de predictor pero por encima del criterio de corte. Estas personas no serían contratadas si las decisiones de contratación se basaran en la prueba, a pesar del hecho de que su puntaje de criterio final fue lo suficientemente alto como para ubicarlos en la categoría satisfactoria. Esto representa un tipo de error o error que se produce en las pruebas y se conoce como falsos negativos.

Parte D. El último segmento del óvalo consiste en solicitantes de empleo que serían contratados, pero que posteriormente serían insatisfactorios en su trabajo. Estas personas también representan "errores" en el proceso de selección y se conocen como falsos positivos.

Se pueden construir varias relaciones significativas utilizando las distintas partes de la Figura 2.14c. Por ejemplo,

(1) C + D / A + B

Esta es una relación entre la cantidad de errores en la selección y la cantidad de empleados colocados correctamente. El tamaño de esta relación depende de las tres variables: la ubicación del criterio de corte, la ubicación del predictor de corte y el coeficiente de validez. El tamaño de esta relación no solo se ve afectado por estas variables, sino que también lo es la magnitud relativa de los dos tipos de errores, C y D. Por lo general, el empleador está más preocupado por minimizar los falsos positivos que por el número de falsos negativos. .

A menudo, quienes se oponen a las pruebas consideran esto como uno de los principales males de la selección científica a través de las pruebas, a saber, que algunas personas son rechazadas y tendrán éxito en el trabajo si se les da la oportunidad de demostrar su valía. El lector tendrá que deliberar los pros y los contras de este problema por sí mismo; los autores simplemente señalan la dificultad.

Sin embargo, los autores se apresuran a agregar que los psicólogos industriales pueden tener una mentalidad social como sus críticos. Los psicólogos industriales generalmente tienen los datos para contar toda la historia, mientras que algunos críticos sin ningún tipo de información se limitan a "gritar" acerca de un error.

Otra relación de importancia viene dada por

(2) A + C / A + B + C + D = porcentaje actualmente exitoso

Esto representa el porcentaje de empleados actuales que son satisfactorios. Es un porcentaje base que expresa el grado de éxito que se obtiene con los métodos de selección utilizados antes de la introducción del predictor. La tercera proporción,

(3) A / A + D = porcentaje de éxito usando predictor es una expresión de la proporción de solicitantes contratados que tendrán éxito si uno usa el predictor como una ayuda para la selección junto con los métodos que se están empleando actualmente. En la medida en que (3) sea mayor que (2), el predictor está agregando algo al proceso de selección.

Al comparar la magnitud relativa de (2) y (3), se pueden establecer algunos principios generales:

1. Para cualquier validez particular y corte de criterio, una reducción en la RS causará un aumento en la validez efectiva. Por lo tanto, uno puede compensar la baja validez estadística si puede ser selectivo en sus contrataciones.

2. Para cualquier validez estadística y relación de selección en particular, cuanto menor sea el porcentaje de empleados actuales considerado satisfactorio, mayor será el porcentaje de aumento de solicitantes satisfactorios obtenidos utilizando el predictor. En otras palabras, si definimos la diferencia entre las razones (2) y (3) como

Utilidad = A + C - A + C / A + B + C + D = porcentaje de aumento de efectividad

Cuando la efectividad se define como el porcentaje de éxitos empleados, el mayor beneficio se observará en aquellas condiciones en las que se está realizando el trabajo más pobre, un resultado lógico. Hay algunas excepciones, por supuesto. Por ejemplo, considere la figura 2.15.

Observe en la Figura 2.15 que, independientemente de cuál de los tres índices de selección diferentes se utilice, el 100 por ciento de todos los solicitantes contratados finalmente se considerarán satisfactorios. Por lo tanto, aquí hay una situación en la que grandes cambios en la relación de selección no tienen ninguna consecuencia.

Tablas de Taylor-Russell:

Taylor y Russell (1939) prepararon una expresión detallada de las relaciones exactas entre el tamaño del coeficiente de validez, la proporción de selección y el porcentaje de empleados actualmente satisfactorios. Bajo condiciones de validez dadas, proporción de selección y porcentaje satisfactorio, sus tablas permiten determinar el porcentaje de contrataciones que serán satisfactorias utilizando el predictor junto con los métodos actuales.

Sin embargo, las tablas de Naylor-Shine discutidas en la sección sobre la validez del predictor parecen tener varias ventajas sobre las tablas de Taylor-Russell. Las tablas de Naylor-Shine se formulan en términos de diferencias en el puntaje promedio de criterio entre el grupo seleccionado y el grupo original; Taylor y Russell usan diferencias en el porcentaje de éxito entre el grupo seleccionado y el grupo original.

Por lo tanto, las tablas de Naylor-Shine parecen dar un índice más significativo de la utilidad de prueba. Además, el uso de las tablas de Taylor-Russell requiere que los empleados se separen en dos grupos, "exitoso" y "no exitoso", seleccionando algún punto arbitrario en la dimensión de criterio que represente "rendimiento mínimo satisfactorio". Las tablas de Naylor-Shine no requieren ninguna decisión de este tipo para su uso y, por lo tanto, son más generales en su aplicabilidad.

Una nota de precaución. Tanto las tablas Naylor-Shine como las tablas de Taylor-Russell tienen ciertas limitaciones que son muy importantes. Ambos métodos para evaluar la utilidad de la prueba se basan en los supuestos de que (1) la relación entre el predictor y el criterio es lineal, y (2) el coeficiente de validez utilizado es uno obtenido mediante procedimientos de validez concurrentes.

Smith (1948) y otros han señalado los peligros que existen si uno intenta usar tablas como las de Taylor y Russell en condiciones donde la relación no es lineal entre el predictor y el criterio. Dicha relación se muestra en la Figura 2.16. Cuando existen tales relaciones no lineales, ambas tablas son completamente inapropiadas para determinar la utilidad de prueba.

El hecho de que ambas tablas asuman un coeficiente de validez basado en procedimientos de validación concurrentes puede ser una sorpresa, ya que anteriormente se señaló que la validez concurrente no era un sustituto particularmente bueno de la validez predictiva. Sin embargo, la utilidad de prueba implica determinar el aumento del puntaje de criterio promedio (tablas de Naylor-Shine) o del porcentaje de empleados exitosos (tablas de Taylor-Russell) sobre el obtenido actualmente con los empleados actuales. El diagrama de dispersión básico se basa en los empleados actuales contratados por los procedimientos de selección normales: el paradigma típico de validez concurrente.

Fiabilidad de Predictor y Criterio:

La fiabilidad del criterio y del predictor también son importantes, principalmente porque influyen o ponen límites al tamaño del coeficiente de validez que se puede obtener. Existe una relación algebraica básica que existe entre la validez y la confiabilidad del predictor y el criterio que es

r _pc (obtenido) = r _pc (true) √r _pp xr _cc

Dónde

r _pc (obtenido) = correlación observada (validez) entre el predictor y el criterio

r _pc (verdadero) = correlación “verdadera” (validez) entre el predictor y el criterio

r _pp = fiabilidad del predictor

r _cc = fiabilidad del criterio

Note en la relación anterior que solo cuando r _pp y r _pcc son la unidad (confiabilidad perfecta) la validez obtenida será igual a la validez real. A medida que la confiabilidad de las dos medidas disminuye, también lo hará la validez obtenida. Por ejemplo, supongamos que r _{pc (verdadero)} = 0.06, r _pp = r _pcc = 0.08, luego r _{pc (obtenido)} = 0.06 √0.80 x 0.80 = 0.60 (0.80) = 0.48. También tenga en cuenta que si la confiabilidad del predictor o del criterio es cero, también obtendrán una validez igual a cero.

Relevancia del criterio:

La relevancia de un criterio tiene poco que ver con la utilidad empírica real de un instrumento de predicción, aunque tiene mucho que ver con su utilidad lógica.