Cómo trabajó una empresa para eliminar los sesgos de las reseñas de desempeño
por Joan C. Williams, Denise Lewin Loyd, Mikayla Boginsky, Frances Armas-Edwards

Hace unos dos años, un bufete de abogados estadounidense mediano contactó con el Center for WorkLife Law para saber cómo estaban surgiendo sesgos en sus evaluaciones de desempeño. El director de D&I de la firma comprobó puntualmente una muestra de las evaluaciones de los supervisores para ver si estaban sesgadas e identificado varias señales de alerta. Decidieron que querían ir un paso más allá y adoptar un enfoque basado en los datos. (¡Música para nuestros oídos!)
Empezamos por realizar una auditoría de las evaluaciones del desempeño de la empresa. La gran mayoría me pareció útil y apropiada. Pero si analizamos más de cerca los datos, encontramos diferencias aleccionadoras tanto por raza como por género. Lo más dramático fue que solo el 9,5% de las personas de color recibieron menciones al liderazgo en sus evaluaciones de desempeño, más de 70 puntos porcentuales menos que las mujeres blancas. No es sorprendente que las menciones de liderazgo normalmente predijeran índices de competencia más altos el año que viene.
Le recomendamos una serie de intervenciones, lo que llamamos interruptores de polarización — y accedió a poner a prueba su eficacia analizando las evaluaciones de desempeño de la empresa al año siguiente.
¿La buena noticia? Los resultados de las intervenciones fueron sorprendentes. Vimos una mejora pronunciada en un solo año. He aquí cómo.
**Los cuatro patrones de sesgo que afectan a las evaluaciones
**
Identificamos cuatro patrones básicos de sesgo racial y de género, documentado por décadas de investigación, en nuestra evaluación de las evaluaciones:
1. Demuéstrelo otra vez
Los grupos estereotipados como menos competentes —incluidas las mujeres, las personas de color, las personas con discapacidades, los empleados mayores, la comunidad LGBT+ y los profesionales de origen obrero— tienen que demostrar su valía una y otra vez. La forma en que esto se refleja en las evaluaciones del desempeño es que los grupos que «demuéstralo» tienden a ser juzgados por su desempeño (sus errores se notan más y se recuerdan durante más tiempo), mientras que a la mayoría de los hombres blancos se les juzga por su potencial.
En el primer año de nuestro estudio, el 43% de las personas de color y el 31% de las mujeres blancas mencionaron al menos un error en la evaluación, en comparación con el 26% de los hombres blancos. Los estudios han demostrado que Los abogados negros son sometidos constantemente a un mayor escrutinio, y este conjunto de datos no fue diferente, ya que el 50% de las evaluaciones de los hombres negros y el 50% de las mujeres negras mencionaron al menos un error.
2. La cuerda floja
Se acepta una gama más limitada de comportamientos laborales por parte de las mujeres y las personas de color. Los hombres blancos simplemente tienen que ser autoritarios y ambiciosos para tener éxito, pero las mujeres y las personas de color corren el riesgo de ser vistas como demasiado agresivas o «difíciles» si se comportan de la misma manera.
La evidencia más clara de un sesgo por la cuerda floja en nuestra auditoría se refería a los comentarios sobre la personalidad. Descubrimos que las personas de color y las mujeres blancas tenían muchas más probabilidades de que se mencionara su personalidad en sus evaluaciones (incluidos los rasgos de personalidad negativos). Lo que es opcional para los hombres blancos (llevarse bien con los demás), parecía ser necesario para las mujeres blancas y las personas de color. Un ejemplo: el 83% de los hombres negros fueron elogiados por tener una «buena actitud» frente al 46% de los hombres blancos, y el 27% de las mujeres blancas fueron elogiadas por ser «amables y cálidas» frente al 10% de los hombres blancos.
La personalidad no fue el único tipo de sesgo por la cuerda floja que descubrimos: el 50% de las evaluaciones de las mujeres negras incluían menciones a las «tareas del hogar de oficina» (también conocidas como el trabajo infravalorado y entre bastidores), en comparación con el 16% de las mujeres blancas y el 3% de los hombres blancos. Los estereotipos prescriptivos presionan a las mujeres para que sean modestas, serviciales y amables. (Piense en la «mamá de la oficina».)
3. El muro materno
Esto refleja la suposición de que las madres ya no están comprometidas con su trabajo, que probablemente no deberían estarlo y que son menos competentes. (Piense en «el cerebro del embarazo».)
Una de nuestras conclusiones más impactantes fue que casi el 20% de las mujeres blancas recibieron comentarios en sus evaluaciones de desempeño en el sentido de que no querían hacer pareja. Sospechamos que muchas de estas mujeres no dijo así que los gerentes solo hacían suposiciones sobre su compromiso cada vez menor con su trabajo después de tener hijos. Las mujeres también tenían más probabilidades de recibir comentarios sobre el exceso de trabajo que los hombres.
4. Estereotipos raciales
Los estereotipos raciales relacionados con las evaluaciones del desempeño pueden ser evidentes, como la estereotipo que los estadounidenses de origen asiático son buenos en las tareas técnicas, pero carecen de capacidad de liderazgo, o más sutiles, como la suposición de que las personas de color tienen que estar más dispuestas a sacrificar el equilibrio entre la vida laboral y personal que los hombres blancos. En nuestra auditoría, descubrimos que un tercio (el 33%) de las personas de color recibieron comentarios diciendo que estaban dispuestas a viajar, en comparación con el 13% de los hombres blancos.
Dos cambios sencillos
Para combatir estos sesgos, trabajamos con la empresa para hacer dos ajustes sencillos y económicos en su sistema de evaluación del desempeño.
Primero cambiamos el propio formulario. El formulario original tenía un mensaje abierto que no especificaba qué competencias valoraba la organización ni exigía pruebas para justificar las valoraciones del gerente. El nuevo formulario dividía las categorías de trabajo en competencias y pedía que las calificaciones estuvieran respaldadas por al menos tres pruebas. Eso es para combatir la efecto «halócuernos» donde los hombres blancos se benefician artificialmente de los índices mundiales porque obtienen halos (en los que una fortaleza se generaliza en una valoración general alta), mientras que otros grupos reciben cuernos (en los que un error se generaliza y se convierte en una valoración general baja).
En segundo lugar, trabajamos con la empresa para ayudar a desarrollar un taller sencillo de una hora que enseñara a todos a utilizar el nuevo formulario. El taller mostró comentarios reales de las evaluaciones del año anterior y planteó una pregunta sencilla: ¿Cuál de los cuatro patrones básicos de sesgo representa este comentario o no representa ningún sesgo?
**Cómo la intervención ayudó a todo el mundo y por qué
**
Luego examinamos la siguiente ronda de evaluaciones de desempeño tras las intervenciones. En el segundo año, las personas de color no solo recibieron más menciones de liderazgo (el 100% en el segundo año), sino que también recibieron comentarios mucho más constructivos. Solo el 17% de los comentarios hechos a personas de color contenían comentarios constructivos en el primer año, frente al 49% del segundo año. Los comentarios constructivos también aumentaron para las mujeres blancas (del 10,5% al 29,5%) y para los hombres blancos (del 15 al 27%). Esto pone de relieve un punto sumamente importante: el uso de un sistema de evaluación del desempeño basado en la evidencia ayuda a todos los empleados. En el segundo año, la especificidad del formulario de evaluación también permitió evaluar de manera mucho más eficaz las principales habilidades y contribuciones que son de gran valor para la empresa.
La intervención también igualó las condiciones de juego en otros sentidos importantes. Los hombres blancos se sometieron a evaluaciones más largas y complejas en el primer año; en el segundo año, tanto el recuento de palabras como la complejidad lingüística fueron similares en todos los grupos. Los comentarios negativos de personalidad disminuyeron drásticamente en el segundo año para las personas de color: el 14% hizo un comentario de personalidad negativa en el primer año, pero el 0% en el segundo año. La organización identificó «tomar la iniciativa» como un valor fundamental, lo mencionó como una competencia en el formulario y vio un aumento drástico en el número de empleados que recibieron un comentario en el que describían la época en la que tomaron la iniciativa. El cambio fue más drástico para las personas de color (del 19 al 94 por ciento en el segundo año), pero también para los blancos.
Los hombres blancos se benefician injustamente de las calificaciones globales ofrecidas sin respaldo, que son placas de Petri para sesgar. Al pasar a habilidades y competencias específicas, los hombres blancos también perdieron su ventaja no merecida sobre las personas de color en las recomendaciones de ascensos.
**No es uno y listo: un proceso iterativo
**
Un solo año de una sola intervención no transformará la cultura empresarial. Piénselo: si su empresa tuviera un problema con las ventas, no esperaría conseguirlo en un solo año. Cambiaría una cosa y vería cómo funcionaba, luego cambiaría otra y, luego, otra hasta alcanzar su objetivo de ventas. Las empresas tienen que utilizar el mismo enfoque iterativo con DEI.
Las evaluaciones del segundo año sugieren que esta empresa todavía tiene el problema de «las mujeres son maravillosas». Las mujeres tenían valoraciones más altas en muchos artículos diferentes, incluso que se las considerara un valor o un activo para la empresa, pero esto no pareció traducirse en las oportunidades que conducen al ascenso. Las mujeres blancas seguían teniendo muchas más probabilidades que otros grupos de recibir comentarios en sus evaluaciones que decían que necesitan oportunidades adicionales (el 51 frente al 33%) y que se merecen ascensos (el 37 frente al 22%).
La gente de color también tenía problemas con «demuéstrelo de nuevo». El nuevo formulario pedía a los evaluadores que enumeraran las dos o tres principales competencias del empleado. Solo el 33% de las personas de color figuraban en la lista de eficacia y eficacia (un valor clave para la organización), en comparación con el 80% de las mujeres blancas y el 63% de los hombres blancos. Los errores de las personas de color también se denunciaron en niveles más altos que los de las personas blancas (el 78 frente al 43%).
Por último, la empresa todavía tiene problemas con las tareas domésticas de oficina. Los hombres blancos tenían muchas menos probabilidades que las personas de color o las mujeres blancas de mencionar tareas administrativas menos importantes.
En esta firma, como en cualquier organización, la resolución de los desafíos de la DEI será un proceso de varios años que requerirá cambiar las prácticas de gestión del rendimiento más antiguas. Pero una cosa es segura: trabajar con las pruebas y utilizar las métricas ayudará a las empresas a progresar de manera constante año tras año y a mejorar los resultados para todos. Este es el único camino hacia un cambio sostenible.
En este momento, cuando muchas organizaciones están asumiendo sus funciones y responsabilidades para garantizar la equidad racial, la buena noticia es que un enfoque basado en los datos puede ofrecer avances rápidos y concretos.
Artículos Relacionados

La IA es genial en las tareas rutinarias. He aquí por qué los consejos de administración deberían resistirse a utilizarla.

Investigación: Cuando el esfuerzo adicional le hace empeorar en su trabajo
A todos nos ha pasado: después de intentar proactivamente agilizar un proceso en el trabajo, se siente mentalmente agotado y menos capaz de realizar bien otras tareas. Pero, ¿tomar la iniciativa para mejorar las tareas de su trabajo le hizo realmente peor en otras actividades al final del día? Un nuevo estudio de trabajadores franceses ha encontrado pruebas contundentes de que cuanto más intentan los trabajadores mejorar las tareas, peor es su rendimiento mental a la hora de cerrar. Esto tiene implicaciones sobre cómo las empresas pueden apoyar mejor a sus equipos para que tengan lo que necesitan para ser proactivos sin fatigarse mentalmente.

En tiempos inciertos, hágase estas preguntas antes de tomar una decisión
En medio de la inestabilidad geopolítica, las conmociones climáticas, la disrupción de la IA, etc., los líderes de hoy en día no navegan por las crisis ocasionales, sino que operan en un estado de perma-crisis.