PathMBA Vault

Employee performance management

La nueva visión de Cyanamid sobre la evaluación del desempeño

por Saul W. Gellerman, William G. Hodgson

De una forma u otra, las evaluaciones del desempeño llevan con nosotros más de 50 años. Pocos discutirían la idea de vincular la remuneración con el desempeño, recompensar así el buen trabajo y (el empleador espera) dar a los trabajadores mediocres un incentivo o un estímulo para que lo hagan mejor el año que viene. Si los que no rinden dejan de fumar, la organización se beneficia.

Aun así, los sistemas de evaluación del desempeño siguen siendo infinitamente controvertidos. Por un lado, muchos (si no la mayoría) de los que triunfan están motivados al menos tanto por el orgullo o el deseo de sobresalir como por la esperanza de una mejor paga. Los críticos también afirman que las bajas calificaciones tienden a desmotivar a los que tienen un desempeño inferior en lugar de a impulsar su mejora. Además, estos actores con malos resultados no suelen dejar de fumar; muchos se quedan años y años. Luego está la cuestión, a veces espinosa, de cómo medir el rendimiento. Por último, muchos directivos ven con desagrado las reuniones obligatorias e individuales con los subordinados para hablar de los resultados frente a las expectativas.

En American Cyanamid Company, llevaba más de una década en funcionamiento un sistema de evaluación del desempeño llamado «revisiones del progreso» cuando, en 1984, la empresa decidió analizarlo detenidamente. Las revisiones formaban parte del procedimiento de administración salarial basado en los méritos.

La evaluación surgió de un esfuerzo lanzado por el CEO George J. Sella, Jr., para cambiar la cultura de la empresa. En una encuesta, sus ejecutivos usaron estas palabras para describir a Cyanamid: conservador, burocrático y no lo suficientemente orientado a las personas. Si bien le dieron altas calificaciones por su integridad y dedicación a la investigación y el desarrollo, deseaban que tuviera «una estructura más flexible», despertara «más creatividad» y mostrara más «voluntad de correr riesgos».

En respuesta, Sella puso$ Reserva 1 millón para un «fondo de innovación» que apoye proyectos que puedan mejorar la calidad de vida de los empleados de la empresa.

Un proyecto que se puso en marcha al mismo tiempo tenía un enfoque diferente al tan criticado plan de evaluación de la actuación profesional. Emprendido en la División de Investigación Médica, se consideró un éxito y se adoptó un plan similar para los 11 500 empleados asalariados de Cyanamid en los Estados Unidos.

En vigor solo en toda la empresa desde 1986, la nueva táctica sigue siendo puesta a prueba. Pero no cabe duda de su éxito entre los trabajadores del conocimiento de la División de Investigación Médica.

Esto por sí solo puede tener una gran importancia en vista del creciente número y la importancia en las organizaciones de trabajadores que se ganan la vida principalmente interpretando la información. (Aproximadamente una de cada ocho personas en la fuerza laboral pertenece ahora a esa categoría y su proporción crece rápidamente). Satisfacer el deseo de reconocimiento y ascenso de estos empleados profesionales o cuasiprofesionales a menudo entra en conflicto con la preferencia de la burocracia de la organización por procedimientos uniformes y fáciles de administrar, como la evaluación del desempeño.

Insatisfacción aguda

En Cyanamid, según el antiguo sistema, los asalariados cuya actuación se considerara la mejor recibían un O (para «sobresaliente»), lo que les daba derecho a los aumentos más altos. La mayoría de los demás recibieron una u otra de las dos clasificaciones: X («excelente en varias áreas principales»), o R («logra los resultados esperados»). Aproximadamente 20% de los empleados de una unidad determinada deberían recibir una calificación NO; 40%, X; y 40%, R. Al subdividir estas categorías había clasificadores de más y menos, por ejemplo, X+ y X— a ambos lados de X. También había una cuarta valoración, N (para «necesita mejorar»), rara vez. Por lo tanto, había diez puntuaciones posibles.

Los administradores de las divisiones del plan solían conceder calificaciones más o menos de acuerdo con la pauta de 20 a 40. Esto también afectó a los aumentos salariales, que se fijaron según un rango en cada categoría. Los mayores aumentos se destinaron a los empleados que ganaron O pero que se mantuvieron bajos en sus rangos salariales. La distribución fija de las recompensas tendía a aplanar los aumentos salariales de quienes habían obtenido las mismas puntuaciones durante un período de tiempo.

Los científicos de la División de Investigación Médica de Cyanamid, preguntados por sus reacciones ante el sistema, hicieron comentarios ácidos, entre ellos los siguientes:

Resultados alentadores de las encuestas de los dos grupos

«Las revisiones de progreso ilustran algunos aspectos de la forma en que mi superior me califica, pero sé muy bien que también están influenciados por las cuotas».

«Mi trabajo podría ser sobresaliente año tras año, pero si otra persona de mi grupo fuera sobresaliente, se me negaría esa calificación».

«Hasta que no sea mi turno, no puedo conseguir una valoración mejor haga lo que haga».

«No me lo tomo en serio. Es un juego de números de Mickey Mouse. Mi superior y yo simplemente nos reímos de ello y lo superamos lo más rápido que podemos».

«Evidentemente, se hace un esfuerzo por ajustar a las personas de una sección a una curva acampanada para que puedan repartir aumentos y no sobrepasar el presupuesto. Pero como científico sé que solo se debe aplicar una curva en campana cuando la población es lo suficientemente grande y estos departamentos son muy pequeños».

Entre los directivos de Cyanamid, el procedimiento tenía defensores y detractores. Los defensores sostuvieron que, aunque adolecía de muchos de los defectos habituales inherentes a la evaluación del desempeño, su propósito central —recompensar y fomentar la excelencia— era simplemente demasiado importante como para sacrificarlo. Otros pensaban que, con demasiada frecuencia, las recompensas parecían estar correlacionadas con la educación y la antigüedad en el servicio. Y además, que el sistema creó apatía y una sensación de inutilidad entre los empleados que recibían calificaciones más bajas, cuyo desempeño, si se comparaba con las descripciones de sus puestos y no entre sí, era totalmente satisfactorio. Para los críticos, el peor aspecto era el efecto desmotivador de un R calificación, que en general se consideraba un estigma.

El departamento de personal de Cyanamid escuchaba a menudo quejas de los directivos que se sentían incómodos al gestionar las revisiones de progreso. Los supervisores tenían que identificar y analizar los aspectos del desempeño de un empleado que debían mejorarse. Temían esta tarea. A menudo se sentían obligados a insistir en defectos triviales que normalmente se pasarían por alto o en hábitos que era poco probable que cambiaran. Y los directivos eludieron la obligación de comparar el desempeño de un empleado con el de otros miembros del mismo departamento. Muchos se quejaron de tener que enfrentarse al resentimiento de los empleados que tenían R s.

Está claro que la empresa estaba preparada para un cambio.

Juicio divisional

La División de Investigación Médica llevó a cabo el experimento en dos de sus secciones, cada una de las cuales empleó a unas 70 personas, durante un período de dos años. Se eligieron estas secciones porque eran las más comparables de la división en cuanto al tamaño, la misión, las características del puesto, la demografía (especialmente la educación y la antigüedad en el empleo) y la distribución salarial. Ambas secciones se dedican a experimentos y análisis de laboratorio; ambas incluyen a los empleados aproximadamente en las mismas proporciones en los niveles de licenciatura, máster y doctorado, así como a los gerentes de estos niveles.

El primer paso consistió en establecer una base de actitudes y percepciones de ambos grupos mediante un cuestionario. Esta encuesta reveló que los dos grupos eran comparables en su aversión casi uniforme por las revisiones del progreso, sobre todo en su antipatía por la distribución predeterminada de las puntuaciones. Una sección pasa ahora a ser un grupo de control y la otra a un grupo experimental.

Mientras el grupo de control continuaba con el sistema anterior, al grupo experimental se le presentó un nuevo plan que tenía las siguientes características:

  • Solo tenía tres calificaciones de rendimiento posibles.

  • Se supuso que la mayoría de los empleados, la mayoría de las veces, se desempeñan dentro de un amplio rango de aceptabilidad y que, si bien es posible hacer pequeñas distinciones dentro de este rango (por ejemplo, por encima o por debajo de las expectativas normales), hacerlas no es necesario desde el punto de vista administrativo ni deseable desde el punto de vista motivacional. Esta amplia gama de niveles de rendimiento esperados se designó G (para «bien»).

  • Se supuso que, en ocasiones, pero no de forma inevitable, la contribución de una persona supera con creces el rango de desempeño habitual que ningún observador razonable la incluiría dentro de las expectativas normales para una función en particular. No se trata simplemente de mejorar el rendimiento de los compañeros, sino de superar las exigencias del propio trabajo. Esa actuación suele ser cuestión de suerte y coraje, no solo de estar en el lugar correcto en el momento adecuado, sino también de aprovechar las oportunidades y explotarlas de forma creativa. Esta categoría de actuación se llamaba E (para «excepcional»).

  • Por último, supuso que el rendimiento es a veces inaceptable y que, a menos que un empleado haga una mejora rápida, pronunciada y duradera, ya no debería considerarse cualificado para mantener el puesto. No se trata simplemente de tener el peor desempeño del grupo, sino de no cumplir con los requisitos del puesto. Esta categoría de actuación fue designada U (para «inaceptable»).

  • No pedía una distribución recomendada. Desde el E y U las categorías tenían definiciones limitadas y estrictas, pocos (o incluso, ocasionalmente, ninguno) empleados obtenían alguna de las dos calificaciones. Con mucho, el número más alto sería el que normalmente se calificaría G. La distribución dependía del número de empleados que se ajustaran a las tres descripciones.

El sistema simplificó el procedimiento salarial. Calificación de todos los empleados G y E se les concedieron aumentos basados únicamente en sus posiciones en el rango salarial. El E También recibieron bonificaciones globales equivalentes a porcentajes fijos de sus salarios. Los clasificados U no recibió ningún aumento.

En las entrevistas revisadas sobre la revisión del progreso, se esperaba que los supervisores felicitaran a los subordinados por sus puntos fuertes y logros, y que solo se refirieran a las deficiencias si eran graves (como en el caso de U s) o estaban claramente en el poder de los empleados de cambiar mediante un mayor esfuerzo o atención. El propósito era hacer de la reunión una experiencia que apoyara el ego en lugar de que lo dañara. La teoría era que los trabajadores que se sentían bien consigo mismos obtendrían mejores resultados, o al menos verían sus circunstancias desde una perspectiva más favorable, que los que tenían que defenderse de lo que podrían ver como ataques.

El nuevo sistema simplificó la tarea de los directores. Determinar las calificaciones era más fácil y, lo que es más importante, la comunicación de la decisión de calificación era más fácil. Ya no se estigmatizaba a algunos empleados cuando su trabajo era realmente aceptable.

Pero el programa también tenía sus costes. Los que tengan mejores resultados entre los G s (y de hecho, los peores artistas) estaban agrupados con los demás de ese gran grupo. Además, a los empleados que sobresalieron no se les recompensaba necesariamente de manera diferente a la de sus compañeros. Los oficiales de la división temían que estas características hicieran que aquellos cuyo trabajo había sido superior perdieran el deseo de sobresalir. Uno de los propósitos del experimento era determinar si esto ocurriría.

Felices resultados

Siguiendo las expectativas, la gran mayoría de los miembros del grupo experimental puntuaron G en las tasaciones. La distribución de las calificaciones de rendimiento en dos años fue la siguiente:

Al medir las reacciones de los dos grupos en intervalos de uno y dos años, la división utilizó la misma encuesta que estableció las actitudes de referencia con respecto a las revisiones del progreso. Los resultados mostraron que se estaba desarrollando una actitud mucho más favorable hacia el procedimiento experimental. Los supervisores observaron que sus subordinados se quejaban menos.

Las respuestas del grupo experimental a una serie de afirmaciones, cuatro de las cuales se muestran en el prospecto, indican una percepción creciente del sistema de evaluación del desempeño como menos arbitrario. Esto contrasta marcadamente con la actitud del grupo de control.

¿Se pueden atribuir las respuestas del grupo experimental a un «efecto Hawthorne», el breve aumento de las actitudes favorables que a menudo sigue a los cambios en los procedimientos de larga data? Lo dudamos. Esa actitud no duraría dos años. El grupo experimental pasó a tener una disposición más favorable al final del período de prueba. Tampoco es probable que la tendencia negativa en el grupo de control reflejara la envidia hacia el grupo experimental, ya que la existencia del estudio no era muy conocida fuera del grupo experimental.

Estos resultados implican que las opiniones sobre la compensación entre los grupos de trabajadores profesionales con salarios comparables dependen menos de los niveles salariales que de la percepción de imparcialidad del sistema de determinación salarial. También pueden ser una reacción a una forma más sencilla y fácil de entender de asignar los aumentos salariales.

Una buena ventaja para los directivos fue la reducción del tiempo dedicado a preparar las entrevistas con los subordinados: una media de unas seis horas cada una con el antiguo sistema de revisión, en comparación con unas tres horas para los supervisores del grupo experimental. Una de las razones, sin duda, fue el cambio de sesiones llenas de comentarios negativos a la expectativa de reuniones más agradables. Considerando que, por ejemplo, unos 80% de los subordinados declarados por su superior en 1984 por criticar la adaptación de las calificaciones de desempeño con la distribución recomendada, los supervisores del grupo experimental informaron que 85% de sus subordinados expresaron su satisfacción por la ausencia de esas distribuciones.

Tras dos años de exposición al nuevo sistema, las opiniones más favorables al respecto fueron las de los doctorados, a pesar de las ventajas de las que disfrutaban con el sistema anterior. Esto reforzó su afirmación de que les motivaba más el orgullo profesional que el dinero. Uno de ellos escribió en respuesta a una pregunta de una encuesta: «Para mí, la ética laboral, el orgullo profesional y el impulso son factores de motivación más importantes que los aumentos salariales. Pero un aumento salarial deficiente podría ser desmotivador».

Los grupos de la División de Investigación Médica eran pequeños y no representativos de la empresa en su conjunto, por lo que es necesario interpretar los resultados con cautela. Pero son coherentes internamente. Insinúan que, al menos con los trabajadores con un alto nivel educativo, los sistemas de evaluación del desempeño que están diseñados para apoyar, en lugar de desinflar, los egos refuerzan la motivación y promueven la aceptación de un sistema de administración salarial, sin ningún coste financiero mayor.

La cianamida lo compra

Sin esperar a que terminara el experimento en la División de Investigación Médica y, en cierto sentido, anticipándose a sus resultados, Cyanamid introdujo en 1986 nuevos sistemas de revisión de los avances para todos sus trabajadores asalariados a nivel nacional. Los nuevos sistemas tienen las siguientes características:

  • No hay una distribución recomendada.

  • Hay tres clasificaciones posibles, S («superior»), Q («calidad») y N («necesita mejorar»).

  • Se hace hincapié en los objetivos específicos y tanto el empleado como el supervisor aprueban los objetivos de rendimiento anuales.

  • El empleado participa en el proceso de planificación del desempeño, especialmente en la elaboración de un plan de formación y desarrollo.

El experimento en el grupo médico confirmó el juicio de la dirección al diseñar esas características. Pero para ser justos, hay que decir que la empresa habría tomado estas medidas aunque el juicio no hubiera confirmado su validez.

La experiencia de Cyanamid con su nuevo sistema ha sido en gran medida positiva, pero por supuesto sigue siendo nueva. Las primeras reacciones indican que es considerablemente más eficaz y útil para los supervisores y los subordinados que el sistema anterior. Algunos directores de personal han expresado su preferencia por una mayor diferenciación dentro del amplio Q pero por el momento, la alta dirección ha decidido mantener el sistema intacto y adquirir más experiencia con él. Hasta ahora, las pruebas disponibles indican que se aplica ampliamente a los trabajadores asalariados de todo tipo, no solo a los científicos, y que representa una mejora con respecto al sistema anterior para todos esos grupos.

El nuevo sistema de evaluación de la actuación profesional no ha estado exento de críticas, ni en la modalidad de prueba ni ahora. Algunos pensaban que el programa de la División de Investigación Médica, por popular que fuera entre los empleados y los supervisores, era demasiado igualitario y, en última instancia, disuadiría a las personas más capaces de esforzarse por sobresalir. Otros temían que la falta de énfasis en las deficiencias de los empleados durante las entrevistas de revisión del progreso afianzara gradualmente hábitos descuidados o ineficientes. El experimento no presentó pruebas que respaldaran estos temores; pero si finalmente resultaran ser ciertos, habría que contarlos como costes para sopesarlos con los beneficios del sistema.

A primera vista, los diferentes métodos de administración de los salarios pueden parecer que han roto el vínculo entre la remuneración y el rendimiento (y que lo han hecho sin dañar a la organización): dentro del amplio grupo de G—87% o más del total, como hemos observado, los aumentos no se basaban en las diferencias de rendimiento sino en la posición del salario dentro de un rango.

Sin embargo, es posible que el sistema tradicional haya roto ese vínculo más que el nuevo, al evaluar el desempeño de los trabajadores entre sí y no en función de las expectativas implícitas en las descripciones de sus puestos, y haciendo distinciones más precisas entre las personas con un desempeño aceptable de lo que podría justificarse.

El experimento reconoció que en las empresas que contratan de forma selectiva, ascienden en función de un desempeño superior y reasignan o despiden por un desempeño inadecuado, la distribución del desempeño no sigue una curva de campana, sino que se inclina desproporcionadamente hacia un desempeño superior. Por lo tanto, las expectativas deben estar sesgadas de manera similar; presumiblemente, la mayoría de las personas obtendrán resultados que se encuentren dentro de un amplio rango de aceptabilidad, y solo unas pocas superarán o no alcanzarán ese rango.

Al eliminar el estigma implícito de inferioridad que se produce inevitablemente cuando la mayoría de los demás reciben una calificación superior, el nuevo sistema ha restablecido la percepción de una relación entre la remuneración y el rendimiento para aquellos cuyo desempeño, de hecho, había sido bastante aceptable. No ha creado un nuevo estigma para los que antes eran calificados como superiores, ya que ellos también preferían que los calificaran en contra de las expectativas de sus puestos de trabajo y no en contra de otros trabajadores en trabajos no necesariamente similares a los suyos.

Hasta ahora, de la experiencia con la cianamida se han extraído dos lecciones principales. En primer lugar, la motivación es más importante que la comodidad administrativa. En segundo lugar, el orgullo profesional puede ser un poderoso motivador y no debe descartarse al tener en cuenta cómo los cambios en los sistemas de evaluación y compensación del desempeño afectarán a la productividad de los trabajadores del conocimiento.