Monatsarchiv: August 2022

Anreize im Arbeitsleben sind wirksam – doch man kann Vieles falsch machen

Anreize wirken. Wenn sie Anreize sind. Sie wirken auf das Verhalten, zu dem sie kontingent vergeben werden. Das ist nicht unbedingt immer das Verhalten, das vom Anreizgeber beabsichtigt wurde.

Auch wenn es gelegentlich geleugnet wird, Anreize wie Geld, Vergünstigungen oder beruflicher Aufstieg können sehr wirksam sein und Menschen dazu motivieren, mehr oder anders zu arbeiten als ohne diesen Anreiz. Das ist auch nicht weiter verwunderlich, denn das ist exakt das, was die Verhaltensanalyse aussagt: Die Konsequenzen des Verhaltens wirken auf diese zurück. Verhalten, das zum Erfolg geführt hat, wird später in ähnlichen Situationen wieder gezeigt – das ist das Effektgesetz nach Thorndike (1927). Doch in der Praxis lauern einige Tücken.

Zunächst einmal muss der Anreiz auch ein Anreiz sein. In der Regel funktioniert Geld als Anreiz sehr gut, einfach deshalb, weil Geld (zumeist) ein sogenannter generalisierter Verstärker ist: Man kann Geld gegen viele Dinge eintauschen, das macht es so attraktiv. Im Gegensatz zu Schokolade kann man von Geld nie genug haben. Doch ob etwas ein Verstärker ist oder nicht, hängt nicht nur von seinem Wert ab. Die Situation, in der ein Anreiz eingesetzt wird (welches Verhalten verstärkt werden soll und wer daran beteiligt ist), bestimmt mit, ob der Anreiz tatsächlich verstärkt, also wirkt: Selbst Geld ist für viele von uns kein Verstärker, wenn wir mit Geld dazu gebracht werden sollen, etwas zu tun, das uns widerstrebt oder wenn die Person, die uns das Geld anbietet, uns unsympathisch ist.

Viele Führungskräfte verkennen diese relationale Qualität (was als Anreiz wirkt, hängt von allen möglichen Begleitumständen ab) und wundern sich, warum die Mitarbeiter sich nicht durch den Anreiz motivieren lassen. Das betrifft nicht nur Geld, sondern auch alle anderen Anreize, die in der Managementliteratur gerne als Motivatoren gehandelt werden: berufliche Entscheidungsfreiheit, Kompetenzerleben, soziale Anerkennung. Sie wirken bei vielen, vielleicht den meisten Beschäftigten, und in vielen Situationen als Anreiz, aber vielleicht nicht auf alle Tätigkeiten oder Aspekte von Tätigkeiten. Bei einer eher „kreativen“ Leistung ist Entscheidungsfreiheit vermutlich oft ein guter Motivator. Bei einer eher mechanischen Tätigkeit eventuell nicht („Sie dürfen sich entscheiden, ob Sie erst die blauen oder erst die roten Teile zusammenschrauben“).

Doch gehen wir mal, grob vereinfachend, davon aus, dass Geld tatsächlich ein Anreiz für die Mitarbeiter ist (zumeist trifft das ja zu). Dann gibt es immer noch ein Problem, das gerne vernachlässigt wird und das dann dazu führt, dass Anreize entweder nicht wirken oder ganz katastrophale Nebenwirkungen haben. Denn, damit die Vergabe eines Anreizes in der beabsichtigten Weise wirkt, muss klar sein, welches Verhalten durch den Anreiz verstärkt werden soll. Verhaltenswissenschaftlich ausgedrückt: Der Anreiz muss kontingent auf ein bestimmtes Verhalten erfolgen. Wird der Anreiz dagegen nicht-kontingent vergeben (der Beschäftigte erhält den Anreiz, gleich welches Verhalten er zeigt), wirkt er auch nicht. Wird er kontingent auf das falsche Verhalten vergeben, so führt das dazu, dass man mehr von dem falschen Verhalten bekommt. Wie Aubrey Daniels (Daniels & Bailey, 2016) es ausdrückt: When you reinforce the wrong behavior, you’ll get more of it.

Ein Beispiel aus dem Bereich der Arbeitssicherheit: Viele Firmen geben Ihren Mitarbeitern Prämien, wenn diese unfallfrei arbeiten. Die Firmen tun dies, weil sie durch Arbeitsunfälle Geld verlieren (u. a. durch Ausfallzeiten), aber auch aufgrund der Sorge um die Gesundheit der Beschäftigten. Arbeitsunfälle resultieren oft aus dem Verhalten der Mitarbeiter. Die Prämie soll bewirken, dass die Mitarbeiter anders, nämlich sicherer arbeiten. Konkret sieht das so aus: Gibt es z. B. in einer Abteilung ein ganzes Jahr lang keinen Arbeitsunfall, erhält jeder Mitarbeiter dieser Abteilung am Ende des Jahres eine Prämie von 1000 Euro. Das funktioniert tatsächlich mehr oder weniger gut. Oft werden in diesen Firmen weniger Arbeitsunfälle berichtet (wobei die Wirkung auf die meldepflichtigen Unfälle geringer sein dürfte als auf die „kleinen“ Unfälle, die nur zu einem Eintrag ins Verbandbuch führen – aus Gründen, die sich dem Leser gleich erschließen). Doch ist dieser Rückgang wenigstens zum Teil darauf zurückzuführen, dass Unfälle verschwiegen werden. Anreizsysteme für „unfallfreies Arbeiten“ führen zum „Under-Reporting“ von Unfällen (Pransky, Snyder, Dembe & Himmelstein, 1999; Probst & Estrada, 2010). Der Anreiz „Geld“ wirkt, jedoch nicht in der beabsichtigten Weise.

Ein Anreizsystem, wie oben beschrieben, verletzt mehrere verhaltensanalytische Prinzipien. Der Anreiz wird zum einen nicht kontingent auf das Verhalten vergeben, dass tatsächlich gefordert ist: Sicherer zu arbeiten. Er wird kontingent auf das Ausbleiben eines Verhaltens, der Meldung eines Unfalls, vergeben. Anekdotische Beobachtungen verdeutlichen die Ergebnisse der oben zitierten Studien: In einer Firma mit einem solchen Prämiensystem berichteten mir die Mitarbeiter einmal, als ein Kollege neulich einen Unfall hatte, hätte ihn der Meister zu seinem Hausarzt gefahren und aufgefordert, nicht zu erzählen, dass das auf der Arbeit passiert sei. Kleinere Unfälle lassen sich leichter verschweigen als größere (daher meine Vermutung, dass die Wirkung des Prämiensystems auf die Erste-Hilfe-Fälle stärker ist als auf meldepflichtige Unfälle, denen in der Regel ein weniger leicht zu verschleierndes Ereignis zugrunde liegt).

Ein weiteres Problem mit diesem Anreizsystem ist der mangelhafte Zusammenhang zwischen dem aktuellen Verhalten und der Prämienvergabe am Ende des Jahres. Selbst wenn ich unterstelle, dass das Anreizsystem die Mitarbeiter motiviert, sicherer arbeiten zu wollen, wird ihnen das nur schwerlich aufgrund des Anreizes gelingen. Unfälle entstehen durch viele kleine Entscheidungen im Arbeitsalltag. Die unmittelbaren Bedingungen und Konsequenzen dieses Verhaltens wirken stärker als die Prämie am Ende des Jahres. Verhaltensanalytisch formuliert: Es mangelt an der Kontiguität von Verhalten (zu einem Zeitpunkt t0 entscheiden, ob ich eine PSA benutze oder nicht) und Konsequenz (zum Zeitpunkt t1 eine Prämie erhalten oder nicht). Und oft ist den Beschäftigten auch gar nicht klar, welche ihrer Handlungen zu dem Ziel, keinen Unfall zu haben, beitragen. Es mangelt also an der Operationalisierung der Verhaltensweisen, die zum Ziel „Unfallfreiheit“ führen.

Es wäre also besser, Anreize unmittelbar für ganz konkretes Verhalten zu vergeben. Beim Akkordlohn funktioniert das recht gut: Je mehr Teile ich produziere, desto mehr Geld bekomme ich. Will man komplexere Tätigkeiten mit Anreizen fördern, wird es etwas komplizierter, es ist aber immer noch machbar, wie die Arbeiten von William Abernathy (Abernathy, 1990, 1996, 2014) zeigen. Doch gibt es viele Fallstricke, die man vermeiden muss, damit die erwünschte Wirkung eintritt. Zumeist haben diese mit den Problemen der Aufrechterhaltung und der Generalisation der Verhaltensänderung zu tun.

Was die Aufrechterhaltung angeht, darf man sich die Vergabe von Anreizen nicht wie eine Art Gehirnoperation vorstellen: Der Mitarbeiter erhält einmalig einen Anreiz und verändert sein Verhalten dann dauerhaft. Menschen passen sich den Bedingungen, unter denen sie sich verhalten, an. Fällt ein Anreiz weg und sind die Bedingungen dann wieder genauso wie zuvor, wird auch das Verhalten wieder genauso wie zuvor auftreten. (Die Befürchtung, Anreize könnten die Motivation der Mitarbeiter dauerhaft beschädigen – also dazu führen, dass sie nach Wegfall des Anreizes nicht genauso viel, sondern dauerhaft weniger tun als vor der Vergabe des Anreizes – ist übrigens ein Mythos (Cameron, Banko & Pierce, 2001), auch wenn dieser von einigen Autoren hartnäckig wiedergekäut wird, siehe hierzu auch diesen Beitrag). Daraus folgt: Entweder man vergibt den Anreiz auf Dauer oder man überlegt sich, wie man den Anreiz wieder wegnehmen kann. In der Verhaltensanalyse bedeutet dies: Der geplante Anreiz soll, wenn das möglich ist, nach und nach durch natürliche Verstärkung (Ferster, 1967) ersetzt werden. Unter natürlicher Verstärkung versteht man die Folgen eines Verhaltens, die dieses aufrechterhalten, ohne dass jemand explizit auf das Verhalten Einfluss nimmt. Bringt man den Mitarbeitern, unterstützt durch ein Anreizsystem, z. B. bei, sich häufiger kundenfreundlich zu verhalten (z. B. Vergason & Gravina, 2020), kann dies dazu führen, dass die Interaktionen zwischen Beschäftigten und Kundinnen allgemein angenehmer verlaufen (z. B., der Kunde bedankt sich öfters beim Mitarbeiter). Das Bedanken des Kunden ist dann ein natürlicher Verstärker, der das kundenfreundliche Verhalten des Mitarbeiters auch ohne Intervention des Betriebes aufrechterhält. Ebenso kann ein verändertes Vorgesetztenverhalten (z. B. mehr auf positive Aspekte des Mitarbeiterverhaltens zu achten und dieses anzuerkennen) als natürlicher Verstärker wirken (wobei man wiederum fragen muss, was als natürlicher Verstärker für das veränderte Vorgesetztenverhalten wirken soll). Leider kann man sich aber nicht darauf verlassen, dass diese natürliche Verstärkung in jedem Fall auch eintritt. Man muss planen und korrigieren, wenn der erwünschte Effekt nicht eintritt.

Mit Generalisation ist gemeint, dass das (initial durch den Anreiz) verändert Verhalten nicht nur in einer bestimmten Situation eintritt und dass nicht nur dieses ganz spezielle Verhalten, sondern auch ähnliche Verhaltensweisen sich verändern. Bei Behavior Based Safety (BBS) werden beispielsweise meist nur wenige Verhaltensweisen der Mitarbeiter beobachtet und verstärkt. Je nach Design des BBS-Systems verändern sich aber auch andere Verhaltensweisen der Mitarbeiter hin zu sicherem Verhalten. Würde diese Generalisation nicht eintreten, wäre die Wirkung von BBS auf die Zahl der Arbeitsunfälle sehr begrenzt. Doch tritt Generalisation nicht automatisch und selbstverständlich ein. Es gibt Faktoren, die die Generalisation behindern (bspw. ein sehr rigides Vorgehen beim Training neuen Verhaltens) und solche, die sie fördern, z. B. ein variantenreicheres Training, oder aber, bei BBS eine stärkere Einbeziehung der Mitarbeiter in die Ausgestaltung des Trainings, insbesondere beim Festlegen von Zielen (siehe auch Stokes & Baer, 1977).

Das Problem mit Anreizen ist weniger, dass sie nicht wirken würden (sie wirken), sondern die Vorstellung, man könne sie im Arbeitsleben wie im Hundetraining als „Leckerli“ einsetzen. – Selbst im Hundetraining gilt es viele Rahmenbedingungen zu beachten, damit das Leckerli auch wirkt (Pryor, 2006). – Oder, wie der bereits zitierte Aubrey Daniels es ausdrückt: Wenn Sie denken, das ist einfach, dann machen Sie etwas falsch.

Literatur

Abernathy, W. B. (1990). Designing and Managing an Organization-Wide Incentive Pay System. W. B. Abernathy and Associates.

Abernathy, W. B. (1996). The sin of wages : where the conventional pay system has led us and how to find a way out. PerfSys Press.

Abernathy, W. B. (2014). Beyond the Skinner Box: The Design and Management of Organization-Wide Performance Systems. Journal of Organizational Behavior Management, 34(4), 235-254. https://doi.org/10.1080/01608061.2014.973631

Cameron, J., Banko, K. M., & Pierce, W. D. (2001). Pervasive negative effects of rewards on intrinsic motivation: The myth continues. The Behavior Analyst, 24(1), 1-44. https://doi.org/10.1007/bf03392017

Daniels, A. C., & Bailey, J. S. (2016). Performance Management: Changing Behavior that Drives Organizational Effectiveness (Fifth edition, revised. ed.). Performance Management Publications.

Ferster, C. B. (1967). Arbitrary and natural reinforcement. The Psychological REcord, 17(3), 341-347.

Pransky, G., Snyder, T., Dembe, A., & Himmelstein, J. A. Y. (1999). Under-reporting of work-related disorders in the workplace: a case study and review of the literature. Ergonomics, 42(1), 171-182. https://doi.org/10.1080/001401399185874

Probst, T. M., & Estrada, A. X. (2010). Accident under-reporting among employees: Testing the moderating influence of psychological safety climate and supervisor enforcement of safety practices. Accident Analysis & Prevention, 42(5), 1438-1444. https://doi.org/10.1016/j.aap.2009.06.027

Pryor, K. (2006). Positiv bestärken – sanft erziehen. Franckh-Kosmos.

Stokes, T. F., & Baer, D. M. (1977). An implicit technology of generalization. Journal of Applied Behavior Analysis, 10(2), 349-367. https://doi.org/10.1901/jaba.1977.10-349

Thorndike, E. L. (1927). The law of effect. The American Journal of Psychology, 39, 212-222. https://doi.org/10.2307/1415413

Vergason, C. M., & Gravina, N. E. (2020). Using a guest- and confederate-delivered token economy to increase employee–guest interactions at a zoo. Journal of Applied Behavior Analysis, 53(1), 422-430. https://doi.org/10.1002/jaba.599

Hinterlasse einen Kommentar

Eingeordnet unter BBS, OBM, Psychologie, Verhaltensanalyse

Der Marshmallow-Test: Kein Beleg für „Selbstkontrolle“

Der Marshmallow-Test von Mischel und anderen (Mischel, 1958; Mischel & Grusec, 1966; Shoda, Mischel & Peake, 1990) soll einen Zusammenhang zwischen der Fähigkeit, im Alter von vier Jahren Selbstkontrolle zu demonstrieren und späterer kognitiver Leistung und dem Schulerfolg belegen. Kinder im Alter von vier Jahren wurden vor die Wahl gestellt, entweder jetzt ein Marshmallow zu essen oder auf das eine Marshmallow zu verzichten und dann später mehrere Marshmallows zu erhalten. Laut Mischel besteht ein starker Zusammenhang zwischen der Bereitschaft, auf das eine Marshmallow sofort zugunsten der mehreren Marshmallows in der Zukunft zu verzichten und den kognitiven Fertigkeiten im Jugendalter. Kinder, die mit vier Jahren solcherart „Selbstkontrolle“ unter Beweis stellen, schneiden im Jugendalter besser in der kognitiven Leistungsfähigkeit und den sozialen Kompetenzen ab, sie erzielen bessere Schulnoten und kommen besser mit Stress und Frustrationen zurecht (Mischel, Shoda & Rodriguez, 1989).

Eine systematische Replikation dieses bekannten Versuchs durch Watts, Duncan und Quan (2018) zeigte, dass dieser Zusammenhang wesentlich schwächer ist, als in der Originalstudie berichtet. Zudem muss man vor allem den familiären Hintergrund der Kinder berücksichtigen. Es scheint eher so zu sein, dass wohlhabende Kinder sowohl den Marshmallow-Test gut bestehen, als auch später allgemein besser abschneiden. Umgangssprachlich formuliert: Reiche Kinder haben gelernt, dass sie jederzeit so viel Marshmallows haben können, wie sie wollen. Da keine Gefahr besteht, müssen sie das eine Marshmallows auch nicht schnell essen und können darauf vertrauen, tatsächlich in der Zukunft mehr Marshmallows zu haben. Wir sehen wieder mal: Konfundierende Variablen sind überall und Prädiktoren sind nicht notwendigerweise Ursachen.

Die Studien stehen in einer Reihe von vielen Versuchen, die Mischel mit Kindern zum Thema Selbstkontrolle durchführte. So untersuchte er schon vor dem berühmten Marshmallow-Test (Shoda et al., 1990) die Selbstkontrolle bei Kindern. Er ließ Kinder zwischen einem weniger beliebten Verstärker, den sie sofort haben konnten und einem attraktiveren Verstärker, für den sie eine Weile warten mussten, wählen. Mischel quantifizierte die Selbstkontrolle über die Zeit, die das Kind in der Lage war zu warten. Das Kind hatte einen Klingelknopf, den es betätigen konnte, wenn es den weniger attraktiven Verstärker haben wollte. Wartete es bis zum Ende der Zeitspanne, erhielt es den attraktiveren Verstärker. Grosch und Neuringer (1981) replizierten Mischels Untersuchungsparadigma mit Tauben. Die Tauben lernten, dass sie einen attraktiveren Verstärker erhalten konnten, wenn sie eine bestimmte Zeitspanne lang warteten. Pickten sie zuvor auf einen Schalter, erhielten sie einen weniger attraktiven Verstärker. Grosch und Neuringer (1981) führten diesen Versuch in verschiedenen Varianten (die auch Mischel verwendet hatte) durch, so unter anderem wenn die Verstärker in der Untersuchungssituation zu sehen waren oder nicht, sie variierten die Wartezeit und die frühere Erfahrung der Tauben mit dem Untersuchungsparadigma. Die Ergebnisse waren in jedem Fall symmetrisch zu den Ergebnissen, die Mischel mit Kindern erzielte.

Mischels Paradigma ist gekennzeichnet durch die mentalistische Vorstellung, es gäbe eine, möglicherweise angeborene, innere Willenskraft, die Menschen voneinander unterscheide. Menschen mit größerer Willensstärke erreichen demnach mehr im Leben. Die Empirie und insbesondere die Replikationsstudie von Watts et al. (2018) zeigt jedoch, dass es eher die Umweltfaktoren sind, die Verhalten, welches wir als ein Ausdruck von Selbstkontrolle betrachten, kontrollieren.

Literatur

Grosch, J., & Neuringer, A. (1981). Self-control in pigeons under the Mischel paradigm. Journal of the Experimental Analysis of Behavior, 35(1), 3-21. https://doi.org/10.1901/jeab.1981.35-3

Mischel, W. (1958). Preference for delayed reinforcement: An experimental study of a cultural observation. Journal of Abnormal Psychology, 56(1), 57-61. https://doi.org/10.1037/h0041895

Mischel, W., & Grusec, J. (1966). Determinants of the rehearsal and transmission of neutral and aversive behaviors. Journal of Personality and Social Psychology, 3(2), 197-205. https://doi.org/10.1037/h0022883

Mischel, W., Shoda, Y., & Rodriguez, M. L. (1989). Delay of gratification in children. Science, 244(4907), 933-938. https://doi.org/10.1126/science.2658056

Shoda, Y., Mischel, W., & Peake, P. K. (1990). Predicting adolescent cognitive and self-regulatory competencies from preschool delay of gratification: Identifying diagnostic conditions. Developmental Psychology, 26(6), 978-986. https://doi.org/10.1037/0012-1649.26.6.978

Watts, T. W., Duncan, G. J., & Quan, H. (2018). Revisiting the marshmallow test: A conceptual replication investigating links between early delay of gratification and later outcomes. Psychological Science, 29(7), 1159-1177. https://doi.org/10.1177/0956797618761661

3 Kommentare

Eingeordnet unter Entwicklung, Psychologie, Verhaltensanalyse