Schlagwort-Archive: Experiment

Der Marshmallow-Test: Kein Beleg für „Selbstkontrolle“

Der Marshmallow-Test von Mischel und anderen (Mischel, 1958; Mischel & Grusec, 1966; Shoda, Mischel & Peake, 1990) soll einen Zusammenhang zwischen der Fähigkeit, im Alter von vier Jahren Selbstkontrolle zu demonstrieren und späterer kognitiver Leistung und dem Schulerfolg belegen. Kinder im Alter von vier Jahren wurden vor die Wahl gestellt, entweder jetzt ein Marshmallow zu essen oder auf das eine Marshmallow zu verzichten und dann später mehrere Marshmallows zu erhalten. Laut Mischel besteht ein starker Zusammenhang zwischen der Bereitschaft, auf das eine Marshmallow sofort zugunsten der mehreren Marshmallows in der Zukunft zu verzichten und den kognitiven Fertigkeiten im Jugendalter. Kinder, die mit vier Jahren solcherart „Selbstkontrolle“ unter Beweis stellen, schneiden im Jugendalter besser in der kognitiven Leistungsfähigkeit und den sozialen Kompetenzen ab, sie erzielen bessere Schulnoten und kommen besser mit Stress und Frustrationen zurecht (Mischel, Shoda & Rodriguez, 1989).

Eine systematische Replikation dieses bekannten Versuchs durch Watts, Duncan und Quan (2018) zeigte, dass dieser Zusammenhang wesentlich schwächer ist, als in der Originalstudie berichtet. Zudem muss man vor allem den familiären Hintergrund der Kinder berücksichtigen. Es scheint eher so zu sein, dass wohlhabende Kinder sowohl den Marshmallow-Test gut bestehen, als auch später allgemein besser abschneiden. Umgangssprachlich formuliert: Reiche Kinder haben gelernt, dass sie jederzeit so viel Marshmallows haben können, wie sie wollen. Da keine Gefahr besteht, müssen sie das eine Marshmallows auch nicht schnell essen und können darauf vertrauen, tatsächlich in der Zukunft mehr Marshmallows zu haben. Wir sehen wieder mal: Konfundierende Variablen sind überall und Prädiktoren sind nicht notwendigerweise Ursachen.

Die Studien stehen in einer Reihe von vielen Versuchen, die Mischel mit Kindern zum Thema Selbstkontrolle durchführte. So untersuchte er schon vor dem berühmten Marshmallow-Test (Shoda et al., 1990) die Selbstkontrolle bei Kindern. Er ließ Kinder zwischen einem weniger beliebten Verstärker, den sie sofort haben konnten und einem attraktiveren Verstärker, für den sie eine Weile warten mussten, wählen. Mischel quantifizierte die Selbstkontrolle über die Zeit, die das Kind in der Lage war zu warten. Das Kind hatte einen Klingelknopf, den es betätigen konnte, wenn es den weniger attraktiven Verstärker haben wollte. Wartete es bis zum Ende der Zeitspanne, erhielt es den attraktiveren Verstärker. Grosch und Neuringer (1981) replizierten Mischels Untersuchungsparadigma mit Tauben. Die Tauben lernten, dass sie einen attraktiveren Verstärker erhalten konnten, wenn sie eine bestimmte Zeitspanne lang warteten. Pickten sie zuvor auf einen Schalter, erhielten sie einen weniger attraktiven Verstärker. Grosch und Neuringer (1981) führten diesen Versuch in verschiedenen Varianten (die auch Mischel verwendet hatte) durch, so unter anderem wenn die Verstärker in der Untersuchungssituation zu sehen waren oder nicht, sie variierten die Wartezeit und die frühere Erfahrung der Tauben mit dem Untersuchungsparadigma. Die Ergebnisse waren in jedem Fall symmetrisch zu den Ergebnissen, die Mischel mit Kindern erzielte.

Mischels Paradigma ist gekennzeichnet durch die mentalistische Vorstellung, es gäbe eine, möglicherweise angeborene, innere Willenskraft, die Menschen voneinander unterscheide. Menschen mit größerer Willensstärke erreichen demnach mehr im Leben. Die Empirie und insbesondere die Replikationsstudie von Watts et al. (2018) zeigt jedoch, dass es eher die Umweltfaktoren sind, die Verhalten, welches wir als ein Ausdruck von Selbstkontrolle betrachten, kontrollieren.

Literatur

Grosch, J., & Neuringer, A. (1981). Self-control in pigeons under the Mischel paradigm. Journal of the Experimental Analysis of Behavior, 35(1), 3-21. https://doi.org/10.1901/jeab.1981.35-3

Mischel, W. (1958). Preference for delayed reinforcement: An experimental study of a cultural observation. Journal of Abnormal Psychology, 56(1), 57-61. https://doi.org/10.1037/h0041895

Mischel, W., & Grusec, J. (1966). Determinants of the rehearsal and transmission of neutral and aversive behaviors. Journal of Personality and Social Psychology, 3(2), 197-205. https://doi.org/10.1037/h0022883

Mischel, W., Shoda, Y., & Rodriguez, M. L. (1989). Delay of gratification in children. Science, 244(4907), 933-938. https://doi.org/10.1126/science.2658056

Shoda, Y., Mischel, W., & Peake, P. K. (1990). Predicting adolescent cognitive and self-regulatory competencies from preschool delay of gratification: Identifying diagnostic conditions. Developmental Psychology, 26(6), 978-986. https://doi.org/10.1037/0012-1649.26.6.978

Watts, T. W., Duncan, G. J., & Quan, H. (2018). Revisiting the marshmallow test: A conceptual replication investigating links between early delay of gratification and later outcomes. Psychological Science, 29(7), 1159-1177. https://doi.org/10.1177/0956797618761661

3 Kommentare

Eingeordnet unter Entwicklung, Psychologie, Verhaltensanalyse

Der Stroop-Effekt aus verhaltensanalytischer Sicht

Der Stroop-Effekt (Stroop, 1935) lässt sich recht einfach demonstrieren (McLeod, 1992). Die Versuchsperson bekommt eine Liste mit Farbwörtern, die jedoch in anderen Farben gedruckt sind (zum Beispiel ist das Wort „Rot“ in der Farbe Blau gedruckt). Bittet man die Versuchsperson, die Wörter vorzulesen, gelingt ihr das wesentlich leichter und schneller als wenn man sie bittet, die Farben der einzelnen Wörter zu benennen. Durch Übung lässt sich die Leistung im Stroop-Test verbessern, der Effekt jedoch nicht gänzlich beseitigen. Die Datenbank PsychInfo listete im Jahr 2015 fast 5000 Publikationen auf, die die ursprüngliche Arbeit von Stroop (1935) zitieren. Der Stroop-Effekt wird zumeist als ein Konflikt zwischen kognitiver Kontrolle und Stimuluskontrolle des Verhaltens beschrieben. Für jedes Farbwort im Stroop-Test gibt es eine leicht auslösbare Reaktion, nämlich das Wort vorzulesen. Die Farben, in denen die Wörter gedruckt sind, sind dagegen mit vielen verschiedenen Verhaltensweisen assoziiert. Die Farbe Braun etwa ist zum einen mit dem Verhalten „Braun“ zu sagen, verbunden, sie ist gleichfalls aber mit Reaktionen wie „Leder“, „Schokolade“, „Holz“, „Kacka“ usw. assoziiert. Wenn man irgendwo die Farbe Braun sieht, sagt man eben nicht unbedingt „Braun“, sondern zumeist etwas anderes. Sieht man dagegen den Schriftzug „Braun“, ist die Reaktion „Braun“ zu sagen, so ziemlich die einzige Reaktion, die zu Verstärkung führt. Der Stroop-Effekt lässt sich sogar bei Schimpansen nachweisen. Beran et al. (2007) untersuchten eine Schimpansin, die verschiedene Lexigramme gelernt hatte unter anderem solche, die Farben bezeichneten. Die Äffin konnte verschiedene Reize nach ihrer Farbe sortieren, machte aber deutlich mehr Fehler, wenn sie als Reize die Lexigramme sortieren sollte, die in inkongruenten Farben vorlagen (zum Beispiel das Lexigram für Gelb in blauer Farbe). Der Stroop-Effekt tritt auch bei anderen Kombinationen auf. Washburn (1994) berichtet von einem Versuch mit Rhesusaffen, die gelernt hatten, die größere von zwei oder mehr arabischen Ziffern zu wählen. Den Affen wurde bspw. eine „4“ und eine „5“ auf einem Bildschirm präsentiert. Berührte der Affe die 5, erhielt er fünf Futterpellets, berührte er die 4, erhielt er nur vier Futterpellets. Auf diese Weise hatten die Affen gelernt, die größere Zahl zu wählen. Die gleichen Tiere lernten auch relativ leicht, anzuzeigen, auf welcher Seite des Bildschirms sich mehr Objekte der gleichen Art befanden (zum Beispiel vier „A“s und fünf „C“s). Wurden ihnen nun statt der Buchstaben arabische Zahlen präsentiert, gelang ihnen die Aufgabe wieder relativ leicht, wenn die höhere Zahl auch häufiger vorkam. War dies jedoch nicht der Fall (handelte es sich z. B. um drei „5“ und zwei „6“), benötigten Sie wesentlich länger und machten mehr Fehler. Dabei zeigt sich (Washburn, 2016), dass dieser Effekt um so ausgeprägter ist, je länger das Erkennen höherer Zahlen geübt worden war (je höher also die Reaktionsstärke für das Antippen der höheren Zahl war). Diese Variante des Stroop-Effekts ließ sich auch bei Menschen demonstrieren. Auch diese benötigten länger, um anzuzeigen, wo sich mehr Zahlsymbole befanden, wenn die höherwertigen Zahlen seltener vorkamen, allerdings machten sie dabei kaum Fehler, vermutlich, weil die Reaktion sprachlich unterstützt, regelgeleitet (z. B. durch stilles Zählen der Zahlen), erfolgte (was den Affen nicht möglich sein dürfte).

Literatur

Beran, M. J., Washburn, D. A., & Rumbaugh, D. M. (2007). A Stroop-like effect in color-naming of color-word lexigrams by a chimpanzee (Pan troglodyte). The Journal of General Psychology, 134(2), 217-228. https://doi.org/10.3200/GENP.134.2.217-228

MacLeod, C. M. (1991). Half a century of research on the Stroop effect: An integrative review. Psychological Bulletin, 109(2), 163-203. https://doi.org/10.1037/0033-2909.109.2.163

Stroop, J. R. (1935). Studies of interference in serial verbal reactions. Journal of Experimental Psychology, 18(6), 643-662. https://doi.org/10.1037/h0054651

Washburn, D. A. (2016). The Stroop effect at 80: The competition between stimulus control and cognitive control. Journal of the Experimental Analysis of Behavior, 105(1), 3-13. https://doi.org/10.1002/jeab.194

Hinterlasse einen Kommentar

Eingeordnet unter Geschichte, Psychologie, Stimuluskontrolle, Verhaltensanalyse

Warum Lob scheinbar nicht wirksam, Bestrafung scheinbar aber wirksam ist

Aus der Verhaltenswissenschaft ist hinreichend bekannt, dass Lob und andere Arten von Belohnungen in den meisten Fällen dazu führen, dass ein Verhalten häufiger gezeigt wird. Die verbreitete Auffassung, Belohnungen würden die sogenannte intrinsische Motivation schmälern, lässt sich nicht aufrechterhalten (Cameron, Banko & Pierce, 2001; Eisenberger & Cameron, 1996). Der Einsatz aversiver Reize führt dagegen zu weniger nachhaltigen Verhaltensänderungen. Dennoch ist in der Öffentlichkeit die Auffassung verbreitet, das Lob und Belohnungen nachteilige Auswirkungen haben können. Eine Person, die gelobt oder belohnt wurde, strenge sich danach nicht mehr so an wie zuvor. Bestrafungstechniken werden dagegen oft als generell wirksamer betrachtet.

Die Regression zur Mitte ist verantwortlich

Eine Ursache für diese unter Laien verbreitete falsche Wahrnehmung dürfte der Effekt der statistischen Regression sein (Kahneman & Tversky, 1973; Tversky & Kahneman, 1974). Statistische Regression tritt dann auf, wenn ein Messwert durch mehrere, zum Teil dem Zufall unterliegende Einflussgrößen verursacht wird. Sie besagt, dass auf einen extrem ausfallenden Messwert höchstwahrscheinlich ein weniger extremer Messwert folgen wird (daher spricht man auch von der Regression zur Mitte). Die Regression fällt umso stärker aus, je extremer der erste Messwert war und je größer die Rolle des Zufalls bei der Messung ist. Gerade bei der Beobachtung von Verhalten spielt der Regressionseffekt eine große Rolle. Die meisten Arten von Verhalten werden durch viele, zum Teil unkontrollierbare Einflussfaktoren determiniert.

Verhalten wird üblicherweise dann gelobt, wenn es in einer bestimmten Weise überdurchschnittlich (gut) war. Bestraft wird Verhalten dann, wenn es unterdurchschnittlich (schlecht) war. Auf einen überdurchschnittlichen Wert folgt wahrscheinlich ein Wert, der wieder näher am arithmetischen Mittel liegt. Ebenso folgt auf einen unterdurchschnittlichen Wert wahrscheinlich ein Wert, der weniger unterdurchschnittlich ist. Die Folge davon ist, laut Schaffner (1985), dass die Person, die das Verhalten einer anderen Person durch Lob oder Bestrafung verändern möchte, für das Loben bestraft wird und für das Bestrafen belohnt wird.

Kahneman und Tversky (1973) berichtet in diesem Zusammenhang von einer Flugschule, die aufgrund verhaltenswissenschaftlicher Erkenntnisse begann, Flugschüler immer dann zu loben, wenn sie eine perfekte Landung hingelegt hatten. Mit der Zeit lehnten die Fluglehrer jedoch diese Praxis ab. Sie stellten fest, dass das Loben des Flugschülers dazu führte, dass dieser beim nächsten Mal eine schlechtere Landung hingelegte.

Ein Versuch zur Verwendung von Lob und Strafe

Schaffner (1985) führte eine Studie durch, bei der die Versuchspersonen einen (hypothetischen) Schüler entweder loben oder bestrafen konnten. Den Versuchspersonen wurde über einen Computermonitor angezeigt, zu welcher Zeit der Schüler die Schule betrat. Den Versuchspersonen wurde mitgeteilt, dass der Schüler bisweilen zu spät in die Schule komme. Sie sollten den Schüler dazu bringen, immer spätestens um 8:30 Uhr in der Schule zu sein. Die Versuchspersonen konnten per Eingabe am Computer den Schüler entweder sehr loben, etwas loben, etwas bestrafen, sehr bestrafen oder gar nicht reagieren. Nach ihrer Eingabe wurde angezeigt, zu welcher Zeit der Schüler am nächsten Tag die Schule betrat. Nun sollten die Versuchspersonen wieder entscheiden, ob sie den Schüler loben, bestrafen oder ignorieren wollten. Nach 15 Durchgängen sollten die Versuchspersonen beurteilen, für wie wirksam sie Lob oder Bestrafung bei der Einflussnahme auf das Verhalten des Schülers hielten. Die Zeiten, zu denen der Schüler die Schule betrat, waren jedoch unabhängig von dem, was die Versuchspersonen taten. In einer Bedingung streuten die Zeiten um einen Mittelwert (8:31 Uhr) herum (mit einer Standardabweichung von 5 Minuten). In einer anderen Bedingung verbesserten sich die Werte des Schülers über die 15 Tage hinweg leicht, jedoch ebenfalls mit einer zuvor programmierten Streuung.

Generell nutzten die Versuchspersonen, bei denen sich das Verhalten des Schülers im Schnitt nicht veränderte, die Bestrafung häufiger als das Lob (55 % zu 45 %). Interessanterweise benutzten die Versuchspersonen über die einzelnen Durchgänge hinweg häufiger das Lob. In den ersten fünf Durchgängen betrug das Verhältnis von Lob zu Bestrafung noch 0,39, in den nächsten fünf Durchgängen 0,66 und in den letzten fünf Durchgängen 0,82. Auch der Anteil von starkem Lob gegenüber leichtem Lob vergrößerte sich. Die Versuchspersonen lobten und bestraften in Abhängigkeit von der Ankunftszeit des Schülers. Im Schnitt wurde starkes Lob dann eingesetzt, wenn der Schüler um 8:25 Uhr die Schule betrat, starke Bestrafung wurde dann angewendet, wenn der Schüler erst um 8:35 Uhr die Schule betrat.

Im Gegensatz zum Verhalten der Versuchspersonen (die zunehmend mehr lobten) steht die Einschätzung der Versuchspersonen, wie wirksam Lob und Bestrafung waren. 32,5 % der Versuchspersonen meinten, dass Lob das Gegenteil von dem bewirke, was beabsichtigt sei. Dagegen wurde von 25,9 % der Versuchspersonen Bestrafung als sehr wirksam bezeichnet. Nur 9 % der Versuchspersonen meinten (richtigerweise) dass sowohl Lob als auch Bestrafung unwirksam sein.

Unter der Bedingung, dass das Verhalten des Schülers sich nach und nach leicht besserte, fielen sowohl das Verhalten als auch die Einschätzungen der Versuchspersonen nicht wesentlich anders aus. Im Gegenteil, die Einschätzung, dass Lob unwirksam bis schädlich sei und dass Bestrafung wirksam sei, war hier noch ausgeprägter.

Eine Replikation des Versuchs

Ich (2020) habe die Studie von Schaffner (1985) mit Studierenden der Sozialen Arbeit (N=226) repliziert. Dabei zeigte sich, dass die Versuchspersonen beim ersten Schüler (dessen Verhalten sich nicht veränderte, wobei die Ankunftszeiten mit einer Standardabweichung von 5 Minuten um den Mittelwert 8:30 Uhr streuten) über die 15 Durchgängen hinweg zunehmend mehr straften (vgl. Abb. 1). Dies bestätigt die Vermutung, dass Menschen zunehmend weniger loben und mehr strafen, wenn Verhalten frei variiert. Nur 10 % bis 12 % der Studierenden erkannten, dass Ihre Reaktionen (ob sie den Schüler lobten oder ermahnten) keine Auswirkungen auf das Verhalten des Schülers hatte. Sowohl Lob als Ermahnung wurden überwiegend als wenig effektiv eingeschätzt.

Beim zweiten Schüler, der (mit ähnlicher Streuung) zunehmend pünktlicher kam, setzten die Studierenden über die 15 Durchgänge hinweg mehr Lob ein (vgl. Abb. 2). Sowohl Lob als auch Ermahnung wurden hier als wirksamer erlebt als beim ersten Schüler.

Die Ergebnisse unterscheiden sich von Schaffner (1985). Dies mag damit zusammenhängen, dass es sich bei den Versuchspersonen der Replikationsstudie um Studierende handelte, die zuvor bereits Lehrveranstaltungen besucht hatten, die die differentielle Wirksamkeit von positiver Verstärkung und Bestrafung behandelten.

Literatur

Cameron, J.; Banko, K. & Pierce, W. D. (2001). Pervasive negative effects of rewards on intrinsic motivation. The Behavior Analyst, 24(1), 1-44.
Eisenberger, R. & Cameron, J. (1996). Detrimental effects of reward: Reality or myth? American Psychologist, 51(11), 1153-1166.
Kahneman, D. & Tversky, A. (1973). On the psychology of prediction. Psychological Review, 80(4), 237-251.
Schaffner, P. E. (1985). Specious learning about reward and punishment. Journal of Personality and Social Psychology, 48(6), 1377-1386.
Tversky, A. & Kahneman, D. (1974). Judgements under uncertainty. Heuristics and biases. Science, 185, 1124-1131.

Hinterlasse einen Kommentar

Eingeordnet unter Verhaltensanalyse, Verstärkung

Experimente und die Beobachtung von Verhalten stehen in der Psychologie nicht hoch im Kurs

Baumeister et al. (2007) nahmen das von der APA (American Psychological Association) ausgerufene Jahrzehnt des Verhaltens zum Anlass, nachzusehen, inwiefern in psychologischen Studien überhaupt noch wirkliches, echtes Verhalten untersucht wird. In einigen Subdisziplinen ist dies tatsächlich der Fall. Jedoch in zwei sehr zentralen Teildisziplinen der Psychologie, der Sozialpsychologie und der Persönlichkeitspsychologie, wird heutzutage so gut wie gar kein tatsächliches Verhalten mehr untersucht. Beide Disziplinen erheben ihre Daten überwiegend über Fragebögen. Manchmal wird noch die Reaktionszeit erfasst. Die Neuropsychologen haben sich noch nie besonders für das Verhalten direkt interessiert, sondern lediglich für das Verhalten von Neuronen. Dass dieses etwas mit dem tatsächlichen Verhalten zu tun hat, wird schlichtweg vorausgesetzt. Baumeister et al. (2007) untersuchten eine beliebige Ausgabe des Journal of Personality and Social Psychology – des vermutlich prestigeträchtigsten Journals für diese Teildisziplinen der Psychologie. Sie tun sich schwer, hier irgendetwas von Verhalten zu entdecken. Das Verhalten in den dort berichteten Studien wird zumeist in sitzender Position ausgeführt, zumeist vor einem Computer. Fingerbewegungen in der Form von Tastenanschlägen oder Markierungen mit einem Bleistift auf Papier stellen die große Mehrheit menschlichen Verhaltens, das in diesen Studien berichtet wird, dar. Manchmal berichten die Versuchspersonen in diesen Fragebögen darüber, was sie getan haben, was sie tun werden oder tun würden. Zumeist aber werden die Versuchspersonen nur danach gefragt, was sie denken, was sie fühlen oder warum sie tun was sie tun. D. h., in den meisten Studien zur Persönlichkeitspsychologie und Sozialpsychologie geht es um Selbstberichte über innere Zustände.

Nisbett und Wilson (1977) nahmen an, dass sie die Introspektion endgültig diskreditiert hatten, als sie nachwiesen, wie wenig das, was in introspektiv berichtet wird, mit tatsächlichem Verhalten zu tun hat. Keine einzige der 38 Studien, die in der Heftnummer, die Baumeister et al. (2007) untersuchten, berichtet werden, beinhaltete die direkte Beobachtung von Verhalten. Die abhängigen Variablen waren fast ausschließlich Ratings, entweder auf Papierfragebögen oder gegenüber auf dem Computer präsentierten Stimuli. Die Ratings bezogen sich zumeist auf introspektive Selbstberichte. Um zu überprüfen, ob es sich schon immer so verhalten hat, untersuchten die Autoren frühere Nummern der gleichen Zeitschrift. Dabei zeigt sich, dass es bis in die siebziger Jahre noch einen erklecklichen Anteil an Artikeln gab, in denen über richtiges Verhalten berichtet wurde. Erst mit Beginn der Achtzigerjahre sank dieser Anteil auf unter 20 % bis unter 10 %. Der Fragebogen als allein seligmachende Methode der Persönlichkeitspsychologie setzte sich immer mehr durch. Erschwerend kommt hinzu, dass die hauptsächliche Methode, um persönlichkeitspsychologische Fragebögen zu validieren, die Korrelation mit anderen Fragebögen ist (nicht aber mit tatsächlichem Verhalten).

Tatsächlich ist es in einigen Fällen ethisch nicht vertretbar, tatsächliches Verhalten zu untersuchen. Jedoch sind diese Fälle relativ selten. Dies kann also nicht der Grund sein, warum Psychologen immer seltener Verhalten untersuchen. Der hauptsächliche Grund, aus Sicht der Autoren, liegt darin, dass Studien, in denen Verhalten beobachtet wird, wesentlich aufwendiger sind als Studien, in denen lediglich Fragebögen verteilt werden. Für den Mehraufwand, der mit solchen Studien verbunden ist, gibt es keinerlei Anreize, im Gegenteil, die Forscher müssen mit Schwierigkeiten rechnen. Der Zeitpunkt, zu dem das Verhalten zunehmend weniger in Studien berücksichtigt wurde, der Beginn der achtziger Jahre, ist zum einen mit dem Aufschwung der kognitiven Psychologie verbunden. Zum anderen aber war dies der Zeitpunkt, in dem Ethikkommissionen immer wichtiger wurden für die Durchführung von Studien. Hinzu kommt die Einstellung der Herausgeber der Fachzeitschriften. Einer der Autoren versuchte kürzlich eine Studie in einer Fachzeitschrift zu veröffentlichen, in der er nur Verhaltensdaten berichtete, ohne sich auf innere Prozesse zu beziehen. Das Manuskript wurde abgelehnt mit der Begründung, er würde „keine psychologischen Variablen“ berücksichtigen. Dagegen ist es problemlos möglich, in Studien lediglich von inneren Prozessen zu berichten, ohne sich auf Verhalten zu beziehen.

Es ist jedoch gefährlich, sich allein auf Fragebogendaten zu beziehen, wenn man etwas über das tatsächliche Leben erfahren möchte. Ein Beispiel dafür ist eine Studie von West und Brown (1975). Diese befragten ihre Versuchspersonen, ob sie einer Person helfen würden, die aufgrund eines Unfalls Geld benötigen würde, um sich medizinisch behandeln zu lassen. In den Fragebögen gaben die Versuchspersonen an, recht großzügig Geld zu geben und dass die Attraktivität der Person, die da fragt, keinen Einfluss auf ihre Spendenbereitschaft habe. Zugleich konfrontierten die Autoren die Versuchspersonen mit einer inszenierten Situation, in der die Versuchspersonen tatsächlich um Geld gebeten wurden. Die tatsächlichen Spenden betrugen im Mittel zehn Cent und es gab eine klare Abhängigkeit zwischen der Attraktivität des Opfers und der Hilfsbereitschaft der Versuchspersonen. Viele weitere Studien zeigen systematisch, wie unzutreffend die Aussagen von Versuchspersonen über ihr Verhalten sind. Während der sechziger und siebziger Jahre wurden sowohl Persönlichkeitseigenschaften als auch Einstellungen in der Psychologie kritisch hinterfragt. Mischel (1968) attackierte die Persönlichkeitspsychologie und ihre Messung von Persönlichkeitseigenschaften aufgrund der geringen Korrelation zwischen den Fragebogenergebnissen und dem tatsächlichen Verhalten der Versuchspersonen. Heutzutage wird in den Artikeln, die sich mit der Konsistenz zwischen Einstellungen und Verhalten beschäftigen, noch nicht einmal mehr tatsächliches Verhalten berichtet. Das erscheint etwas widersinnig. Sozialpsychologen können schwerlich behaupten, dass die Persönlichkeit das Verhalten voraussagt wenn sie mit Verhalten gar nicht mal wirkliches Verhalten meinen. Dies ist für Außenstehende schwer nachvollziehbar. Die interessantesten Experimente der Sozialpsychologie fanden in den fünfziger und sechziger Jahren statt, als man noch tatsächliches Verhalten untersucht. Dies sind auch nach wie vor die wichtigsten Experimente, über die in einführenden Lehrbüchern berichtet wird. Alles in allem befürchten die Autoren, dass sich das von der APA ausgerufene Jahrzehnt des Verhaltens als eine Lachnummer erweisen wird.

Baumeister, R. F., Vohs, K. D., & Funder, D. C. (2007). Psychology as the science of self-reports and finger movements: Whatever happened to actual behavior? Perspectives on Psychological Science, 2(4), 396-403. https://doi.org/10.1111/j.1745-6916.2007.00051.x

Mischel, W. (1968). Personality and assessment. New York: Wiley.
Nisbett, R. E., & Wilson, T. D. (1977). Telling more than we can know: Verbal reports on mental processes. Psychological Review, 84(3), 231-259. doi:10.1037/0033-295X.84.3.231
West, S. G., & Jan Brown, T. (1975). Physical attractiveness, the severity of the emergency and helping: A field experiment and interpersonal simulation. Journal of Experimental Social Psychology, 11(6), 531-538. doi:https://doi.org/10.1016/0022-1031(75)90004-9

Ein Kommentar

Eingeordnet unter Kritik, Psychologie

Warum interessieren uns schlechte Nachrichten?

Kurze Antwort: Weil sie besseren Nachrichten vorausgehen.

Verhaltensanalytiker verstehen unter „Verhalten“ nicht nur offenes Verhalten wie das Gehen oder Sprechen, sondern auch verdecktes Verhalten wie das Denken und Fühlen und sogenanntes subtiles Verhalten wie das Beobachten. „Sehen“ ist nach Skinner ein Verhalten. Wenn aber das Beobachten ein Verhalten ist, dann fragt sich, warum es auftritt und beibehalten wird. Nach verhaltensanalytischer Auffassung wird kein Verhalten aufrechterhalten, das nicht wenigstens ab und an verstärkt wird. Was also erhält das Beobachten aufrecht? Anders formuliert: Was hat das Individuum davon, wenn es beobachtet?

Auf diese Frage gibt es zwei mögliche Antworten und entsprechende, daraus abgeleitete Hypothesen. Die Hypothese der konditionierten Verstärkung geht davon aus, dass das Beobachten wenigstens ab und an verstärkt wird, sodass es beibehalten wird. Die Objekte (Stimuli), die das Individuum beobachtet, sind demnach konditionierte Verstärker. Ein konditionierter Verstärker ist etwas anderes als ein primärer Verstärker. Ein primärer Verstärker ist ein Ereignis (z. B. die Gabe von Futter, eine angemessene Raumtemperatur oder Zugang zu einem Sexualpartner), das, ohne dass das Individuum das gelernt hat, ein Verhalten verstärken kann (dazu führt, dass das Verhalten, dem es folgt, häufiger auftritt). Konditionierte Verstärker sind Ereignisse, die – vereinfacht ausgedrückt – mit primären Verstärkern gemeinsam auftreten. Durch diese „Kontiguität“ werden auch ursprünglich bedeutungslose Ereignisse zu Verstärkern – konditionierten Verstärkern.

Eine andere Antwort auf die oben gestellte Frage gibt die „Informationshypothese“. Demnach sind die Stimuli, die beobachtet werden, keine konditionierten Verstärker, sondern Hinweise, die dem Individuum Aufschluss darüber geben, ob der Zugang zu einem Verstärker möglich ist oder nicht. Das Individuum beobachtet nicht, weil dieses Verhalten durch eine damit in Verbindung stehende Konsequenz verstärkt wird, sondern weil die Reduktion von Unsicherheit der Zweck dieses Verhalten ist.

Diese beiden Hypothesen haben unterschiedliche Konsequenzen. Wenn die Stimuli, die das Individuum beobachtet, konditionierte Verstärker sind, dann sollten Beobachter gute Nachrichten (die mit Verstärkung in Verbindung stehen) und neutrale Nachrichten (die in keiner Beziehung zu Verstärkung stehen) schlechten Nachrichten (die mit Verstärkung negativ korrelieren) vorziehen. Vereinfacht ausgedrückt sollte man lieber gute und neutrale Nachrichten hören wollen, weil diese angenehmer sind als schlechte Nachrichten. Die Informationshypothese dagegen sagt voraus, dass es diesen Unterschied nicht gibt.

Im Alltag kann man diese Hypothesen so natürlich nicht testen. Bekanntlich hören Menschen voller Interesse auch (und besonders) die schlechten Nachrichten, wie etwa Katastrophenmeldungen und Klatsch über den ehelichen Zwist von Freunden. Doch auch diese schlechten Nachrichten sind mit Verstärkung verbunden, denn man kann sie z. B. weitererzählen und damit Aufmerksamkeit erlangen. Klärung kann also nur ein Laborexperiment schaffen.

Der kritische Test muss folgende Frage beantworten: Wirken schlechte Nachrichten (also Stimuli, die die Abwesenheit von Verstärkung ankündigen) als Verstärker oder nicht? Man kann diese Frage im Laborexperiment mit Ratten oder Tauben klären. Dabei stellt man regelmäßig fest, dass sich die Versuchstiere lieber den neutralen Reizen (die in keiner Beziehung zu einer möglichen Verstärkung stehen) und den guten Nachrichten (Reizen, die eine mögliche Verstärkung ankündigen) zuwenden als den schlechten Nachrichten (Reizen, die die Abwesenheit von Verstärkung ankündigen). Schlechte Nachrichten wirken also nicht als Verstärker.

Gegen diese Experimente wird nun eingewendet, dass sie nicht auf Menschen übertragbar sind. Menschen haben eventuell ein besonderes Bedürfnis nach der Reduktion von Ungewissheit, welches sie auch für schlechte Nachrichten empfänglich macht. Die Gestaltung der Versuchsbedingungen ist bei Menschen etwas schwieriger, aber nicht unmöglich. Doch auch hier zeigte sich, dass gute und neutrale Neuigkeiten den schlechten Neuigkeiten vorgezogen werden.

Lieberman und Kollegen (1997) wenden ein, dass dieses Ergebnis womöglich auf eine Art Aberglaube bei den Versuchspersonen zurückzuführen ist. Die neutralen Informationen stehen in keiner funktionalen Beziehung zu einer anschließenden Verstärkung. Dies bedeutet, dass dennoch ab und an zufälligerweise Verstärkung folgt, nachdem die Versuchsperson sich der neutralen Information zugewendet hat. Dies könnte, ähnlich wie bei Skinners (1948) Experiment mit den abergläubischen Tauben, dazu führen, dass sich die Versuchspersonen öfter den neutralen Informationen zuwenden, auch wenn dieses Sich-Zuwenden (Beobachten) nicht in einer funktionalen Beziehung zum Eintreten der Verstärkung steht. Tatsächlich glaubte jedoch keine Versuchsperson, dass ihre Wahl, welche Information sie sehen möchte, einen Einfluss auf das Eintreten der Verstärkung hatte.

Lieberman und Kollegen (1997) führten daher Versuche durch, bei denen sie den Einfluss dieses vermuteten Aberglaubens möglichst ausschließen wollten. Insbesondere wurden die Versuchspersonen darauf hingewiesen, dass die Wahl, welche Information sie sehen wollten, keinen Einfluss auf das Eintreten der Verstärkung hatte. Nun zeigte sich, dass es keinen Unterschied mehr zwischen dem Beobachten guter, neutraler oder schlechter Neuigkeiten gab.

Allerdings berücksichtigten Lieberman und Kollegen (1997) nicht, dass gute und schlechte Neuigkeiten nicht immer und in jedem Fall Verstärkung (oder die Abwesenheit von Verstärkung) ankündigen. Die Wahrscheinlichkeit, mit der diese Neuigkeiten Verstärkung ankündigen, ist entscheidend. Fantino und Silberberg (2010) führten daher eine Reihe von Experimenten durch, die diesen Einfluss der intermittierenden Verstärkung berücksichtigten.

Unter der Bedingung der kontinuierlichen Verstärkung zeigte sich, dass die Versuchspersonen sowohl gute Neuigkeiten als auch keine Neuigkeiten schlechten Neuigkeiten vorzogen. Schlechte Neuigkeiten wurden nur dann gewählt, wenn daraufhin regelmäßig ein Hinweis kam, dass gute Neuigkeiten gewählt werden können (wenn also die schlechten Nachrichten gute Nachrichten zuverlässig ankündigten). Wenn das nicht regelmäßig der Fall war, dann waren die Ergebnisse uneinheitlich.

Alles in allem bestätigen die Ergebnisse von Fantino und Silberberg (2010) die Hypothese der konditionierten Verstärkung auch für menschliche Versuchspersonen. Das heißt: Wir beobachten, weil das Beobachten dazu führt, dass unser Verhalten verstärkt wird, nicht, weil wir damit ein Bedürfnis nach Unbestimmtheitsreduktion befriedigen. Tatsächlich passt zu diesen Ergebnissen aber auch die schwache Variante der „Informationshypothese“ von Lieberman et al. Demnach werden (insbesondere schlechte) Neuigkeiten nur dann beobachtet, wenn sie „nützlich“ sind. Diese Variante ist jedoch in ihren Konsequenzen praktisch gar nicht mehr von der Hypothese der konditionierten Verstärkung unterscheidbar. Sie ist lediglich eine andere (mentalistische) Formulierung derselben Zusammenhänge.

Literatur

Fantino, E., & Silberberg, A. (2010). Revisiting the role of bad news in maintaining human observing behavior. Journal of the Experimental Analysis of Behavior, 93(2), 157-170. doi:10.1901/jeab.2010.93-157

Lieberman, D. A.; Cathro, J. S.; Nichol, K. & Watson, E. (1997). The role of S- in human observing behavior. Bad news is sometimes better than no news. Learning and Motivation, 28, 20-42.

2 Kommentare

Eingeordnet unter Psychologie, Verhaltensanalyse, Verstärkung

Feedback: Es richtig entgegen zu nehmen, hilft allen

Feedback ist eine weit verbreitete Methode, um auf das Verhalten von Mitarbeitern am Arbeitsplatz einzuwirken. Wenn man Feedback richtig einsetzt, kann dieses sehr wirksam sein (Alvero, Bucklin & Austin, 2001; Gravina et al., 2018). Insbesondere das Feedback, das ein Vorgesetzter unmittelbar und mündlich seinem Mitarbeiter gibt, ist weit verbreitet und wird in Studien oft untersucht. Dies betrifft vor allem korrektives Feedback. Positives Feedback wird oft öffentlich oder auch in Bezug auf Gruppen von Mitarbeitern gegeben. Zahlreiche Studien befassen sich damit, wie man Feedback richtig einsetzt, sodass es sich positive auf die Leistung der Feedbackempfänger auswirkt.

Ehrlich, Nosik, Carr und Wine (2020) gingen der Frage nach, wie sich das Verhalten des Mitarbeiters, also des Feedbackempfängers, auf die Wirksamkeit des Feedbacks auswirkt. Mitarbeiter reagieren oft defensiv, wenn sie korrektives Feedback empfangen. Sie führen z. B. ihre Defizite oft auf nicht von ihnen kontrollierbare Faktoren zurück oder greifen andere Personen oder gar den Feedbackgeber an. Diese negativen Reaktionen des Feedbackempfängers wirken wiederum als Strafreize auf den Vorgesetzten, der das Feedback übermittelt. Dies ist auch der Grund, weswegen wir selbst als Vorgesetzte ungern korrektives Feedback geben (wir wollen vermeiden, mit den negativen Reaktionen des Mitarbeiters konfrontiert zu werden) und weswegen generell korrektives Feedback vermieden wird (dies gilt natürlich nur im allgemeinen und nicht für jeden Vorgesetzten und jeden Mitarbeiter). Matey, Gravina, Rajagopal und Betz (2019) fanden etwa, dass die Teilnehmer ihrer Studie, die das Verhalten einer anderen Person beobachten sollten, weniger genau und akkurat beobachteten, wenn sie der entsprechenden Person auch Feedback geben sollten.

In der üblichen Managementliteratur gibt es nur wenige Hinweise darauf, wie man als Feedbackempfänger sein Verhalten verändern kann, so dass man selbst und derjenige, der einem das Feedback übermittelt, mit der Situation gut zurechtkommen und dass man vom Feedback tatsächlich auch profitiert. Einige Autoren geben Hinweise, ohne sich dabei auf empirische Belege stützen zu können. So wird geraten, nicht zu streiten, aktiv zuzuhören, das Feedback ohne Emotionen entgegenzunehmen usw. Ehrlich et al. (2020) entwickelten auf dieser Grundlage und aufgrund von Interviews mit Experten im Bereich der Verhaltensanalyse und der Unternehmensführung (Praktikern und Wissenschaftlern) eine Task Analysis, in der acht Verhaltensweisen beschrieben und erläutert werden, die man zeigen sollte, wenn man korrektives Feedback empfängt. Unter anderem gehört zu dieser Aufgabenbeschreibung, dass man zum Feedbacktreffen vorbereitet erscheint (z. B. mit Schreibmaterial), dass man Augenkontakt zum Feedbackgeber aufnimmt, dass man angemessene Nachfragen stellt, dass man das korrektive Feedback anerkennt, aktives Zuhören demonstriert, über Möglichkeiten der Verbesserung spricht und sich für das Feedback authentisch bedankt. Zu dieser Task Analysis entwickelten Ehrlich et al. (2020) noch eine Checkliste, die sie später bei den Beobachtungen des Mitarbeiterverhaltens verwendeten und bei der Punkte für unterschiedliche Ausführungen des geforderten Verhaltens vergeben wurden.

In ihrer Studie testeten Ehrlich et al. (2020), ob sich diese Verhaltensweisen trainieren lassen und ob sich das Befolgen dieser Verhaltensweisen auf die Qualität der Arbeit auswirkt. Ihre Versuchspersonen waren drei jüngere Mitarbeiterinnen einer kleinen Firma. Diese arbeiteten in der Kundenbetreuung und kommunizierten mit den Kunden über Telefon oder E-Mail. Die Mitarbeiterinnen waren zwei bis sechs Monate vor Beginn der Studie im Schreiben angemessener E-Mails trainiert worden. Es gab eine Checkliste, was die Mitarbeiterinnen beim Verfassen der E-Mail alles beachten sollten. Diese Checkliste diente später dazu, die Leistung der Mitarbeiterinnen in Abhängigkeit vom Feedback zu messen. An jedem zweiten Werktag traf sich die Versuchsleiterin (Rachel Ehrlich) mit jeder Mitarbeiterin einzelnen für eine Feedbacksitzung. Als Grundlage für dieses Treffen hatte die Versuchsleiterin zuvor mehrere ausgewählte E-Mails der Mitarbeiterin ausgewertet. Die Sitzung begann immer mit einer positiven Feststellung bezüglich der E-Mails, gefolgt von mehreren korrektiven Hinweisen. Bewusst wurde auch nur vages korrektives Feedback (in der Art wie „Mir gefiel nicht, wie Sie auf die Anfrage des Kunden reagiert haben“) gegeben, um der Mitarbeiterin so Gelegenheit zu Nachfragen zu geben. Die Versuchsleiterin promptete zudem das Verhalten des aktiven Zuhörens bei der Mitarbeiterin durch Fragen wie „Verstehen Sie was ich meine?“. Diese Feedbacksitzungen wurden, natürlich mit Einverständnis der Mitarbeiterin, auf Video aufgezeichnet und anschließend durch die Versuchsleiterin und den Zweitautor der Studie ausgewertet.

Zunächst wurde über mehrere Sitzungen die Basisrate des Verhaltens der Mitarbeiterinnen in den Feedbacksitzungen erfasst. Die Mitarbeiterinnen zeigten im Schnitt (von Mitarbeiterin zu Mitarbeiterin in unterschiedlichem Ausmaß) 40-75 % der geforderten Verhaltensweisen. Anschließend fand für jede Mitarbeiterin einzeln (zeitversetzt, da ein multiples Basisratendesign verwendet wurde) ein verhaltensorientiertes Fertigkeitstraining (Behavioral Skills Training, BST) statt. Hier wurden der Mitarbeiterin der Sinn des Trainings, die Inhalte der Task Analysis und weitere Hintergründe erklärt. Anschließend sah sich die Mitarbeiterin Videos eines Modellrollenspiels an, in dem eine Mitarbeiterin korrektives Feedback empfing. Die Mitarbeiterin (also die Versuchsperson) sollte nun die Checkliste verwenden, um das Verhalten der Mitarbeiterin im Video zu bewerten. In einem weiteren Schritt führten die Versuchsleiterin und die Mitarbeiterin selbst ein Rollenspiel zu einer Feedbacksitzung durch, wobei die Mitarbeiterin positives und korrektives Feedback bezüglich der Verhaltensweisen der Task Analysis erhielt. Durch diese Intervention verbesserte sich bei allen Mitarbeiterinnen der Anteil korrekt gezeigter Verhaltensweisen während der weiteren Feedbacksitzungen deutlich (je nach Mitarbeiterin auf im Schnitt 78-82 %). Auch bei späteren Beobachtungen in Feedbacksitzungen konnten die Mitarbeiterinnen das veränderte Verhalten beibehalten. Die Qualität der E-Mails der Mitarbeiterinnen verbesserte sich aufgrund der Intervention von (je nach Mitarbeiterin) 73-78 % auf 82-87 %. Die Mitarbeiterinnen berichteten übereinstimmend, dass sie das Training als hilfreich und infolgedessen auch die Feedbacksitzungen als angenehmer empfanden.

Dies ist vermutlich die erste Studie, bei der das Verhalten des Feedbackempfängers im Fokus stand. Natürlich gehören zum Feedback immer zwei Personen: der Feedbackgeber und der Feedbackempfänger. Auf beiden Seiten können Fehler gemacht werden. Die Studie von Ehrlich et al. (2020) sollte nicht so missverstanden werden, dass Mitarbeiter hier, unabhängig von der Qualität des Feedbacks und des Verhaltens des Feedbackgebers, zu einer unbedingten Akzeptanz des Feedbacks erzogen werden sollen. Viele von uns kennen sowohl die Rolle des Mitarbeiters und Feedbackempfängers als auch die Rolle des Vorgesetzten und Feedbackgebers und können sich in beide hineindenken. Die Untersuchung von Ehrlich et al. (2020) ist nur eine erste Pilotstudie. Doch lässt sich die von ihnen erarbeitete Task Analysis und Checkliste sicherlich gut für weitere Forschungen zu diesem Thema verwenden.

Literatur

Alvero, A. M.; Bucklin, B. R. & Austin, J. (2001). An objective review of the effectiveness and essential characteristics of performance feedback in organizational settings (1985 – 1998). Journal of Organizational Behavior Management, 21(1), 3-29. https://doi.org/10.1300/J075v21n01_02

Ehrlich, R. J.; Nosik, M. R.; Carr, J. E. & Wine, B. (2020). Teaching employees how to receive feedback: A preliminary investigation. Journal of Organizational Behavior Management, 1-11. https://doi.org/10.1080/01608061.2020.1746470

Gravina, N.; Villacorta, J.; Albert, K.; Clark, R.; Curry, S. & Wilder, D. (2018). A literature review of organizational behavior management interventions in human service settings from 1990 to 2016. Journal of Organizational Behavior Management, 38(2-3), 191-224. https://doi.org/10.1080/01608061.2018.1454872

Matey, N.; Gravina, N.; Rajagopal, S. & Betz, A. (2019). Effects of feedback delivery requirements on accuracy of observations. Journal of Organizational Behavior Management, 39(3-4), 247-256. https://doi.org/10.1080/01608061.2019.1666773

 

Hinterlasse einen Kommentar

Eingeordnet unter OBM, Verhaltensanalyse

Leistungsstarke und leistungschwache Mitarbeiter profitieren von objektivem und vergleichendem Feedback in unterschiedlicher Weise

Feedback ist generell eine sehr wirksame Strategie, um Verhaltensänderungen zu ermöglichen (Alvero, Bucklin & Austin, 2001; Balcazar, Shupert, Daniels, Mawhinney & Hopkins, 1989). Dabei muss man jedoch zwischen dem objektiven Feedback und dem sozialen Vergleichsfeedback unterscheiden. Objektives Feedback beinhaltet objektive Informationen über die Leistung eines Individuums oder einer Gruppe im Vergleich zu der früheren Leistung dieses Individuums oder dieser Gruppe. Soziales Vergleichsfeedback vergleicht die Leistung eines Individuums oder einer Gruppe mit der von anderen Individuen oder Gruppen. Im ersten Fall ist das Feedback also unabhängig davon, wie andere Individuen oder Gruppen abgeschnitten haben, im zweiten Fall hängt die Qualität des Feedbacks nicht nur an der Leistung des Feedbacksempfängers, sondern auch davon ab, welche Leistung andere Individuen oder Gruppen erbracht haben. In den beiden, schon etwas älteren Überblicksartikeln zur Wirkung von Feedback (Alvero et al., 2001; Balcazar et al., 1989) hatten beide Formen von Feedback in etwa die gleiche Auswirkung auf das Verhalten der Feedbackempfänger. Doch muss man bedenken, dass Feedback äußerst selten alleine daherkommt, zumeist wird es kombiniert mit Lob oder Kritik. Insbesondere die Kombination mit Lob kann aus positivem Feedback einen wirksamen, konditionierten Verstärker machen. Die Kombination mit Kritik kann aus negativem Feedback dagegen einen konditionierten Strafreiz machen. Man vermutet zudem, dass leistungsstarke Mitarbeiter besser auf soziales Vergleichsfeedback ansprechen, wohingegen leistungsschwächeren Mitarbeiter von objektivem Feedback profitieren.

Moon, Lee, Lee und Oah (2017) untersuchten in einer Studie mit 150 Studierenden die Auswirkung von objektivem und sozialem Vergleichsfeedback auf die Leistung der Versuchspersonen in einer Dateneingabeaufgabe. Zunächst sollten die Versuchspersonen 20 Minuten langen Überweisungsdaten in den Computer eingeben. Im Anschluss an diesen Vortest wurden die Versuchspersonen aufgrund ihrer erbrachten Leistung in Gruppen eingeteilt. Die oberen 40 % der Versuchspersonen (in Bezug auf ihre Leistung) und die unteren 40 % der Versuchspersonen nahmen weiter teil, die mittleren 20 % schieden aus der weiteren Untersuchung aus. Diese 60 leistungsstärksten und 60 leistungsschwächsten Versuchspersonen wurden nun wiederum jeweils einer von zwei Gruppen zugeteilt. Der eine Teil der Versuchspersonen erhielt im folgenden objektives Feedback zu seiner Leistung, der andere Teil der Versuchspersonen soziales Vergleichsfeedback. Die Versuchspersonen nahmen drei Tage später an drei weiteren Sitzungen teil, die jeweils von zehn Minuten Pause unterbrochen waren. Zu Beginn jeder Sitzung erhielten die Versuchspersonen Feedback über ihre Leistung in der vorhergehenden Sitzung (bei der ersten Sitzung über die Leistung im Vortest). Die Versuchspersonen, die objektives Feedback erhielten, bekamen schriftlich mitgeteilt, wie viele Dateneinträge sie korrekt vorgenommen hatten. Den Versuchspersonen, die soziales Vergleichsfeedback erhielten, wurde schriftlich mitgeteilt, welchen Rang sie innerhalb der Gruppen von Versuchspersonen, die soziales Vergleichsfeedback erhielten, einnahmen (also, der oder die Wievielt-Beste sie waren).

Moon et al. (2017) fanden einen signifikanten Interaktionseffekt zwischen dem Leistungsniveau der Versuchspersonen und der Art des Feedbacks. Das soziale Vergleichsfeedback erwies sich vor allem für die leistungsstarken Versuchspersonen als vorteilhaft. Sie bearbeiteten unter dieser Bedingung im Schnitt 22,06 Aufgaben während einer Sitzung. Erhielten die leistungsstarken Versuchspersonen dagegen objektives Feedback, bearbeiteten sie nur 19,82 Aufgaben. Die leistungsschwächeren Versuchspersonen profitierten dagegen eher von objektivem Feedback. Unter dieser Bedingung bearbeiteten sie im Schnitt 16,2 Aufgaben, bei sozialem Vergleichsfeedback bearbeiteten sie nur 13,38 Aufgaben je Sitzung. Moon et al. (2017) geben auch den Verlauf der Leistung der Versuchspersonen in den einzelnen Gruppen über die Sitzungen hinweg wieder. Die Leistungen der Versuchspersonen entwickelten sich über die Sitzungen hinweg in den Gruppen, die objektives und in den Gruppen, die soziales Vergleichsfeedback erhielten, allmählich auseinander. Dies spricht für eine tatsächliche, differenzielle Wirkung des Feedbacks auf die Versuchspersonen.

Literatur

Alvero, A. M.; Bucklin, B. R. & Austin, J. (2001). An objective review of the effectiveness and essential characteristics of performance feedback in organizational settings (1985 – 1998). Journal of Organizational Behavior Management, 21(1), 3-29.

Balcazar, F. E.; Shupert, M. K.; Daniels, A. C.; Mawhinney, T. C. & Hopkins, B. L. (1989). An Objective Review and Analysis of Ten Years of Publication in the Journal of Organizational Behavior Management. Journal of Organizational Behavior Management, 10(1), 7-37.

Moon, K.; Lee, K.; Lee, K. & Oah, S. (2017). The Effects of Social Comparison and Objective Feedback on Work Performance Across Different Performance Levels. Journal of Organizational Behavior Management, 37(1), 63-74.

 

Hinterlasse einen Kommentar

Eingeordnet unter OBM, Verhaltensanalyse

Wie man Vorurteile wirksam abbaut

Eine Studie in Science zeigt, dass man Vorurteile abbauen kann, indem man die betroffene Person bittet, sich selbst an Situationen zu erinnern, in denen sie diskriminiert wurde.

Zur Frage, wie man Einstellungen und insbesondere Vorurteile verändern kann, gibt es Hunderte von Studien. Bei der Mehrzahl dieser Studien (60 %) handelt es sich jedoch nicht um Experimente, sodass auch kaum Schlussfolgerungen bezüglich der Wirkung von Interventionen gezogen werden können (Paluck, 2016). Bei 29 % der Studien handelt es sich um Laborexperimente (zum Beispiel mit Psychologiestudenten), deren Ergebnisse wenig über die Möglichkeiten, wie man in der Realität die Einstellungen von Wählern und anderen Personen verändern kann, aussagen. Die restlichen 11 % der Studien sind Feldexperimente, wobei jedoch nur in einem Prozent der Studien tatsächlich getestet wurde, ob die Einstellungen von erwachsenen Personen durch bestimmte Maßnahmen (wie zum Beispiel Werbekampagnen) tatsächlich verändert werden können. Aus den vorliegenden Studien kann man allerdings bereits ableiten, dass Einstellungen sich dann ändern, wenn Personen aus dem Bekanntenkreis die einstellungsändernden Informationen übermitteln, wenn sich die Person persönlich durch das Thema angesprochen fühlt u. a. m.

Broockman und Kalla (2016) berichten über ein randomisiertes und kontrolliertes Feldexperiment, in dem die Einstellung von Wählern im US-Bundesstaat Florida gegenüber Transsexuellen längerfristig (über drei Monate) verändert werden konnten. Stimmenwerber, die sich selbst gegenüber den befragten Personen als transsexuell oder nicht transsexuell bezeichneten, suchten persönlich 501 Haushalte auf, die zuvor an einer Onlinebefragung zu verschiedenen Themen teilgenommen hatten. In einem Teil der Haushalte (der Kontrollgruppe) wurde über den Umweltschutz gesprochen. In den anderen Haushalten sprach der Stimmenwerber zunächst das Thema Transsexualität an und bat die befragte Person dann, sich an eine Situation zu erinnern, in der sie selbst von anderen Menschen schlecht angesehen wurden, weil sie anders waren als diese Menschen (analoger Perspektivenwechsel). Die ganze Befragung dauerte nicht länger als 10 Minuten. Die Intervention hatte aber einen signifikanten, dauerhaften Einfluss auf die Einstellung der befragten Personen gegenüber Transsexuellen sowie deren Bereitschaft, für ein Gesetz zu stimmen, dass die Rechte von Transsexuellen stärken soll. In Nachbefragungen, an denen die Haushalte via Internet teilnahmen, hielt diese Veränderung auch noch drei Wochen, sechs Wochen und drei Monate später an. In der Kontrollgruppe zeigten sich keine vergleichbaren Veränderungen. Die Veränderung in den Einstellungen war bedeutsam; sie entspricht im Ausmaß der Veränderung in den Einstellungen amerikanischer Bürger gegenüber Homosexuellen im Zeitraum von 1989 bis 2012. Interessanterweise hatte der Umstand, dass ein Teil der Stimmenwerber sich selbst als transsexuell offenbarte, keinen zusätzlichen Einfluss auf die Einstellungsänderung der Befragten. In der Einstellungsforschung geht man oft davon aus, dass der Kontakt zu den Angehörigen einer Minderheit die Vorurteile gegenüber dieser Minderheit verringere. Als deutlich wirksamer erwies sich jedoch die Methode des analogen Perspektivenwechsels, also die Aufforderung, sich selbst an Situationen zu erinnern, in denen man diskriminiert wurde. Die Intervention wurde von Mitarbeitern und Unterstützern einer amerikanischen Organisation, die sich für die Rechte von lesbischen, schwulen, bisexuellen und transsexuellen Menschen einsetzt, entworfen. Diese führten auch die Befragungen vor Ort durch. Ob es sich um einen erfahrenen Stimmenwerber oder einen Neuling handelte, hatte keinen systematischen Einfluss auf den Erfolg der Intervention.

Literatur

Broockman, D. & Kalla, J. (2016). Durably reducing transphobia: A field experiment on door-to-door canvassing. Science, 352(6282), 220-224.

Paluck, E. L. (2016). How to overcome prejudice. Science, 352(6282), 147-147.

 

Hinterlasse einen Kommentar

Eingeordnet unter Psychologie

Tauben erkennen sich selbst im Spiegel

Auf Gallup (1970) geht der Spiegeltest (Markierungstest) zurück. Sich selbst im Spiegel zu erkennen, gilt als eine höhere Bewusstseinsleistung. Beim Spiegeltest wird an einer Stelle des Körpers, die das Tier (oder Kind) nicht sehen kann (beim Kind z. B. im Gesicht) und von diesem unbemerkt, eine Markierung angebracht (z. B. ein roter Fleck). Wenn das Kind oder Tier beim eigenen Anblick im Spiegel auf diese Markierung reagiert (z. B. versucht, sie sich wegzuwischen), hat es den Spiegeltest bestanden und damit Selbst-Bewusstsein demonstriert. Menschliche Kinder ab einem Alter von etwa zwei Jahren bestehen den Spiegeltest regelmäßig. Aber auch bestimmte Tierarten konnten den Spiegeltest erfolgreich absolvieren, darunter die großen Menschenaffen, möglicherweise auch Kapuzineräffchen. Bei den Vögeln zeigen Elstern das richtige Verhalten, Krähen und Dohlen dagegen bestehen den Test nicht zuverlässig. Gemeinhin werden phylogenetische Unterschied zwischen den Arten als Grund für das erfolgreiche und nicht-erfolgreiche Bestehen des Spiegeltests angeführt.

Epstein, Lanza und Skinner (1981) berichteten von erfolgreichen Spiegeltests mit Tauben, nachdem diese explizit darauf trainiert worden waren. Die Tauben lernten zunächst, nach einem Punkt zu picken der für sie sichtbar am Körper angebracht war. Zudem lernten sie, mittels eines Spiegels einen Punkt zu finden, den sie ohne Spiegel nicht sehen konnten. Im Experiment von Epstein et al. (1981) gelang es den Tauben, diese beiden Teilfertigkeiten anschließend im Spiegeltest zu integrieren und nach den am eigenen Körper, für sie nur im Spiegel sichtbaren Punkten zu picken.

Zwei andere, unveröffentlichte Studien (Gelhard et al., 1982; Thompson & Contie, 1986), über die in einem Buchkapitel berichtet wird (Thompson & Contie, 1994), konnten die Ergebnisse von Epstein et al. (1981) nicht replizieren. Über die Versuche werden jedoch nur wenige Details berichtet, sodass es schwer fällt, den Grund für das Scheitern der Versuche zu bestimmen. Die Tauben von Epstein et al. (1981) waren erfahrene Versuchstiere, die bereits in vielen Experimenten zum operanten Konditionieren eingesetzt worden waren. Die Tauben in den gescheiterten Versuchen waren dagegen relativ naiv. Zwei andere unveröffentlichte Studien (Cardinal et al., 1999; Christensen et al., 2004) berichten davon, dass die verwendeten Tauben den Spiegeltest bestanden hatten, doch werden auch hier zu wenige Details berichtet, als dass belastbaren Schlussfolgerungen möglich wären.

Uchino und Watanabe (2014) trainierten zwei Tauben, die bereits seit längerem als Versuchstiere dienten. Die Tauben trugen einen grauen Kragen, der verhinderte, dass sie einen bestimmten Bereich unter ihrer Brust sehen konnten. Zudem trugen sie eine Art Strumpf über dem Körper, auf dem später die Punkte angebracht wurden. Der Strumpf sollte verhindern, dass die Taube durch die Berührung beim Anbringen des Punktes „wissen“ konnte, wo sich der Punkt befand. In der ersten Phase des Experiments lernten die Tauben, auf eine blaue Markierung zu picken, die sich an der Stirnseite des Versuchskäfigs befand. In der zweiten Phase wurden sie trainiert, auf einen blauen Punkt an ihrem eigenen Körper zu picken. Der Punkt war an der Schulter, dem Flügel oder einer anderen Stelle des Körpers angebracht, die von der Taube trotz des Kragens eingesehen werden konnten. Diese Markierung wurde im Lauf dieser Phase mehrfach immer wieder an anderen Stellen des Körpers angebracht. In der dritten Phase wurde an der hinteren Seite des Käfigs ein Spiegel angebracht. An der Vorderseite befanden sich zwei Schalter. Wenn die Taube sich im Käfig nach hinten orientierte und in den Spiegel sah, war einer der beiden Schalter kurz erleuchtet. Sobald die Taube sich umdrehte, waren die Schalter wieder dunkel. Nur wenn die Taube dann auf den zuvor erleuchteten Schalter, den sie im Spiegel gesehen hatte, pickte, erhielt sie Futter. Diese drei Phasen des Versuches wurden mehrfach wiederholt, sodass die Tauben in den Teilfertigkeiten des Spiegeltests gut trainiert waren.

Anschließend absolvierten die Tauben den Spiegeltest. Siebenmal war dabei der Spiegel frei, siebenmal war er umgedreht, sodass die Taube ihn nicht nutzen konnte. Die Tauben erhielten während des Tests keine Verstärker. Während jedes Versuchsdurchgangs befand sich ein blauer Punkt direkt unterhalb des grauen Kragens auf dem Strumpf, den die Taube trug, in dem Bereich, den die Taube nicht einsehen konnte. Die Forscher nahmen die Spiegeltest mit Video auf und ließen das Verhalten der Tauben durch unabhängige Beobachter auswerten. Die Tauben zeigten während der Testphase die unterschiedlichsten Verhaltensweisen, darunter auch viele „normale“, taubentypische Verhaltensweisen (wie das Scharren, Flügelschlagen usw.), die mit dem Experiment nichts zu tun hatten. Alle diese Verhaltensweisen zeigten die Tauben unabhängig davon, ob der Spiegel zu sehen war oder nicht, etwa gleich häufig. Einzig bei zwei Verhaltensweisen gab es Unterschied zwischen den Tests, bei denen der Spiegel zur Verfügung stand und bei denen er umgedreht war: Die Tauben beugten sich insgesamt 21 (Taube 1) und 39mal (Taube 2) nach dem Punkt und sie pickten fünf (Taube 1) und neunmal (Taube 2) nach dem Punkt, den sie nur mit Hilfe des Spiegels sehen konnten – nur dann, wenn der Spiegel zur Verfügung stand. War der Spiegel nicht vorhanden, beugten sich die Tauben kein einziges Mal nach dem Punkt und sie pickten auch nicht danach. Der Versuch wurde dadurch etwas verfälscht, dass der Kragen mehrmals über den Punkt rutschte, wenn die Taube sich vorbeugte, um auf den im Spiegel gesehenen Punkt zu picken. Ansonsten wären vermutlich noch deutlich mehr „Picks“ auf den Punkt zu verzeichnen gewesen.

Warum funktionierte der Versuch bei Uchino und Watanabe (2014), nicht aber in einigen anderen Fällen zuvor? – Die Tauben von Uchino und Watanabe (2014) waren erfahren Versuchstiere. Interessant ist der Umstand, dass Taube 1, die die etwas schlechteren Ergebnisse erzielte, die weniger erfahrene Versuchstaube war. Das Training zur Vorbereitung des Spiegeltest war bei Uchino und Watanabe (2014) sehr intensiv. Die Tauben konnten die Teilfertigkeiten des Spiegeltest ausgiebig üben, ehe im eigentlichen Test ihre „Transferleistung“ gefragt war. Andere Autoren gingen davon aus, dass die Deutlichkeit der Markierung für den Erfolg beim Spiegeltest von Bedeutung ist. Das intensive Training, so Uchino und Watanabe (2014), könnte das deutliche Erkennen der Markierung begünstigt haben.

Toda und Watanabe (2008) brachten Tauben bei, zwischen Videoaufnahmen, die sie selbst „live“ zeigten und anderen Videos zu unterscheiden. Später zeigten sie den Tauben zeitlich leicht versetzte Videoaufnahmen von sich selbst. Auch jetzt gelang es den Tauben, diese Aufnahmen von anderen Aufnahmen zu unterscheiden. Je größer jedoch die Zeitverzögerung der Videoaufnahmen war, desto schlechter wurde die Diskriminationsleistung der Tauben. Uchino und Watanabe (2014) vermuten daher, dass die „Selbst-Erkenntnis“ der Tauben im Spiegeltest durch die zeitliche Kontiguität des eigenen Verhaltens und des Verhaltens im Spiegel begünstigt wird.

Tauben bewältigen Aufgaben, bei denen sie ein Exemplar dem Muster zuordnen müssen (matching to sample). Dazu sind sie über viele Variationen hinweg, generalisiert in der Lage. Auch das Konzept der Symmetrie scheint ihnen zugänglich. Im Spiegeltest müssen die Tauben ein Exemplar (den Punkt, den sie im Spiegel sehen) einem Muster (dem Punkt am eigenen Körper) zuordnen.

Wieder einmal (vgl. auch Watanabe et al., 1995) stellen Tauben unter Beweis, dass auch sie, die richtigen Bedingungen in der Umwelt und entsprechendes Training vorausgesetzt, in der Lage sind, hochkomplexe, scheinbar „kognitive“ Leistungen zu vollbringen. Angesichts der geringen Größe des Taubenhirns sollte das einigen kognitiven Neurowissenschaftlern zu denken geben.

Videoclips des Versuchs finden Sie hier.

Literatur

Cardinal, C. D.; Allan, R. W. & DeLabar, J. S. (1999). Self-recognition in the pigeon: A replication and controls. Paper presented at the Annual Meeting of the Association for Behavior Analysis, Chicago, IL.

Christensen, C. J.; Sanders, R. B. & Cheney, C. D. (2004). Self-recognition in the pigeon: An objective model for learning through experience. Poster presented at the Annual Meeting of the California Association for Behavior Analysis, San Francisco, CA.

Epstein, R.; Lanza, R. P. & Skinner, B. F. (1981). “Self-awareness” in the pigeon. Science, 212(4495), 695-696. doi:10.1126/science.212.4495.695.

Gallup, G. G. (1970). Chimpanzees: self-recognition. Science, 167(3914), 86-87. doi:10.1126/science.167.3914.86.

Gelhard, B. S.; Wohlman, S. H. & Thompson, R. K. R. (1982). Self-recognition in the pigeon: a second look. Paper presented at the Northeast Regional Meeting of the Animal Behavior Society.

Thompson, R. K. R. & Contie, C. (1986). Further reflections on mirror usage by pigeons. Paper presented at the Annual Meeting of the Psychonomic Society, New Orleans.

Thompson, R. K. R. & Contie, C. (1994). Further reflections on mirror-usage by pigeons: lessons learned from Winnie-the-Pooh and Pinnochio too. In S. T. Parker, R. W. Mitchell, & M. L. Boccia (Eds.), Self-recognition in animals and humans: developmental perspectives (pp. 392-409). Cambridge: Cambridge University Press.

Toda, K. & Watanabe, S. (2008). Discrimination of moving video images of self by pigeons (Columba livia). Animal Cognition, 11(4), 699-705. DOI: 10.1007/s10071-008-0161-4

Uchino, E. & Watanabe, S. (2014). Self-recognition in pigeons revisited. Journal of the Experimental Analysis of Behavior, 102(3), 327-334. doi: 10.1002/jeab.112

Watanabe, S.; Sakamoto, J. & Wakita, M. (1995). Pigeons‘ discrimination of paintings by Monet and Picasso. Journal of the Experimental Analysis of Behavior, 63(2), 165-174. doi: 10.1901/jeab.1995.63-165 PDF, 1,25 MB

Hinterlasse einen Kommentar

Eingeordnet unter Shaping, Stimuluskontrolle, Verhaltensanalyse

Wenn man miteinander redet, verhält man sich verantwortlicher

Ob sich Menschen egoistisch oder altruistisch entscheiden, hängt weniger davon ab, ob andere ihre Entscheidung mitbekommen, sondern davon, ob sie mit den anderen Menschen in Kontakt treten.

Borba et al. (2014) ließen ihre Versuchspersonen an einer Aufgabe arbeiten, bei der sie sich letztlich zwischen zwei Alternativen entscheiden mussten. Entschieden sie sich für Variante 1, so hatte dies für sie selbst unmittelbar positive Konsequenzen, für die Gruppe aber langfristig negative Konsequenzen – eine impulsive, egoistische Wahl. Entschieden sie sich für Variante 2, so führte dies für sie selbst unmittelbar zu nur wenigen positiven Konsequenzen, für alle Gruppenmitglieder zusammen aber langfristig aber zu mehr positiven Konsequenzen – ein Wahl, die man als „ethische Selbstkontrolle“ bezeichnen könnte.

Borba et al. (2014) variierten die Bedingungen, unter denen die Versuchspersonen an der Aufgabe arbeiten und sich letztlich entscheiden mussten.

  1. Wenn jede Versuchsperson allein wählen konnte, entschied sie sich fast ausschließlich egoistisch impulsiv.
  2. Saßen die Versuchspersonen zusammen vor der Aufgabe, konnten reden und sahen, für welche Alternative sich die anderen Versuchspersonen entschieden, so trafen sie meist die Wahl, die ethische Selbstkontrolle zeigte.
  3. Saßen sie zusammen an der Aufgabe und konnte reden, hatten aber keine Informationen über die Entscheidungen der anderen, entschieden sie sich ebenfalls häufig für die ethische, Selbstkontrolle zeigende Alternative.
  4. Zuletzt saßen die Versuchspersonen zusammen an der Aufgabe, konnten aber nicht miteinander reden, jedoch sehen, wie sich die anderen Versuchspersonen entschieden. Hier entschieden sich wieder viele Versuchspersonen impulsiv und egoistisch.

Die sprachliche Interaktion scheint für die Wahl, ob man sich egoistisch und impulsiv oder altruistisch und beherrscht verhält, entscheidend zu sein. Der Umstand, dass man selbst die Entscheidung der anderen sehen kann (und diese die eigene Entscheidung), scheint dagegen wenig Einfluss auf verantwortungsvolles Handeln zu haben.

Literatur

Borba, Aécio; Rodrigues da Silva, Bruno; dos Anjos Cabral, Pedro Augusto; Bentes de Souza, Lívia; Leite, Felipe Lustosa & Tourinho, Emmanuel Zagury. (2014). Effects of exposure to macrocontingencies in isolation and social situations in the production of ethical self-control. Behavior and Social Issues, 23, 5-19. PDF 575 KB

2 Kommentare

Eingeordnet unter Verhaltensanalyse, Verstärkung