Monatsarchiv: Januar 2021

Warum Lob scheinbar nicht wirksam, Bestrafung scheinbar aber wirksam ist

Aus der Verhaltenswissenschaft ist hinreichend bekannt, dass Lob und andere Arten von Belohnungen in den meisten Fällen dazu führen, dass ein Verhalten häufiger gezeigt wird. Die verbreitete Auffassung, Belohnungen würden die sogenannte intrinsische Motivation schmälern, lässt sich nicht aufrechterhalten (Cameron, Banko & Pierce, 2001; Eisenberger & Cameron, 1996). Der Einsatz aversiver Reize führt dagegen zu weniger nachhaltigen Verhaltensänderungen. Dennoch ist in der Öffentlichkeit die Auffassung verbreitet, das Lob und Belohnungen nachteilige Auswirkungen haben können. Eine Person, die gelobt oder belohnt wurde, strenge sich danach nicht mehr so an wie zuvor. Bestrafungstechniken werden dagegen oft als generell wirksamer betrachtet.

Die Regression zur Mitte ist verantwortlich

Eine Ursache für diese unter Laien verbreitete falsche Wahrnehmung dürfte der Effekt der statistischen Regression sein (Kahneman & Tversky, 1973; Tversky & Kahneman, 1974). Statistische Regression tritt dann auf, wenn ein Messwert durch mehrere, zum Teil dem Zufall unterliegende Einflussgrößen verursacht wird. Sie besagt, dass auf einen extrem ausfallenden Messwert höchstwahrscheinlich ein weniger extremer Messwert folgen wird (daher spricht man auch von der Regression zur Mitte). Die Regression fällt umso stärker aus, je extremer der erste Messwert war und je größer die Rolle des Zufalls bei der Messung ist. Gerade bei der Beobachtung von Verhalten spielt der Regressionseffekt eine große Rolle. Die meisten Arten von Verhalten werden durch viele, zum Teil unkontrollierbare Einflussfaktoren determiniert.

Verhalten wird üblicherweise dann gelobt, wenn es in einer bestimmten Weise überdurchschnittlich (gut) war. Bestraft wird Verhalten dann, wenn es unterdurchschnittlich (schlecht) war. Auf einen überdurchschnittlichen Wert folgt wahrscheinlich ein Wert, der wieder näher am arithmetischen Mittel liegt. Ebenso folgt auf einen unterdurchschnittlichen Wert wahrscheinlich ein Wert, der weniger unterdurchschnittlich ist. Die Folge davon ist, laut Schaffner (1985), dass die Person, die das Verhalten einer anderen Person durch Lob oder Bestrafung verändern möchte, für das Loben bestraft wird und für das Bestrafen belohnt wird.

Kahneman und Tversky (1973) berichtet in diesem Zusammenhang von einer Flugschule, die aufgrund verhaltenswissenschaftlicher Erkenntnisse begann, Flugschüler immer dann zu loben, wenn sie eine perfekte Landung hingelegt hatten. Mit der Zeit lehnten die Fluglehrer jedoch diese Praxis ab. Sie stellten fest, dass das Loben des Flugschülers dazu führte, dass dieser beim nächsten Mal eine schlechtere Landung hingelegte.

Ein Versuch zur Verwendung von Lob und Strafe

Schaffner (1985) führte eine Studie durch, bei der die Versuchspersonen einen (hypothetischen) Schüler entweder loben oder bestrafen konnten. Den Versuchspersonen wurde über einen Computermonitor angezeigt, zu welcher Zeit der Schüler die Schule betrat. Den Versuchspersonen wurde mitgeteilt, dass der Schüler bisweilen zu spät in die Schule komme. Sie sollten den Schüler dazu bringen, immer spätestens um 8:30 Uhr in der Schule zu sein. Die Versuchspersonen konnten per Eingabe am Computer den Schüler entweder sehr loben, etwas loben, etwas bestrafen, sehr bestrafen oder gar nicht reagieren. Nach ihrer Eingabe wurde angezeigt, zu welcher Zeit der Schüler am nächsten Tag die Schule betrat. Nun sollten die Versuchspersonen wieder entscheiden, ob sie den Schüler loben, bestrafen oder ignorieren wollten. Nach 15 Durchgängen sollten die Versuchspersonen beurteilen, für wie wirksam sie Lob oder Bestrafung bei der Einflussnahme auf das Verhalten des Schülers hielten. Die Zeiten, zu denen der Schüler die Schule betrat, waren jedoch unabhängig von dem, was die Versuchspersonen taten. In einer Bedingung streuten die Zeiten um einen Mittelwert (8:31 Uhr) herum (mit einer Standardabweichung von 5 Minuten). In einer anderen Bedingung verbesserten sich die Werte des Schülers über die 15 Tage hinweg leicht, jedoch ebenfalls mit einer zuvor programmierten Streuung.

Generell nutzten die Versuchspersonen, bei denen sich das Verhalten des Schülers im Schnitt nicht veränderte, die Bestrafung häufiger als das Lob (55 % zu 45 %). Interessanterweise benutzten die Versuchspersonen über die einzelnen Durchgänge hinweg häufiger das Lob. In den ersten fünf Durchgängen betrug das Verhältnis von Lob zu Bestrafung noch 0,39, in den nächsten fünf Durchgängen 0,66 und in den letzten fünf Durchgängen 0,82. Auch der Anteil von starkem Lob gegenüber leichtem Lob vergrößerte sich. Die Versuchspersonen lobten und bestraften in Abhängigkeit von der Ankunftszeit des Schülers. Im Schnitt wurde starkes Lob dann eingesetzt, wenn der Schüler um 8:25 Uhr die Schule betrat, starke Bestrafung wurde dann angewendet, wenn der Schüler erst um 8:35 Uhr die Schule betrat.

Im Gegensatz zum Verhalten der Versuchspersonen (die zunehmend mehr lobten) steht die Einschätzung der Versuchspersonen, wie wirksam Lob und Bestrafung waren. 32,5 % der Versuchspersonen meinten, dass Lob das Gegenteil von dem bewirke, was beabsichtigt sei. Dagegen wurde von 25,9 % der Versuchspersonen Bestrafung als sehr wirksam bezeichnet. Nur 9 % der Versuchspersonen meinten (richtigerweise) dass sowohl Lob als auch Bestrafung unwirksam sein.

Unter der Bedingung, dass das Verhalten des Schülers sich nach und nach leicht besserte, fielen sowohl das Verhalten als auch die Einschätzungen der Versuchspersonen nicht wesentlich anders aus. Im Gegenteil, die Einschätzung, dass Lob unwirksam bis schädlich sei und dass Bestrafung wirksam sei, war hier noch ausgeprägter.

Eine Replikation des Versuchs

Ich (2020) habe die Studie von Schaffner (1985) mit Studierenden der Sozialen Arbeit (N=226) repliziert. Dabei zeigte sich, dass die Versuchspersonen beim ersten Schüler (dessen Verhalten sich nicht veränderte, wobei die Ankunftszeiten mit einer Standardabweichung von 5 Minuten um den Mittelwert 8:30 Uhr streuten) über die 15 Durchgängen hinweg zunehmend mehr straften (vgl. Abb. 1). Dies bestätigt die Vermutung, dass Menschen zunehmend weniger loben und mehr strafen, wenn Verhalten frei variiert. Nur 10 % bis 12 % der Studierenden erkannten, dass Ihre Reaktionen (ob sie den Schüler lobten oder ermahnten) keine Auswirkungen auf das Verhalten des Schülers hatte. Sowohl Lob als Ermahnung wurden überwiegend als wenig effektiv eingeschätzt.

Beim zweiten Schüler, der (mit ähnlicher Streuung) zunehmend pünktlicher kam, setzten die Studierenden über die 15 Durchgänge hinweg mehr Lob ein (vgl. Abb. 2). Sowohl Lob als auch Ermahnung wurden hier als wirksamer erlebt als beim ersten Schüler.

Die Ergebnisse unterscheiden sich von Schaffner (1985). Dies mag damit zusammenhängen, dass es sich bei den Versuchspersonen der Replikationsstudie um Studierende handelte, die zuvor bereits Lehrveranstaltungen besucht hatten, die die differentielle Wirksamkeit von positiver Verstärkung und Bestrafung behandelten.

Literatur

Cameron, J.; Banko, K. & Pierce, W. D. (2001). Pervasive negative effects of rewards on intrinsic motivation. The Behavior Analyst, 24(1), 1-44.
Eisenberger, R. & Cameron, J. (1996). Detrimental effects of reward: Reality or myth? American Psychologist, 51(11), 1153-1166.
Kahneman, D. & Tversky, A. (1973). On the psychology of prediction. Psychological Review, 80(4), 237-251.
Schaffner, P. E. (1985). Specious learning about reward and punishment. Journal of Personality and Social Psychology, 48(6), 1377-1386.
Tversky, A. & Kahneman, D. (1974). Judgements under uncertainty. Heuristics and biases. Science, 185, 1124-1131.

Hinterlasse einen Kommentar

Eingeordnet unter Verhaltensanalyse, Verstärkung

Experimente und die Beobachtung von Verhalten stehen in der Psychologie nicht hoch im Kurs

Baumeister et al. (2007) nahmen das von der APA (American Psychological Association) ausgerufene Jahrzehnt des Verhaltens zum Anlass, nachzusehen, inwiefern in psychologischen Studien überhaupt noch wirkliches, echtes Verhalten untersucht wird. In einigen Subdisziplinen ist dies tatsächlich der Fall. Jedoch in zwei sehr zentralen Teildisziplinen der Psychologie, der Sozialpsychologie und der Persönlichkeitspsychologie, wird heutzutage so gut wie gar kein tatsächliches Verhalten mehr untersucht. Beide Disziplinen erheben ihre Daten überwiegend über Fragebögen. Manchmal wird noch die Reaktionszeit erfasst. Die Neuropsychologen haben sich noch nie besonders für das Verhalten direkt interessiert, sondern lediglich für das Verhalten von Neuronen. Dass dieses etwas mit dem tatsächlichen Verhalten zu tun hat, wird schlichtweg vorausgesetzt. Baumeister et al. (2007) untersuchten eine beliebige Ausgabe des Journal of Personality and Social Psychology – des vermutlich prestigeträchtigsten Journals für diese Teildisziplinen der Psychologie. Sie tun sich schwer, hier irgendetwas von Verhalten zu entdecken. Das Verhalten in den dort berichteten Studien wird zumeist in sitzender Position ausgeführt, zumeist vor einem Computer. Fingerbewegungen in der Form von Tastenanschlägen oder Markierungen mit einem Bleistift auf Papier stellen die große Mehrheit menschlichen Verhaltens, das in diesen Studien berichtet wird, dar. Manchmal berichten die Versuchspersonen in diesen Fragebögen darüber, was sie getan haben, was sie tun werden oder tun würden. Zumeist aber werden die Versuchspersonen nur danach gefragt, was sie denken, was sie fühlen oder warum sie tun was sie tun. D. h., in den meisten Studien zur Persönlichkeitspsychologie und Sozialpsychologie geht es um Selbstberichte über innere Zustände.

Nisbett und Wilson (1977) nahmen an, dass sie die Introspektion endgültig diskreditiert hatten, als sie nachwiesen, wie wenig das, was in introspektiv berichtet wird, mit tatsächlichem Verhalten zu tun hat. Keine einzige der 38 Studien, die in der Heftnummer, die Baumeister et al. (2007) untersuchten, berichtet werden, beinhaltete die direkte Beobachtung von Verhalten. Die abhängigen Variablen waren fast ausschließlich Ratings, entweder auf Papierfragebögen oder gegenüber auf dem Computer präsentierten Stimuli. Die Ratings bezogen sich zumeist auf introspektive Selbstberichte. Um zu überprüfen, ob es sich schon immer so verhalten hat, untersuchten die Autoren frühere Nummern der gleichen Zeitschrift. Dabei zeigt sich, dass es bis in die siebziger Jahre noch einen erklecklichen Anteil an Artikeln gab, in denen über richtiges Verhalten berichtet wurde. Erst mit Beginn der Achtzigerjahre sank dieser Anteil auf unter 20 % bis unter 10 %. Der Fragebogen als allein seligmachende Methode der Persönlichkeitspsychologie setzte sich immer mehr durch. Erschwerend kommt hinzu, dass die hauptsächliche Methode, um persönlichkeitspsychologische Fragebögen zu validieren, die Korrelation mit anderen Fragebögen ist (nicht aber mit tatsächlichem Verhalten).

Tatsächlich ist es in einigen Fällen ethisch nicht vertretbar, tatsächliches Verhalten zu untersuchen. Jedoch sind diese Fälle relativ selten. Dies kann also nicht der Grund sein, warum Psychologen immer seltener Verhalten untersuchen. Der hauptsächliche Grund, aus Sicht der Autoren, liegt darin, dass Studien, in denen Verhalten beobachtet wird, wesentlich aufwendiger sind als Studien, in denen lediglich Fragebögen verteilt werden. Für den Mehraufwand, der mit solchen Studien verbunden ist, gibt es keinerlei Anreize, im Gegenteil, die Forscher müssen mit Schwierigkeiten rechnen. Der Zeitpunkt, zu dem das Verhalten zunehmend weniger in Studien berücksichtigt wurde, der Beginn der achtziger Jahre, ist zum einen mit dem Aufschwung der kognitiven Psychologie verbunden. Zum anderen aber war dies der Zeitpunkt, in dem Ethikkommissionen immer wichtiger wurden für die Durchführung von Studien. Hinzu kommt die Einstellung der Herausgeber der Fachzeitschriften. Einer der Autoren versuchte kürzlich eine Studie in einer Fachzeitschrift zu veröffentlichen, in der er nur Verhaltensdaten berichtete, ohne sich auf innere Prozesse zu beziehen. Das Manuskript wurde abgelehnt mit der Begründung, er würde „keine psychologischen Variablen“ berücksichtigen. Dagegen ist es problemlos möglich, in Studien lediglich von inneren Prozessen zu berichten, ohne sich auf Verhalten zu beziehen.

Es ist jedoch gefährlich, sich allein auf Fragebogendaten zu beziehen, wenn man etwas über das tatsächliche Leben erfahren möchte. Ein Beispiel dafür ist eine Studie von West und Brown (1975). Diese befragten ihre Versuchspersonen, ob sie einer Person helfen würden, die aufgrund eines Unfalls Geld benötigen würde, um sich medizinisch behandeln zu lassen. In den Fragebögen gaben die Versuchspersonen an, recht großzügig Geld zu geben und dass die Attraktivität der Person, die da fragt, keinen Einfluss auf ihre Spendenbereitschaft habe. Zugleich konfrontierten die Autoren die Versuchspersonen mit einer inszenierten Situation, in der die Versuchspersonen tatsächlich um Geld gebeten wurden. Die tatsächlichen Spenden betrugen im Mittel zehn Cent und es gab eine klare Abhängigkeit zwischen der Attraktivität des Opfers und der Hilfsbereitschaft der Versuchspersonen. Viele weitere Studien zeigen systematisch, wie unzutreffend die Aussagen von Versuchspersonen über ihr Verhalten sind. Während der sechziger und siebziger Jahre wurden sowohl Persönlichkeitseigenschaften als auch Einstellungen in der Psychologie kritisch hinterfragt. Mischel (1968) attackierte die Persönlichkeitspsychologie und ihre Messung von Persönlichkeitseigenschaften aufgrund der geringen Korrelation zwischen den Fragebogenergebnissen und dem tatsächlichen Verhalten der Versuchspersonen. Heutzutage wird in den Artikeln, die sich mit der Konsistenz zwischen Einstellungen und Verhalten beschäftigen, noch nicht einmal mehr tatsächliches Verhalten berichtet. Das erscheint etwas widersinnig. Sozialpsychologen können schwerlich behaupten, dass die Persönlichkeit das Verhalten voraussagt wenn sie mit Verhalten gar nicht mal wirkliches Verhalten meinen. Dies ist für Außenstehende schwer nachvollziehbar. Die interessantesten Experimente der Sozialpsychologie fanden in den fünfziger und sechziger Jahren statt, als man noch tatsächliches Verhalten untersucht. Dies sind auch nach wie vor die wichtigsten Experimente, über die in einführenden Lehrbüchern berichtet wird. Alles in allem befürchten die Autoren, dass sich das von der APA ausgerufene Jahrzehnt des Verhaltens als eine Lachnummer erweisen wird.

Baumeister, R. F., Vohs, K. D., & Funder, D. C. (2007). Psychology as the science of self-reports and finger movements: Whatever happened to actual behavior? Perspectives on Psychological Science, 2(4), 396-403. https://doi.org/10.1111/j.1745-6916.2007.00051.x

Mischel, W. (1968). Personality and assessment. New York: Wiley.
Nisbett, R. E., & Wilson, T. D. (1977). Telling more than we can know: Verbal reports on mental processes. Psychological Review, 84(3), 231-259. doi:10.1037/0033-295X.84.3.231
West, S. G., & Jan Brown, T. (1975). Physical attractiveness, the severity of the emergency and helping: A field experiment and interpersonal simulation. Journal of Experimental Social Psychology, 11(6), 531-538. doi:https://doi.org/10.1016/0022-1031(75)90004-9

Hinterlasse einen Kommentar

Eingeordnet unter Kritik, Psychologie

Wie wirksam ist Feedback? Und unter welchen Umständen ist es am wirksamsten?

Sleiman, Sigurjonsdottir, Elnes, Gage und Gravina (2020) legen ein Update der Reviews von Balcazar, Hopkins und Suarez (1985) und Alvero, Bucklin und Austin (2001) vor. Die systematische Literaturübersicht und Meta-Analyse deckt die Jahre 1998 bis 2018 ab. Ausgewertet wurden 96 Studien aus 71 Fachzeitschriftenartikeln, in denen im angewandten Kontext (Feldversuche) die Wirkung von Feedback auf die Leistung von Mitarbeitern untersucht wurde. Alles in allem kommen Sleiman et al. (2020) zu der Einschätzung, dass Feedback eine wirksame Intervention ist, die stabile und große Effekte auf die Leistung von Mitarbeitern hat. Des Weiteren werden die Effekte verschiedener Arten von Feedback differenziert betrachtet.

Die verhaltenswissenschaftliche Funktion von Feedback ist nicht eindeutig geklärt. Feedback kann als Verstärker oder Strafreiz begriffen werden, als Instruktion, als Leitfaden, als diskriminativer Stimulus, als Regel oder als motivierende Operation.

Es sind im Wesentlichen nur vier verschiedene Fachzeitschriften, in denen empirische Studien zur Wirkung von Feedback veröffentlicht werden, in denen es um die konkrete Auswirkung auf die Leistung und das Verhalten der Mitarbeiter geht und die dies nicht nur im Labor untersuchen. Es handelt sich um das

  • Academy of Management Journal (AMJ),
  • Journal of Applied Behavior Analysis (JABA),
  • Journal of Applied Psychology (JAP),
  • Journal of Organizational Behavior Management (JOBM)

Die bisherigen Reviews (Alvero et al., 2001; Balcazar et al., 1985) fanden aufgrund der Auswertung von Artikeln aus diesen Zeitschriften, dass

  • Feedback nicht generell und immer die Leistung von Mitarbeitern verbessert,
  • Feedback am besten wirkt, wenn es in Kombination mit anderen Interventionen (vorausgehenden Bedingungen, dem Setzen von Zielen und Konsequenzen) eingesetzt wird und dass
  • einige Eigenschaften von Feedback konsistent dafür verantwortlich sind, dass Mitarbeiter ihre Leistung steigern (z. B. dann, wenn Feedback täglich von den Vorgesetzten gegeben wird).

Inklusions- und Exklusionskritierien

Sleiman et al. (2020) werteten für den Zeitraum von 1998 bis 2018 die oben genannten Zeitschriften aus und legten die folgenden Kriterien an:

  • es wird über eine Studie oder Studien berichtet, in denen Feedback als Intervention eingesetzt wird,
  • die Intervention wurde im angewandten Kontext einer Organisation eingesetzt und
  • die Versuchspersonen waren bezahlte oder unbezahlte Mitarbeiter.

Ausgeschlossen wurden Beiträge,

  • in denen nur über Studien berichtet wurde, die in analogen Kontexten oder im Labor stattfanden,
  • die keine quantitativen Daten berichteten,
  • bei denen das Zielverhalten bei der Rate „Null“ bleiben sollte (wie z.B. Fehler bei der Bedienung der Kasse) und
  • die nicht genügend Informationen berichteten, um sie in das Kategoriensystem des Reviews einsortieren zu können.

Die analysierten Studien

Mit diesen Kriterien fanden Sleiman et al. (2020) insgesamt 71 Artikel, wobei in JABA 18 Artikel erschienen waren und in JOBM 53. In den beiden anderen Zeitschriften war kein einziger Artikel erschienen, der den oben genannten Kriterien genügte. Dies mag damit zu tun haben, dass in diesen Zeitschriften andere Aspekte von Feedback (z. B. die Auswirkung nicht auf das Verhalten, sondern auf die Wahrnehmung oder Selbstwirksamkeitserwartung der Feedbackempfänger) untersucht werden. In den 71 Artikeln wurde über insgesamt 96 Untersuchungen (Studien) berichtet.

Die Studien wurden nach ihrer methodischen Qualität unterteilt in solche, die den Standards des What Works Clearinghouses (Kratochwill et al., 2013) genügten (26 der 96 Studien, das sind 27,03 %) und solchen, bei denen dies nicht der Fall war.

Die gefundenen Studien wurden kategorisiert nach den Kriterien Interventionsmerkmale, Merkmale des Feedbacks und Wirksamkeit des Feedbacks. Dies entspricht den Kategorien, die auch bei Alvero et al. (2001) verwendet wurden. Zusätzlich wurden auch das Timing des Feedbacks (unmittelbar nach dem Verhalten oder verzögert) und die Natur des Feedbacks (positiv oder negativ) berücksichtigt. Weiterhin wurde erfasst, wer die Teilnehmer der Studie waren, in welchem Setting die Studie stattfand, das Untersuchungsdesign, die Dauer der Feedbackintervention, sowie die Beobachterüberreinstimmung und die Treatmentintegrität.

Als Effektstärke wurde Tau-U berechnet. Dabei gelten Tau-U-Werte von weniger als 0,2 als gering, zwischen 0,2 und 0,59 als mäßig, zwischen 0,6 und 0,79 als groß und über 0,8 als sehr groß. Die Tau-U-Werte wurden sowohl für alle Studien insgesamt als auch nur für die Studien, die die Kriterien des What Works Clearinghouses erfüllten, berechnet.

Effekt des Feedbacks

In 92,31 % aller Studien, die den Kriterien genügten, konnte eine starke bis sehr starke funktionale Relation nachgewiesen werden. Dies bedeutet, dass das Feedback tatsächlich in hohem Maße für die Verbesserung der Leistung der Mitarbeiter verantwortlich war. Betrachtet man alle Studien zusammen, hatten 59 (61,46 %) eine Effektstärke größer 0,8. Nur sieben Studien hatten eine Effektstärke kleiner 0,2. Dabei handelte es sich jedoch ausschließlich um Studien, bei denen den Maßnahmen kein Assessment voranging (also keine Untersuchungen darüber, welche Maßnahmen aus verhaltensanalytischer Sicht erforderlich waren). Die durchschnittliche Effektstärke für Feedback über alle Studien hinweg betrug 0,78. Betrachtet man nur die Studien, die den Kriterien genügten, betrug die Effektstärke 0,79. Über die Jahre hinweg, von 1998 bis 2018, zeigen die Effektstärken der Studien einen ansteigenden Trend, das heißt die in den Studien gemessene Wirkung von Feedback auf das Verhalten wurde stärker. Dies hat vermutlich mit der zunehmend besseren methodischen Qualität der Studien zu tun.

Feedback in Kombination mit anderen Interventionen

Feedback allein hatte eine große bis sehr große Effektstärke. Am häufigsten in Kombination eingesetzt wurde Feedback zusammen mit vorausgehenden Bedingungen. Die höchste Effektstärke überhaupt hatte die Kombination von Feedback, vorausgehenden Bedingungen und Verhaltenskonsequenzen (0,91). Fast gleichauf liegt die Kombination aus Feedback und Zielsetzungen (0,89), wenn man nur die Studien betrachtet, die die Kriterien erfüllen.

Quelle des Feedbacks

Selbst erzeugtes Feedback hatte über alle Studien hinweg die größte Effektstärke (0,90). Unter den Studien, die die Kriterien erfüllen, wies das Feedback von Vorgesetzten die höchste Effektstärke auf (0,85). Relativ gesehen am wenigsten wirksam war das Feedback von Experten (0,50).

Feedback-Medium

Am häufigsten wurde grafisches Feedback in Kombination mit verbalem Feedback eingesetzt. Alle Effektstärken der verschiedenen Formen von Feedback waren groß bis sehr groß.

Feedbackempfänger

Feedback, das an Individuen gerichtet war, hatte eine größere Effektstärke aus Feedback, das sich an Gruppen richtete.

Feedbackhäufigkeit

Feedback war, unabhängig von seiner Häufigkeit, immer mindestens mäßig wirksam, jedoch war tägliches und wöchentliches Feedback relativ gesehen am wirksamsten (Effektstärke 1,02).

Feedback-Timing

Feedback war dann am wirksamsten, wenn es innerhalb von 60 Sekunden nach dem Verhalten gegeben wurde (Effektstärke 0,87).

Art des Feedbacks

Positives Feedback wurde am häufigsten eingesetzt und war auch verglichen mit negativem Feedback wirksamer.

Die Autorinnen fassen zusammen, dass Feedback eine wirksame Intervention ist, die zuverlässig große bis sehr große Effektstärken hervorbringt. Herausragend waren dabei die Kombination aus Feedback, vorausgehenden Bedingungen und Verhaltenskonsequenzen, das selbsterzeugte Feedback, eine Kombination aus grafischem, verbalem und schriftlichem Feedback, individuelles, tägliches oder wöchentliches Feedback, sowie unmittelbares und positives Feedback. Zwischen privatem und öffentlichem Feedback gab es keine Unterschiede.

“The current review, Balcazar et al. (1985) and Alvero et al. (2001) suggest that a) feedback privacy does not play a role in feedback effectiveness, b) more frequent forms of feedback are more effective than less frequent forms of feedback, and c) supervisors as a feedback source are effective.” (p. 19).

Die Metaanalyse bestätigt die von mir schon länger getroffenen Aussagen zum Feedback:

  • Feedback ist desto wirksamer, je häufiger es gegeben wird.
  • Feedback ist desto wirksamer, je spezifischer es ist. Daher ist Feedback zum individuellen Verhalten, an ein Individuum gerichtet, prinzipiell am wirksamsten.
  • Feedback ist desto wirksamer, je schneller es auf das Verhalten folgt. Dies gilt vor allem für positives Feedback.
  • Feedback in Kombination mit Verstärkung ist wirksamer.

Zu der Frage, ob Feedback akkurat sein muss, um wirksam zu sein, kann die Metaanalyse keine Auskunft geben, da keine entsprechenden Studien beinhaltet waren. Jedoch weisen Laborstudien darauf hin, dass Feedback desto wirksamer ist, je akkurater es ist.

Literatur

Alvero, A. M.; Bucklin, B. R. & Austin, J. (2001). An objective review of the effectiveness and essential characteristics of performance feedback in organizational settings (1985 – 1998). Journal of Organizational Behavior Management, 21(1), 3-29.

Balcazar, F.; Hopkins, B. L. & Suarez, Y. (1985). A critical, objective review of performance feedback. Journal of Organizational Behavior Management, 7(3-4), 65-89.

Kratochwill, T. R.; Hitchcock, J. H.; Horner, R. H.; Levin, J. R.; Odom, S. L.; Rindskopf, D. M.et al. (2013). Single-case intervention research design standards. Remedial and Special Education, 34(1), 26-38.

Sleiman, A. A.; Sigurjonsdottir, S.; Elnes, A.; Gage, N. A. & Gravina, N. E. (2020). A quantitative review of performance feedback in organizational settings (1998-2018). Journal of Organizational Behavior Management, 40(3-4), 303-332.

Hinterlasse einen Kommentar

Eingeordnet unter BBS, OBM, Verhaltensanalyse

Die Verhaltensanalytische Sicht auf das Phänomen „Multiple Persönlichkeit“

Wenn Verhaltensanalytiker über „Persönlichkeit“ sprechen, dann fassen sie sich in der Regel kurz. Nicht der Persönlichkeit sondern dem Verhalten gilt das Interesse der Verhaltensanalytikerin. Ansonsten neigen sie nicht zur Spekulation und beziehen sich bei der Frage nach den Ursachen von Persönlichkeitsstörungen oft nur auf falsches Lernen oder unangepasste Konditionierungen usw. Diese Zurückhaltung hat nun viele Autoren dazu verleitet anzunehmen, die Verhaltensanalyse habe nichts oder wenig zu diesem Thema zu sagen. Dies trifft aber bei genauerer Betrachtung auch auf psychoanalytische, „humanistische“ und kognitive Ansätze zu; auch sie sagen zum Teil dieselben Dinge über ganz unterschiedliche Verhaltensweisen.

Genauer betrachtet ist Verhaltens- und Persönlichkeitstheorie dasselbe. Skinner (1974, 149) definiert „Persönlichkeit“ als „Verhaltensrepertoire“. Die Persönlichkeit setzt sich aus verschiedenen Kontingenzen zusammen und ist der Kontrolle und Veränderung durch die Umwelt unterworfen. Das heißt, was eine Persönlichkeit ausmacht, ist das Produkt der Kontingenzen, denen diese Person unterliegt oder bislang unterlag.

Das Konzept „multipler Persönlichkeiten“ ist in dieser Auffassung von „Persönlichkeit“ bereits enthalten. In verschiedenen Umwelten unterliegen wir verschiedenen Kontingenzen und haben daher – zu einem gewissen Grad – verschiedene Persönlichkeiten.

Phleps (2001) bemerkt, dass „konventionelle“, nicht-verhaltensanalytische Persönlichkeitstheoretiker die Frage „Was ist eine Persönlichkeit?“ so angehen, als könne man darüber nur spekulieren, als handle es sich um ein Thema wie Exobiologie.

Das DSM-IIIR (American Psychiatric Association, 1987) – die Diagnose-Richtlinien der Amerikanischen Psychiatervereinigung – erwähnte noch die multiple Persönlichkeitsstörung, seit dem DSM-IV (1994) wird diese Symptomgruppe nun unter den Dissoziativen Persönlichkeitsstörungen (Dissociative Identity Disorder, DID) zusammengefasst. Auch in der Definition dieser Störung gab es einen Wandel: War 1987 noch die Rede von mehreren Persönlichkeiten innerhalb des Individuums, hieß es 1994, notwendiges Kriterium sei die Anwesenheit zweier oder mehrer Identitäten oder Persönlichkeitszustände, die verschiedentlich die Kontrolle über das Verhalten erlangten. Die Auffassung des DSM-IV ist also weniger mentalistisch als 1987 und spricht explizit vom Verhalten (an dem die Störung zu identifizieren ist).

Das Verhalten einer Person, bei der eine dissoziative Persönlichkeitsstörung diagnostiziert wurde, sollte demnach mehr situative Variabilität aufweisen als das eines „durchschnittlichen“ Menschen.

Zurecht merkt Phleps (2001) an, dass die Diagnose zwischen 1920 und 1970 kaum gestellt wurde, dass es auch heute krasse regionale Unterschiede in der Häufigkeit gibt und dass manche Diagnostiker Hunderte solcher Fälle kennen, andere in ihrem ganzen Leben kaum einen zu Gesicht bekommen. Dies hat die multiple Persönlichkeitsstörung etwas ins Zwielicht gesetzt.

Phleps (2001) sieht ein Kontinuum von „normalem“ Verhalten zu dem einer Person mit multipler Persönlichkeitsstörung. Wir alle verhalten uns unter verschiedenen Umständen verschieden. In einer Kirche benehmen wir uns anders als in einem Café. Hier ist der Unterschied der beiden Umwelten klar kenntlich. Aber auch weniger drastisch unterschiedliche Situationen führen bei manchen Menschen zu sehr unterschiedlichem Verhalten. Oft ist es nur ein minimales Merkmal der Situation, das den Unterschied ausmacht. Ist z. B. die Mutter eines jungen Mannes unter den Gästen seiner Party, verhält er sich anders, als wenn diese nicht zugegen ist. Der Unterschied in seinem Verhalten zwischen einer Party, bei der seine Mutter anwesend ist, und einer Party ohne sie sollte gravierend sein. Für denjenigen Beobachter aber, der nicht über bestimmte Hintergrundinformationen verfügt (z. B. nicht weiß, dass eine der anwesenden Damen die Mutter des Gastgebers ist), ist der Unterschied im Verhalten des jungen Mannes unerklärlich. Ebenso ist erwiesen, dass wir uns in verschiedenen Situationen verschieden gut erinnern können. Oft fallen uns vergessen geglaubte Ereignisse wieder ein, wenn wir in eine Situation kommen, die der damaligen in irgend einer Weise ähnelt. Und auch hier kann das „gemeinsame Merkmal“ ein unauffälliges sein, das Außenstehenden kaum oder gar nicht auffällt (z. B. ein bestimmter Geruch). Skinner (1953) schlug vor, dass wir alle in gewisser Weise „multipel“ wären. Die Frage sei aber nicht, wie viele Persönlichkeiten wir haben, sondern wie viele Verhaltensrepertoires wir ausführen oder zeigen könnten.

Multiple Persönlichkeiten hingegen behaupten in verschiedenen Situationen sogar, eine ganz andere Person zu sein. Es gibt aber auch für eine „gesunde“ Person Situationen, in denen Kontingenzen sie dazu bringen, sich für eine andere Person auszugeben (z. B. wenn es gefährlich wäre, man selbst zu sein).

Kohlenberg und Tsai (1991) argumentieren, dass jedes Kind Phasen durchläuft, in denen es angibt, jemand anderes zu sein oder in denen es jemand anderes zu sein spielt usw. Normalerweise verschwindet dieses Verhalten wieder, denn es wird nicht durch Verstärkung aufrechterhalten. In bestimmten Umständen aber kann dieses Verhalten von Vorteil sein. Ein Kind, das misshandelt wird, kann zwar nicht verleugnen, dass es misshandelt wird, aber es kann sich vormachen, dass diese Dinge nicht mit ihm geschehen. So könnten also bestimmte Umweltereignisse dieses Verhalten, jemand anderes zu sein, verstärken.

Phlebs (2001) vergleicht die lebendigen Erinnerungen von Multiplen mit Skinners Konzept des „konditionierten Sehens“: Ein Person sieht einen bestimmten Stimulus, der eigentlich nicht da ist, wenn dieser Stimulus früher häufig mit einem anderen Stimulus (der anwesend ist) aufgetreten ist. Zwischen lebhafter Erinnerung und Halluzination besteht demnach ein Kontinuum. Ebenso beim differentiellen Erinnern: Wir alle erinnern uns oder erinnern uns nicht in Abhängigkeit von diskriminativen Stimuli (vgl. oben). Bei Multiplen sollte dies einfach stärker ausgeprägt sein.

Phlebs (2001) vermutet, dass Personen mit DID sich stärker als andere nur auf ihre (unangemessenen) Selbstbeobachtungen verlassen und weniger auf Bestätigung aus ihrer Umwelt.

Kohlenberg und Tsai (1991) berichten, dass Personen mit DID sehr aufmerksam sind für die von ihrem Therapeuten stammenden diskriminativen Stimuli und daher sehr leicht unwillentlich von diesem geformt werden können. Diese erhöhte Sensibilität für kleinste nonverbale Zeichen mag aus einer Geschichte der Misshandlung durch einen unberechenbaren Elternteil resultieren.

Schwieriger sind die Berichte über verschiedene Intelligenzniveaus und pharmazeutische Ansprechbarkeit bei den verschiedenen Alter-Persönlichkeiten. Jedoch zeigt die Verhaltensanalyse, dass die Wirkung von Pharmaka bspw. sehr wohl von diskriminativen Stimuli abhängen kann. Was Daten angeht, die auf Selbstberichten basieren (wie z. B. auch Intelligenztests), so stellt deren Interpretation selbstverständlich auch keine Schwierigkeit dar. Die Berichte über Wunden in einem Zustand, die in einem anderen noch nicht vorhanden waren, sind, in Anlehnung an die Befunde aus der Hypnoseforschung, skeptisch zu betrachten (vgl. Barker, 2001 bzw. Johnson, 1989).

Ursprünglich war das Zeigen von Schmerz ein respondentes Verhalten. Als Ergebnis der Misshandlungen können diese Verhaltensweisen aber unter die Kontrolle von Regeln kommen.

Das Ziel einer verhaltensanalytischen Therapie von DID sollte sein, das Verhalten, eine Person zu sein, zu formen und den Klienten zu mehr Einholen von sozialer Rückmeldung zu bringen (um ihn von der Selbstreferenz abzubringen).

Literatur

American Psychiatric Association. Diagnostic and statistical manual of mental disorders. First edition, 1952; Second edition 1968; Third edition, 1980; revised, 1987; Fourth edition, 1994. Washington, DC: Author.
Barker, L.M. (2001). Learning and behavior. Biological, psychological and sociocultural perspectives. (3rd ed.). Upper Saddle River, NJ: Prentice Hall.
Johnson, R.F.Q. (1989). Hypnosis, suggestion, and dermatological changes. A consideration of the production and dimunition of dermatological entities. In N.P. Spanos & J.F. Chaves (Eds.), Hypnosis. The cognitive-behavioral perspective (pp. 297-312). Buffalo, NY: Prometheus.
Phleps, B.J. (2001). Personality, personality „theory“ and Dissociative Identity Disorder. What behavior analysis can contribute and clarify. The Behavior Analyst Today, 2, 325-335.
Kohlenberg, R.J. & Tsai, M. (1991). Functional analytic psychotherapy. Creating intense and curative therapeutic relationships. New York: Plenum.
Skinner, B.F. (1953). Science and human behavior. New York: Free Press.
Skinner, B.F. (1974). About Behaviorism. New York: Random.

Hinterlasse einen Kommentar

Eingeordnet unter Uncategorized

Das „Meme“ – nur eine Metapher

Dawkins (1976) prägte den Begriff des „Mems“. Das Mem ist eine Metapher für die Übertragung kultureller Information durch eine Art Träger, ähnlich wie das Gen ein Träger der Erbinformation ist. Diese Idee hat mittlerweile ein Eigenleben entwickelt, eine eigene Art Wissenschaft, die „Memetik“ beschäftig sich damit, wie diese angenommenen Replikatoren kultureller Information funktionieren, wie sie sich verbreiten usw. Dabei wird den Memen eine kausale Rolle bei der Verursachung von Verhalten zugeschrieben. Im Rahmen der Memetik wird z. B. bisweilen auch angenommen, dass es sich bei (vielen) Religionen um memetische Viren handelt. Doch spielt sich all das im Raum des metaphorischen Denkens ab. Niemand hat bislang das reale Gegenstück zum Konstrukt Mem gefunden, so wie man die Chromosomen als die realen Träger der (in Genen codierten) Erbinformation identifiziert hat.

Simon und Baum (2011) kritisieren das Konzept des Mems aus behavioristischer Sicht. Statt von Memen zu sprechen, kann man auch gleich das beschreiben, was hinter der Idee des Mems steckt, nämlich Zusammenhänge zwischen Verhaltensweisen und Umweltereignissen die für Vorhersagen genutzt werden können.

Meme lassen sich in verschiedener Weise auffassen:

  1. Als Abstraktionen, im Sinne von mentalen Repräsentationen, Informationen und Ideen
  2. Als Neurologische Erregungsmuster
  3. Als Einheiten von Verhalten

Ad 1.
Zwar weisen es die meisten Autoren von sich, doch lässt sich die Nähe des Mem-Konzepts zum Dualismus nicht verneinen. Wenn Meme nicht als Metapher, sondern als real aufgefasst werden, stellt sich die Frage, wie sie mit dem Körper, der sich letztlich verhält, interagieren. Wer die Texte von Autoren, die Meme als Informationsreplikatoren ansehen, liest, kann sich des Eindrucks nicht erwehren, dass Meme verborgene Entitäten in einer geistigen Welt sind, die irgendwie Verhalten verursachen.

So schreibt Dennett (1991), der sich ansonsten vehement gegen den Dualismus ausspricht, dass der Geist geschaffen werden, indem Meme das Gehirn restrukturieren (S. 207). Wenn man kein Dualist ist, wie soll man es dann verstehen, dass Meme das Gehirn restrukturieren? Wenn Dennett damit allerdings nur sagen wollte, dass individuelles Verhalten mit Veränderungen im Gehirn einhergeht, bleibt unklar, was die Einführung des Begriffs Mem zu dieser Erklärung beiträgt. Ebenso klingt die Aussage von Susan Blackmore (1997) sehr dualistisch, dass unsere Gehirne und unsere Geister das Produkt von zwei Replikatoren sind („our brains and minds have been the product of two replicators… but as memetic evolution proceeds faster and faster, our minds are increasingly the product of memes, not genes“, S. 44). An anderer Stelle schreibt sie (1999), es gebe in uns nichts, dass das Tun tue, außer einem Bündel Meme (S. 240). Sie ersetzt lediglich das (von ihr zurecht als „magische“ und „aus dem Nichts entstehende“ Kraft bezeichnete) verhaltensverursachende „Bewusstsein“ durch „Meme“. Die Memetik macht nicht deutlich, was Meme von imaginären Agenten unterscheidet.

Den Dualismus vermeidet man, wenn man Meme als Begriffe auffasst, die sich auf Verhaltensregularitäten beziehen. Zum Beispiel bedeutet der Glaube, dass Inzest falsch ist (ein typisches „Mem“), dass man Inzest vermeidet, sich dagegen ausspricht, ihn bestraft, wenn er vorkommt usw. Die Verhaltensweisen, die wir hier aufzählen, sind real.

Die Aussage, dass Meme (als Ideen) unser Verhalten verursachen, ist ein Beispiel für Mentalismus, die von B. F. Skinner kritisierte Vorstellung, dass es neben den realen Verhaltensweisen weniger oder gar nicht reale geistige Inhalte gebe, die Verhalten verursachen sollen. Allerding führt der Mentalismus sehr leicht zu Pseudo-Erklärungen. So fragt man sich, wenn Meme Verhalten verursachen, was verursacht dann die Meme? Haben Meme wiederum Meme in sich? Das Problem des Homunculi tritt immer dann auf, wenn man Verhalten einem Teil – insbesondere einem verborgenen Teil – der Person zuschreibt, anstatt den Organismus als Ganzes zu betrachten.

Ad 2.
Wenn man dagegen Meme als neuronale Muster auffasst, müsste man zeigen, dass zwei Menschen, die die gleichen Meme haben, auch eine zumindest ähnliche neuronale Erregung zeigen. Außerdem stellt sich die Frage, wie in diesem Fall ein Mem von einer Person auf eine andere übertragen wird. Alles was wir sehen, ist, dass sich erst eine Person und dann eine andere Person auf eine bestimmte Weise verhält.

Ad 3.
Nur Verhalten, das die Umwelt beeinflusst, kann aufgrund seiner Konsequenzen selektiert werden. Eine kulturelle Praxis besteht aus einem bestimmten Verhalten und den Konsequenzen, die diese Verhalten hat, z. B. das Waschen von Lebensmitteln, was zu einer Vermeidung von Krankheiten führt. Oft wird die Konsequenz aber auch sozial vermittelt. Es gibt eine Regel („Wasche die Früchte, bevor du sie isst“), deren Befolgung durch die Zustimmung anderer Personen verstärkt wird.

Alles in allem erschöpft sich die Mem-Debatte in mehr oder weniger geistreichen Analogien. Verhalten kann durch die Annahme von Memen nicht besser vorhergesagt werden als durch die Analyse von Verhaltenskontingenzen.

Literatur

Blackmore, Susan J. (1997). The power of the meme meme. The Skeptic, 5, 43-49.

Blackmore, Susan J. (1999). The meme machine. New York: Oxford University Press.

Dawkins, R. (1976). The selfish gene. Oxford, New York: Oxford University Press.

Dennett, D. C. (1991). Real patterns. Journal of Philosophy, 88, 27-51.

Simon, C., & Baum, W. M. (2011). Expelling the meme-ghost from the machine. An evolutionary explanation for the spread of cultural practices. Behavior and Philosophy, 39/40, 127-144. http://www.behavior.org/resources/727.pdf

2 Kommentare

Eingeordnet unter Uncategorized