3 Schritte, wie man für die statistische Auswertung der Masterarbeit vorgeht

Gestern erhielt ich gleich drei Anrufe von Studienkolleginnen mit verschiedenen Fragen zur Masterarbeite. Darauf beschloss ich, ein paar Beiträge dem Vorgehen bei der Masterarbeit zu widmen. Heute geht es um die das Vorgehen für die statistische Auswertung.

Ich möchte vorab etwas wichtiges klären: Mein Wissen beschränkt sich auf die statistische Auswertung im Bereich Paarforschung/Sozial-, Organisations- und Wirtschaftspsychologie/Motivationspsychologie mit APIMoM.  Ich bin kein Statistikprofi. Die Statistiker am psychologischen Institut der UZH geben sich wirklich alle Mühe, uns Studierenden die Methoden verständlich zu vermitteln. Aber ich bin überzeugt: Wirklich verstehen was man da treibt tut man erst, wenn man mit seinen eigenen Daten arbeiten muss. Das wäre dann auch die gute Nachricht. Selbst Statistikdummys wie ich können das also lernen.

In diesem Beitrag geht es daher darum, wie du für die statistische Auswertung vorgehen kannst. Ich stelle keine spezifischen Methoden, dafür einige Beispiele vor.

1. Schritt: Passende Methodenseminare buchen

Im Masterstudium am Psychologischen Institut der Universität Zürich sind die FDI-Module für den Besuch von Statistikseminaren vorgesehen. Ich empfehle, erst ein Modul zur allgemeinen Datenbearbeitung und -analyse zu besuchen. Dort lernst du Basics wie das Recodieren von Items oder wie man Korrelationen berechnet. Anschliessend solltest du ein Seminar buchen, das die Methode für deine Hypothesen weiter vertieft. Du rechnest vielleicht mit hierarchischen Regressionen, Strukturgleichungsmodelle oder anderen wilden Sachen. Suche dir aus dem Angebot das passende Seminar und nimm dir die Zeit, den Stoff gut zu lernen. Sinnvollerweise besuchst du dieses zweite Modul, wenn du an der statistischen Auswertung deiner eigenen Daten bist. Dann kannst du im Notfall den Dozierenden fragen, wenn du auf grössere Probleme stösst. Nofalls besuche das Seminar ohne Leistungsnachweis im nächsten Semester nochmal. So vertiefst du dein Verständnis für die Methode und kannst weiterhin bei Problemen den Dozierenden ansprechen. Falls sie nicht das Gefühl haben, du seist ein fauler Sack und willst nicht selbst recherchieren, geben sie meist bereitwillig Lösungshinweise.

2. Auswertungsmethoden identifizieren

Die Auswertungsmethode hängt von verschiedenen Faktoren ab. Im besten Fall gibt dir dein Betreuer oder deine Betreuerin gewisse Methoden vor und du formulierst dann die Hypothesen entsprechend. Vielleicht formuliert ihr aber auch erst Hypothesen, und du musst dir dann selbst überlegen, wie du diese statistisch auswertest.

Korrelation, Regression, T-Test oder Varianzanalyse?

Die vier Begriffe da oben sind Chinesisch für dich? Keine Angst, gleich erfährst du mir. Denn zu deinen Hypothesen kannst du dir drei Fragen stellen, um die nötige Methode eingrenzen:

1. Frage: Besteht ein Zusammenhang zwischen X und Y?

Wenn X zunimmt, nimmt dann auch Y zu (positiver Zusammenhang)? Oder: Wenn X zunimmt, nimmt dann Y ab (negativer Zusammenhang)? Beispielsweise gehst du für deine Studie davon aus, wenn eine Person mehr depressive Symptome im Fragebogen BDI (Beck’s Depressionsinventar) ankreuzt (X), dass sie dann auch einen niedrigeren Wert in einem Lebenszufriedenheitsfragebogen angibt (Y). Du merkst übrigens schon, diese Zusammenhänge kann man in einem Koordinatenkreuz eintragen.

Wenn du von solch einem Zusammenhang ausgehst, dann wird eine Korrelation oder eine Regression gerechnet. Die Entscheidung, was verwendet wird, hängt ebenfalls von verschiedenen Faktoren ab. Zum einen gibt es statistische Voraussetzungen, die erfüllt sein müssen, um eine Regression rechnen zu dürfen. Zum anderen müssen die Annahmen zu den Zusammenhängen aus der bestehenden Literatur berücksichtigt werden. Bei Forschung zu Themen, zu denen in der Literatur wenig Theorie zu finden ist, wird meist eine Korrelation verwendet. Um herauszufinden, ob doch eine Regression gerechtfertigt wäre, kannst du dir die zweite Frage stellen.

2. Frage: Besteht ein gerichteter Zusammenhang zwischen A und B?

Regressionen gehen von einer Wirkungsrichtung (Kausalität) von X auf Y aus. Korrelationen stellen nur einen Zusammenhang fest, es ist also unklar, ob X auf Y wirkt oder Y auf X.

Beim Beispiel mit den Depressionssymptomen kannst du dich fragen, ob die Person mehr Symptome haben und deshalb weniger Lebenszufriedenheit empfindet, oder ob die niedrige Lebenszufriedenheit dazu führt, dass sie mehr Symptome entwickeln. Hier macht eine Wirkungsrichtung (Symptome auf Zufriedenheit) Sinn. In der Literatur wird sicher auch eine klare Wirkungsrichtung angenommen, daher kann eine Regression gerechnet werden.

3. Frage: Werden Gruppen verglichen?

Wenn die 1. und 2. Frage irgendwie nicht zu deiner Hypothese passt, machst du vermutlich einen Gruppenvergleich. Für zwei Gruppen werden T-Tests eingesetzt, für mehr als zwei Gruppen Varianzanalysen gerechnet.

Beispielsweise interessiert dich, wieviele Depressionssymptome Leute mit einer diagnostizierten Depression im Unterschied zu gesunden Probanden ankreuzen. Für diese Fragestellung könntest du einen T-Test machen. Gruppenvergleiche sollen immer die Frage beantworten, ob sich die untersuchten Gruppen signifikant unterscheiden, oder ob sich die Werte nur per Zufall unterscheiden.

Welche Methode genau?

Bei Regressionen und Varianzanalysen gibt es viele Varianten, univariat, multivariat, mit Kontrollvariablen und vielem mehr. Um die Art der Analyse weiter einzugrenzen, schnappst du dir nun ein Statistikbuch, am besten Discovering Statistics Using SPSS oder Discovering Statistics Using R von Andy Field. Er erklärt mit Einstiegsgeschichten, welche Fragestellungen mit ANOVA, MANOVA, ANCOVA und Co. genau auswertet werden. Die 4. Auflage kenne ich nicht, in der 3. SPSS-Auflage sind auch Screenshots drin, welche Einstellungen man für SPSS machen muss. Ich lese jeweils die Einführungsbeispiele um herauszufinden, ob die Methode zu meiner Fragestellung passt. Dann überspringe ich die Theorie und blättere weiter zu den Screenshots und der anschliessenden Erklärung der Outputs. Je nach deiner Auswertungsmethode musst du nun auch weitere Fachliteratur lesen. Frag am besten deine Betreuerin/deinen Betreuer oder deinen Statistikdozierenden nach einem guten Buch.

Übrigens: Korrelationen und Gruppenvergleiche sind vermutlich Bestandteil aller Masterarbeiten (ich habe nur einige wenige gesehen, darum formuliere ich meine Aussage zurückhaltend). Die Korrelationsanalyse nimmt eigentlich die Resultate der Regressionsberechnung voraus. Die meisten Studien berichten daher für die Hauptvariablen Korrelationen. Gruppenvergleiche kommen auch bei den demographischen Daten vor. Nehmen wir wieder das Beispiel: Du machst eine Intervention mit depressiven Personen und einer Kontrollgruppe. Dafür musst du ja nicht nur sicher gehen, dass die Personen vor und nach der Intervention signifikant unterschiedlich viele Depressionssymptome ankreuzen. Du musst auch aufzeigen, dass Depressive und Kontrollpersonen signifikant unterschiedlich viele Symptome berichten.

3. Schritt: Rechenplan und die Auseinandersetzung mit anderen Studien

Nachdem du durch die drei Grundfragen und die Lektüre vom Andy Field eingegrenzt hast, welche Auswertungsmethoden du verwenden musst, kannst du einen Rechenplan aufsetzen. Darin steht, für welche Hypothese du welche Methode einsetzt, welche Grund- und Zusatzfragen du rechnest und in welchem zeitlichen Rahmen. Unter Grundberechnungen verstehe ich alles rund um die demographischen Daten, die man ja im Methodenteil bereits berichten muss. Also die Anzahl Studienteilnehmende, Geschlechterverhältnis etc. Eine Zusatzberechnung könnte zum Beispiel eine Faktorenanalyse eines Fragebogens sein, wenn der abgeändert wurde und die Hypothesenberechnungen nur schwache Effekte zeigen.

Für diesen Schritt musst du dich nun intensiv mit einigen Papern auseinandersetzen.  Suche dir zwei, drei Studien, die deiner Fragestellung nahe kommen oder die gleiche Auswertungsmethode verwenden. Lies den Methoden- und den Ergebnisteil sehr genau durch. Dort findest du Hinweise, welche Fachliteratur du lesen musst, wie du deine Ergebnisse präsentierst und welche Grund- und Zusatzberechnungen du berichten könntest.

Beispiel: Meine Masterarbeit

Damit du dir unter diesen Schritten etwas konkretes vorstellen kannst, hier ein Beispiel. Ich hatte für meine Masterarbeit im Bereich Paarforschung zwei Hypothesen:

  1. Erfolgreiches Zielgelingen erhöht die Partnerschaftszufriedenheit.
  2. Dieser Zusammenhang wird durch das passende implizite Motiv moderiert (das Motiv verstärkt oder schwächt den Zusammenhang aus H1).

(Das ist jetzt sehr vereinfacht beschrieben, soll aber nur ein Beispiel sein.) Für H1 rechnete ich eine Regression, es besteht ja eine Wirkungsrichtung. H2 erwähne ich nur, weil das implizite Motiv recht aufwändig vorzubereiten war.

Aufbereitung/Korrektur von Variablen: In der Literatur zu impliziten Motiven stand, dass die Anzahl Motive vom Umfang des Textes abhängig ist. Also je mehr Text jemand schreibt, desto mehr Motive lassen sich im Text finden. Das muss korrigiert werden, wofür es zwei Methoden gibt. Ich suchte also eine Studie, die mit impliziten Motiven arbeitete. Darin stand, die impliziten Motive wurden nach Methode XYZ korrigiert, dahinter eine Quellenangabe. Ich suchte im Literaturverzeichnis den Titel des Papers, suchte es in der Datenbank und las nach, wie die Korrektur genau gemacht werden muss.

Grundberechnungen: Für den Methodenteil fand ich in einer weiteren Studie, dass die Anzahl der Motive von Frauen und Männern mittels T-Test verglichen wurde. Die Literatur bereichtet nämlich, dass bei Frauen meist mehr implizite Motive zu finden sind, auch nach der Korrektur. Das übernahm ich ebenfalls. Ausserdem habe ich mich an mehreren Studien orientiert, wie ich die Stichprobe am Anfang des Methodenteils beschrieb. Also Anzahl der Paare, Altersdurchschnitt Frauen und Männer, wieviele haben Kinder, wie ist das Bildungsniveau. Hier musst du dich auch immer selbst fragen, was sinnvoll ist. Welche Informationen brauchen die Fachleser deiner Masterarbeit, um sich eine Vorstellung von deiner Stichprobe machen zu können? Welche Informationen über die Versuchspersonen fändest du interessant, wenn deine Masterarbeit ein Paper wäre, das du lesen müsstest?

Darstellung der Ergebnisse: Schliesslich hatte ich eine Menge Outputs von den Statistikprogrammen. Erst blätterte ich durch ein APA-Manual für die Grundlagen, sprich welche Buchstaben sind kursiv zu formatieren, welche nicht. Dann orientierte mich für die Darstellung der Befunde wieder an den Studien.

Zusatzberechnungen: Die Zusatzberechnungen ergaben sich durch die Ergebnisse zu den Hypothesen. Einer meiner Fragebogen war für die Studie umformuliert worden, für meine Masterarbeit führte ich deshalb eine Faktorenanalyse durch. So wollte ich sicher gehen, dass die Gütekriterien auch für die umformulierte Variante ausreichend waren. Der Nachteil: Ich musste nochmal neue Methodenliteratur lesen, wie man eine Faktorenanalyse genau macht und darstellt.

Fragen?

Das wäre ungefähr das, was ich meinen Kolleginnen und Kollegen erzählte. Ich hoffe, der Artikel ist soweit verständlich und hilfreich. Falls du Fragen hast, schreib doch einen Kommentar. Ich bin gerne bereit, den Artikel bei Bedarf zu ergänzen, wenn etwas unklar ist. Falls du eine Hypothese hast, bei der du trotz der drei Fragen nicht das passende Auswertungsverfahren identifizieren kannst, schreibe sie ebenfalls ins Kommentarfeld. Manchmal muss die Hypothese auch umgeschrieben werden, um sie genauer zu formulieren. Ich bin kein Profi, werde aber mein Bestes geben, um dich zu unterstützen.


Hast du einen Themenwunsch für dieses Blog? Schreib ihn doch ins Kommentarfeld, ich freue mich über Themenvorschläge.

 

 

Trackback von deiner Website.

Kommentare (4)

  • Avatar

    Vanessa

    |

    Wirklich guter Beitrag, insbesondere wenn man erst mal „wieder rein kommen muss“. Ich muss bspw. noch lange vor meiner Masterarbeiter im ersten Trimester eine Hausarbeit in dem Bereich quantitativer Forschung abgeben und ich tue mich gerade schwer den richtigen Start zu finden. Insbesondere, weil wir nur 20 Seiten abgeben und eine Interpretation eines Fragebogens inkl. der wissenschaftlichen Norm (wieso, weshalb, warum habe ich dies das jenes genommen) dann schon knapp werden könnte. Die Hausarbeit wird dann sozusagen wie ein Teilausschnitt einer Masterarbeit. Die Kunst wird wahrscheinlich werden das Ganze „rund“ zu machen ohne unnötig viel zu schreiben, was nicht relevant ist. Bin nämlich ähnlich perfektionistisch verananlagt 🙂 jedenfalls war dieser Beitrag für mich schon mal hilfreich eine erste Sortierung im Kopf vorzunehmen.

    Reply

    • Avatar

      Nic

      |

      Liebe Vanessa
      Vielen Dank für deine nette Rückmeldung. Es freut mich sehr, dass dir der Artikel bei einer ersten Sortierung im Kopf geholfen hat. Die Beschränkung auf das Wesentliche und die Information trotzdem ansprechend zu präsentieren, ist auch für mich immer wieder eine grosse Herausforderung. Vor allem, weil ich im Alltag beim Erzählen gerne abschweife und erst nach zehn nicht minderwichtigen Umwegen auf den Punkt komme. 🙂 Viel Erfolg für deine Hausarbeit!

      Reply

  • Avatar

    D

    |

    Das erste Mal, dass ich eine deutliche Vorstellung davon hatte, wann ich nach einer Korrelation bzw. Regression schaue oder einen t-Test verwende. Vielen, vielen Dank!

    Reply

    • Avatar

      Nic

      |

      Vielen Dank für deine Nachricht. Alleine dafür hat es sich gelohnt, den langen Artikel zu schreiben 🙂
      Viel Erfolg mit deiner Arbeit!

      Reply

Kommentieren