Statistik leichtgemacht
5. überarbeitete Auflage (Juli 2025) - Viele anschauliche Beispiele - nur 8,99 €
t-Test für abhängige Stichproben
Autor: Dr. Mathias Jesussek
Aktualisiert:
Was ist ein t-Test für abhängige Stichproben?
Ein t-Test für abhängige Stichproben (auch gepaarter t-Test genannt) prüft, ob sich zwei Messungen an denselben Personen/Objekten im Mittel unterscheiden.
Wann verwendet man ihn?
Immer dann, wenn die Werte paarweise zusammengehören, z. B.:
- Vorher und Nachher: Das Gewicht einer Gruppe vor einer Diät messen und dann erneut nach der Diät.
- Zwei Bedingungen: Testen, wie schnell dieselbe Personengruppe auf einen Reiz mit Kaffee und dann ohne Kaffee reagiert.
- Verwandte Paare: Vergleich der Meinungen von Ehemännern und Ehefrauen (die als Paar fest miteinander verbunden sind).
Die zentrale Frage dieses Tests lautet: Ist die durchschnittliche Veränderung, die wir in unserer Stichprobe sehen, stark genug, um auf einen echten Trend in der „echten Welt“ (Grundgesamtheit) hinzudeuten, oder ist sie nur das Ergebnis einer zufälligen Fluktuation?
Im Gegensatz zum t-Test für unabhängige Stichproben, bei dem du zwei völlig verschiedene Gruppen vergleichst (wie Männer vs. Frauen), konzentriert sich der abhängige t-Test auf Veränderungen innerhalb derselben Individuen.
Wofür brauchst du den gepaarten t-Test?
Du verwendest den t-Test für abhängige Stichproben immer dann, wenn du die exakt gleichen Personen zweimal misst – zum Beispiel in einer „Vorher-Nachher“-Studie.
Stell dir zum Beispiel vor, du möchtest wissen, ob ein neues Medikament den Blutdruck senkt. Da du nicht jeden Menschen messen kannst, der das Medikament weltweit einnimmt, ziehst du eine Stichprobe. Mit einem abhängigen t-Test kannst du dann darauf schließen, ob das Medikament in der echten Welt (Grundgesamtheit) eine Wirkung hat.
Der entscheidende Vorteil: Weniger Rauschen
Beim unabhängigen t-Test ist das „Rauschen“ (die zufällige Fluktuation) oft sehr hoch, weil jeder Mensch von Natur aus anders ist. Beim abhängigen t-Test werden diese individuellen Unterschiede herausgefiltert, da jede Person ihr eigener Vergleichswert (Baseline) ist. Das macht es viel einfacher, ein „Signal“ (einen echten Effekt) zu erkennen.
Was sind abhängige bzw. gepaarte Stichproben?
Bei abhängigen Stichproben liegen diese Messwerte in Paaren vor. Die Paare ergeben sich durch Messwiederholungen, Parallelisierung oder Matching. Dies kann etwa bei Längsschnittstudien mit mehreren Messzeitpunkten (Zeitreihenanalysen) oder bei Interventionsstudien mit experimentellen Designs (Vorher-Nachher-Messung) der Fall sein.
Ein Beispiel für abhängige Stichproben ist, wenn bei einer Gruppe von Personen zu zwei Zeitpunkten das Gewicht gemessen wird. Einer Person kann dann eindeutig ein Gewicht zum ersten und zum zweiten Messzeitpunkt zugeordnet werden und es kann jeweils die Differenz der Messwerte berechnet werden. Sollten mehr als zwei Messzeitpunkte vorliegen, wird die ANOVA mit Messwiederholung verwendet.
Was ist der Vorteil eines abhängigen t-Tests gegenüber einem unabhängigen t-Test?
Die Frage, ob ein abhängiger t-Test oder ein unabhängiger t-Test verwendet wird, wird natürlich schon im Rahmen des Studiendesigns festgelegt und es kann nicht willkürlich entweder der eine Test oder der andere verwendet werden. Daher ist eher die Frage, welche Art von Studie mehr Sinn macht:
- Eine Studie mit einer Gruppe von Teilnehmern durchzuführen, die zweimal gemessen werden.
- Eine Studie mit zwei getrennten Gruppen von Teilnehmern, die jeweils einmal gemessen werden.
Der große Vorteil eines Designs mit wiederholten Messungen, welches dann den abhängigen t-Test verwendet, besteht darin, dass die individuellen Unterschiede zwischen den Teilnehmern eliminiert werden können. Das bedeutet, dass die Wahrscheinlichkeit, einen (statistisch signifikanten) Unterschied festzustellen, wenn ein solcher vorhanden ist, mit dem abhängigen t-Test höher ist als mit dem unabhängigen t-Test.
Beispiel für den t-Test für gepaarte Stichproben
Der t-Test für abhängige Stichproben hat zahlreiche Anwendungsgebiete, hier drei Beispiele.
Medizinisches Beispiel:
In einem Pharmaunternehmen möchtest du prüfen, ob ein neues Medikament die Gedächtnisleistung erhöht. Hierzu bestimmst du die Gedächtnisleistung von 40 Probandinnen und Probanden bevor und nachdem sie das Medikament eingenommen haben.
Technisches Beispiel:
Eine Schraubenfabrik beklagt sehr hohe Stillstands-Zeiten bei ihren 5 Produktionsanlagen. Du möchtest nun herausfinden, ob ein neu eingeführtes Schmiermittel einen Einfluss auf die Stillstands-Zeiten hat. Hierfür vergleichst du die Stillstands-Zeiten der 5 Anlagen jeweils vor und nach der Einführung des neuen Schmiermittels.
Sozialwissenschaftliches Beispiel:
Du möchtest herausfinden, ob es zwischen 2010 und 2015 eine Veränderung in Bezug auf das Gesundheitsbewusstsein der deutschen Bevölkerung gibt. Hierfür könntest du beispielsweise auf Daten des Sozioökonomischen Panels (SOEP) zurückgreifen. Das SOEP ist eine repräsentative Wiederholungsbefragung von Privathaushalten in Deutschland. Es werden dabei stets dieselben Personen in regelmäßigen Abständen zu den gleichen Themen befragt. Um deine Fragestellung zu beantworten, vergleichst du das Gesundheitsbewusstsein der Befragten im Jahr 2010 und 2015.
Fragestellung und Hypothesen
Damit man einen t-Test für abhängige Stichproben berechnen kann, müssen zunächst eine Fragestellung und die Hypothesen definiert werden.
Fragestellung
Bei einem t-Test für abhängige Stichproben lautet die Fragestellung allgemein: Besteht ein statistisch signifikanter Unterschied zwischen dem Stichprobenmittelwert zweier abhängiger Gruppen?
Die Fragestellungen für die oberen Beispiele ergeben sich wie folgt:
- Hilft das neue Medikament, die Gedächtnisleistung zu erhöhen?
- Hat das neu eingeführte Schmiermittel einen Einfluss auf die Stillstands-Zeiten?
- Hat sich zwischen 2010 und 2015 das Gesundheitsbewusstsein der deutschen Bevölkerung verändert?
Hypothesen
Nun kann die Hypothese aus der Fragestellung abgeleitet werden. In der Hypothese wird eine vorläufige, also nicht gesicherte Annahme getroffen, die überprüft werden soll. Bei einem gepaarten t-Test lauten die Hypothesen:
- Nullhypothese H0: Die Mittelwerte der beiden abhängigen Gruppen sind gleich.
- Alternativhypothese H1: Die Mittelwerte der beiden abhängigen Gruppen unterscheiden sich.
Voraussetzungen t-Test für abhängige Stichproben
Natürlich müssen vor der Berechnung des abhängigen t-Tests noch die Voraussetzungen geprüft werden. Sind die im Folgenden beschriebenen Voraussetzungen 2. und 3. nicht erfüllt, muss der Wilcoxon-Test verwendet werden. Der Wilcoxon-Test ist das nichtparametrische Gegenstück zum gepaarten t-Test.
1. Es liegen zwei abhängige Gruppen bzw. Stichproben vor
Wie es der Name t-Test für abhängige Stichproben schon vorgibt, müssen die Gruppen abhängig sein, also ein Wert der einen Gruppe muss zu einem Wert der anderen Gruppe gehören.
- Von ein und derselben Person wird das Gewicht vor und nach einer Diät gemessen
- Es wird das Gewicht von Personen gemessen, die eine Diät gemacht haben und von Personen, die keine Diät gemacht haben.
2. Die Variablen müssen metrisch sein
Beim t-Test für abhängige Stichproben wird die Differenz von den beiden abhängigen Werten gebildet und dann der Mittelwert berechnet. Dies ist nur dann sinnvoll möglich, wenn die Werte metrisch sind.
- Das Gehalt einer Person (in Euro)
- Der Bildungsabschluss einer Person (Hauptschule, Realschule, ...).
3. Die Differenzen der gepaarten Werte sind normalverteilt
Die für den gepaarten t-Test benötigte Differenz zwischen den gepaarten Werten muss normalverteilt sein.
- Die Differenz des Gewichts einer Person zu zwei Zeitpunkten
- Die Differenz der Augenzahl nach dem Werfen von zwei Würfeln
Was macht der t-Test für abhängige Stichproben?
Beim abhängigen t-Test wird die Differenz von jedem gepaarten Fall berechnet. Von diesen Differenzen wird dann der Mittelwert berechnet. Je nachdem, wie groß der Mittelwert ist und wie groß der Standardfehler des Mittelwertes ist, wird dann eine Aussage getroffen wie wahrscheinlich es ist, dass dieses Ergebnis zufällig entstanden ist.
Hinweis!
Der t-Test für abhängige Stichproben ist dem t-Test für eine Stichprobe sehr ähnlich. Wir können uns den t-Test für abhängige Stichproben auch so vorstellen, dass wir eine Stichprobe haben, die zu zwei verschiedenen Zeitpunkten gemessen wurde. Wir berechnen dann die Differenz zwischen den gepaarten Werten und erhalten so einen Wert für eine Stichprobe.
Einmal erhalten wir -5, einmal +2, einmal -1 und so weiter. Nun wollen wir prüfen, ob der Mittelwert von der soeben berechneten Differenz zu einem Referenzwert abweicht. In diesem Fall Null. Und genau das macht der t-Test für eine Stichprobe.
t-Test für abhängige Stichproben berechnen
Zur Berechnung des t-Tests für abhängige Stichproben wird zunächst die Differenz von jedem Paar aus den beiden Gruppen gebildet. Von den resultierenden Differenzen wird dann der Mittelwert x̄diff berechnet.
Die Berechnung der Test-Statistik t ist nun genauso wie beim t-Test für eine Stichprobe. Wenn es keinen Unterschied zwischen den beiden Gruppen gibt, ist der Mittelwert der Differenz x̄diff gleich null. Daher ist die Frage: Gibt es einen Unterschied zwischen x̄diff und null? Die Test-Statistik t für den t-Test für abhängige Stichproben berechnet sich dann mit
wobei
der Standardfehler des Mittelwertes ist
-
= Differenz zwischen den Gruppen
-
= Mittelwert der Differenz der beiden Gruppen
-
= Stichprobengröße
-
= Standardabweichung
-
= geschätzter Standardfehler des Mittelwertes
Effektstärke abhängiger t-Test
Die Angabe von der Effektstärke ist sehr wichtig bei empirischen Studien. Um eine Aussage über die Effektstärke beim t-Test für abhängige Stichproben zu treffen, kann die folgende Formel verwendet werden
Generell lässt sich über die Effektstärke sagen:
- Effektstärke d: 0,2 kleiner Effekt
- Effektstärke d: 0,5 mittlerer Effekt
- Effektstärke d: 0,8 großer Effekt
Mit numiqo berechnen
Im Beispiel für den t-Test für abhängige Stichproben wird untersucht, ob die Sommerferien einen Einfluss auf die körperliche Fitness von Studierenden haben.
Die Fragestellung lautet also: Haben die Sommerferien einen Einfluss auf die körperliche Fitness von Statistik-Studierenden? Hierzu wird bei 10 Statistik-Studierenden ein Fitnesstest einmal vor und einmal nach den Ferien durchgeführt (2 Messzeitpunkte).
Nullhypothese H0
Die mittlere Differenz der Messwertpaare (vor und nach den Ferien) ist gleich Null. Die Semesterferien haben keinen Einfluss auf die körperliche Fitness der Studierenden.
Da nun immer zwei Testergebnisse von einem/r Studierenden stammen, gibt es eine Abhängigkeit zwischen den beiden Stichproben, die Werte liegen in Paaren vor. Daher wird der t-Test für abhängige Stichproben berechnet.
Die Tabelle der Testergebnisse sieht wie folgt aus:
| Statistik-Studierende | Punktezahl vor Ferien | Punktezahl nach Ferien |
|---|---|---|
| 1 | 60 | 61 |
| 2 | 70 | 71 |
| 3 | 40 | 38 |
| 4 | 41 | 39 |
| 5 | 40 | 38 |
| 6 | 40 | 33 |
| 7 | 45 | 55 |
| 8 | 48 | 56 |
| 9 | 30 | 38 |
| 10 | 50 | 68 |
Nachdem die obere Tabelle in den t-Test-Rechner kopiert worden ist, kannst du den gepaarten t-Test berechnen. Die Ergebnisse sehen folgendermaßen aus:
Statistiken
| n | Mittelwert | Standardabweichung | Standardfehler des Mittelwerts | |
| Punktezahl vor Ferien | 10 | 46,4 | 11,452 | 3,622 |
| Punktezahl nach Ferien | 10 | 49,7 | 14,095 | 4,457 |
Korrelation
| n | Korrelation | |
| vor Ferien - nach Ferien | 10 | 0,847 |
Abhängiger t-Test
| t | df | p | |
| Punktezahl vor Ferien Punktezahl nach Ferien |
-1,39 | 9 | 0,197 |
95 % Konfidenzintervall der Differenz
| Mittelwert | Standard- abweichung | Standardfehler des Mittelwerts | Untere Grenze | Obere Grenze | |
|---|---|---|---|---|---|
| Punktezahl vor Ferien Punktezahl nach Ferien |
-3,3 | 7,5 | 2,37 | -8,66 | 2,06 |
t-Test für abhängige Stichproben interpretieren
Wenn der berechnete p-Wert kleiner ist als das festgelegte Signifikanzniveau (meistens 5 %) ist, wird die Nullhypothese abgelehnt, ansonsten wird sie beibehalten. Für das obere Beispiel kannst du die Ergebnisse folgendermaßen berichten:
Die Punktezahl der Variable vor den Ferien hatte niedrigere Werte (M = 46,4, SD = 11,452) als die Punktezahl der Variable nach den Ferien (M = 49,7, SD = 14,095). Ein t-Test für abhängige Stichproben hat gezeigt, dass dieser Unterschied statistisch nicht signifikant gewesen ist, t(9) = -1,392, p = 0,197, 95 % Konfidenzintervall [-8,664, 2,064].
Es ergibt sich ein p-Wert von 0,197, der damit über dem festgelegten Signifikanzniveau von 0,05 liegt. Das t-Test-Ergebnis ist daher nicht signifikant und die Nullhypothese wird beibehalten. Somit wird davon ausgegangen, dass beide Stichproben aus der gleichen Grundgesamtheit stammen.
Statistik leichtgemacht
- Viele anschauliche Beispiele
- Ideal für Prüfungen und Abschlussarbeiten
- Statistik leichtgemacht auf 378 Seiten
- 5. überarbeitete Auflage (Juli 2025)
- Nur 8,99 €
"Super einfach geschrieben"
"Einfacher geht es nicht"
"Soviele hilfreiche Beispiele"
Fragebogen leichtgemacht
Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,
- Viele anschauliche Beispiele
- Ideal für die Abschlussarbeit
- Fragebogen leichtgemacht auf 61 Seiten
- 3. überarbeitete Auflage (April 2024)
- Nur 3,99 €
Statistik leichtgemacht
Endlich ohne Probleme Statistik verstehen.
Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.