Menu
numiqo
Statistik leichtgemacht

Statistik leichtgemacht

5. überarbeitete Auflage (Juli 2025) - Viele anschauliche Beispiele - nur 8,99 €

Leseprobe

t-Test

Autor: Dr. Mathias Jesussek
Aktualisiert:

Was ist ein t-Test?

Ein t-Test ist ein Werkzeug, das dir dabei hilft herauszufinden, ob der Unterschied, den du zwischen zwei Gruppen siehst, tatsächlich echt ist oder ob es sich nur um einen "Zufallstreffer" handelt, der durch pures Glück bei der Stichprobenziehung entstanden ist.

Es gibt drei Hauptvarianten des Tests, je nachdem, was du miteinander vergleichst:

  • Einstichproben-t-Test: Vergleicht den Mittelwert einer Gruppe mit einem bekannten Wert oder einem Standard.
  • Unabhängiger t-Test: Vergleicht die Mittelwerte von zwei völlig voneinander getrennten Gruppen, wie zum Beispiel eine Testgruppe gegenüber einer Kontrollgruppe.
  • Abhängiger t-Test (gepaart): Vergleicht Mittelwerte derselben Gruppe zu zwei verschiedenen Zeitpunkten, zum Beispiel "Vorher" vs. "Nachher" bei einer Untersuchung.

Wie funktioniert ein t-Test?

Ein t-Test prüft, ob sich zwei Mittelwerte wirklich unterscheiden. Dafür schaut er sich an:

  • Wie groß der Unterschied zwischen den Mittelwerten ist, und
  • wie stark die Werte in den Gruppen normalerweise schwanken (streuen).

Wenn der Unterschied groß ist und die Schwankungen relativ klein, spricht das dafür, dass der Unterschied nicht nur Zufall ist. Als Ergebnis erhält man einen p-Wert, der angibt, wie wahrscheinlich ein so großer Unterschied durch Zufall wäre, und oft zusätzlich ein Konfidenzintervall.

t-Test

Arten des t-Tests

Es gibt drei Varianten des t-Tests: t-Test für eine Stichprobe, t-Test für unabhängige Stichproben und t-Test für abhängige Stichproben.

Arten des t-Tests

t-Test für eine Stichprobe

Den t-Test für eine Stichprobe verwenden wir, wenn wir den Mittelwert einer Stichprobe mit einem bekannten Referenzwert vergleichen wollen.

t-Test für eine Stichprobe – Schema
Synonyme:
  • Einfacher t-Test
  • Einstichproben-t-Test
  • t-Test bei einer Stichprobe

Beispiel für einen Einstichproben t-Test

Ein Hersteller von Schokoriegeln behauptet, dass seine Schokoriegel im Mittel 50 Gramm wiegen. Um dies zu überprüfen, wird eine Stichprobe von 30 Riegeln genommen und gewogen. Der Mittelwert dieser Stichprobe liegt bei 48 Gramm.

Beispiel Einstichproben t-Test

Wir können nun einen t-Test für eine Stichprobe durchführen, um zu prüfen, ob der Mittelwert von 48 Gramm signifikant von den behaupteten 50 Gramm abweicht.

t-Test für unabhängige Stichproben

Den t-Test für unabhängige Stichproben verwenden wir, wenn wir die Mittelwerte von zwei unabhängigen Gruppen bzw. Stichproben vergleichen wollen. Wir möchten wissen, ob es einen signifikanten Unterschied zwischen diesen Mittelwerten gibt.

t-Test für unabhängige Stichproben
Synonyme:
  • Unabhängiger t-Test
  • Ungepaarter t-Test
  • Zweistichproben-t-Test

Beispiel eines t-Tests für unabhängige Stichproben

Wir möchten die Wirksamkeit von zwei Schmerzmitteln, Medikament A und Medikament B, vergleichen. Dazu teilen wir 60 Versuchspersonen nach dem Zufallsprinzip in zwei Gruppen ein. Die erste Gruppe erhält Medikament A, die zweite Gruppe erhält Medikament B.

Beispiel t-Tests für unabhängige Stichproben

Mit einem unabhängigen t-Test können wir nun prüfen, ob es einen signifikanten Unterschied in der Schmerzlinderung zwischen den beiden Medikamenten gibt.

t-Test für abhängige Stichproben

Den t-Test für abhängige Stichproben verwenden wir, um die Mittelwerte zweier abhängiger Gruppen zu vergleichen. Bei einer abhängigen Stichprobe (gepaarte Stichprobe) liegen die Messwerte paarweise vor. Die Paare entstehen z. B. durch wiederholte Messungen bei den gleichen Personen.

t-Test für abhängige Stichproben
Synonyme:
  • Gepaarter t-Test
  • Abhängiger t-Test
  • Verbundener t-Test

Beispiel für den t-Test bei abhängigen Stichproben

Wir wollen wissen, wie wirksam eine Diät ist. Dazu wiegen wir 30 Personen vor der Diät und genau die gleichen Personen nach der Diät.

Beispiel t-Tests für abhängige Stichproben

Nun können wir für jede Person sehen, wie groß der Gewichtsunterschied zwischen vorher und nachher ist. Mit einem abhängigen t-Test können wir nun prüfen, ob es einen signifikanten Unterschied gibt.

Hypothesen

Bevor wir den t-Test rechnen, stellen wir zwei gegensätzliche Behauptungen auf: die Nullhypothese (H0) und die Alternativhypothese (H1).

  • Nullhypothese: Es gibt keinen Unterschied. Jeder kleine Unterschied, den du in deinen Daten siehst, ist in der "echten Welt" nicht vorhanden und entstand nur durch Zufall.
  • Alternativhypothese: Sie ist das Gegenteil und behauptet, dass ein echter, systematischer Unterschied besteht, der über den bloßen Zufall hinausgeht.

1. t-Test für eine Stichprobe

Hier vergleichst du deine Daten mit einem festen Wert.

  • Nullhypothese: Dein Stichproben-Mittelwert entspricht genau dem Referenzwert. Es gibt keinen Unterschied zur Norm.
  • Alternativhypothese: Dein Mittelwert weicht signifikant vom Referenzwert ab. Es besteht ein echter Unterschied.

2. t-Test für unabhängige Stichproben

Hier vergleichst du zwei getrennte Gruppen (z. B. Männer vs. Frauen).

  • Nullhypothese: Die Mittelwerte beider Gruppen sind in der echten Welt (Population) gleich. Jeder beobachtete Unterschied ist nur reiner Zufall.
  • Alternativhypothese: Die Mittelwerte unterscheiden sich tatsächlich. Der Unterschied ist systematisch und kein Zufall.

3. t-Test für abhängige Stichproben

Hier vergleichst du dieselben Personen zu zwei Zeitpunkten (z. B. Vorher vs. Nachher).

  • Nullhypothese: Der Mittelwert der Unterschiede zwischen den Paaren ist Null.
  • Alternativhypothese: Der Mittelwert der Unterschiede zwischen den Paarungen ist ungleich Null.

Voraussetzungen für den t-Test

Damit die Ergebnisse deines t-Tests verlässlich sind und du von deiner Stichprobe sicher auf die "echte Welt" (Grundgesamtheit) schließen kannst, sollten folgende Bedingungen erfüllt sein:

1. Die passende Stichprobe: Je nach Fragestellung brauchst du das richtige Daten-Setup:

  • Einstichproben-t-Test: Eine Gruppe und ein fester Vergleichswert.
  • Unabhängiger t-Test: Zwei komplett getrennte Gruppen.
  • Abhängiger t-Test: Eine abhängige Stichprobe (z. B. dieselben Personen zweimal gemessen).

2. Metrisches Skalenniveau: Die untersuchten Merkmale sollten "messbar" (stetig) sein. Typische Beispiele sind Alter, Gewicht, Einkommen oder Reaktionszeit.

Voraussetzungen t-Test

3. Normalverteilung: Die Werte in der Grundgesamtheit sollten annähernd normalverteilt sein. Um Normalverteilung zu prüfen , kannst du den Shapiro-Wilk-Test nutzen oder dir ein Q-Q-Plot ansehen.

Hinweis: Bei großen Stichproben (meist n > 30) ist der t-Test sehr robust gegenüber Abweichungen von dieser Regel.

4. Varianzhomogenität (nur beim unabhängigen t-Test): Die Streuung in deinen beiden Gruppen sollte in etwa gleich groß sein. Man nennt das auch "Gleichheit der Varianzen". Ob das gegeben ist, zeigt dir der Levene-Test.

5. Zufallsauswahl: Die Datenpunkte sollten zufällig aus der Grundgesamtheit gezogen worden sein. Das stellt sicher, dass deine Stichprobe ein faires Abbild der Realität ist und nicht verzerrt wurde.

Warum brauchen wir einen t-Test?

Stell dir vor, wir haben eine Theorie:

„Es gibt einen Unterschied in der Studiendauer zwischen Männern und Frauen in Deutschland.“

Unsere Grundgesamtheit sind also alle Absolventen eines Studiums in Deutschland.

In einer perfekten Welt würden wir jeden einzelnen Absolventen in ganz Deutschland befragen. Da das aber unmöglich ist, ziehen wir eine kleinere Stichprobe, die stellvertretend für das ganze Land stehen soll.

t-Test Stichprobe

Jetzt kommt der entscheidende Punkt: Selbst wenn Männer und Frauen in ganz Deutschland im Durchschnitt exakt gleich lange studieren würden, wird deine spezifische Stichprobe fast nie einen Unterschied von genau Null zeigen.

Rein durch Zufall könnten die Männer, die du ausgewählt hast, ein klein wenig länger (oder kürzer) studiert haben als die Frauen in deiner Gruppe.

Woher wissen wir also, ob der Unterschied in unseren Daten ein „echter“ Trend in Deutschland ist oder nur ein Produkt des Zufalls in unserer Stichprobe?

Wofür braucht man einen t-Test

Genau hier kommt der t-Test ins Spiel. Er berechnet, wie wahrscheinlich es ist, dass der gefundene Unterschied oder ein größerer rein durch Zufall entstanden ist. Wenn diese Wahrscheinlichkeit sehr gering ist, liefert das eine starke Evidenz dafür, dass der Unterschied auch in der echten Welt existiert und nicht nur ein "Rauschen" in deiner Stichprobe ist.

t-Test berechnen

Um einen t-Test zu berechnen benötigen wir den t-Wert. Du kannst dir diesen Wert als das Verhältnis zwischen dem „Signal“ (dem Unterschied, den du gefunden hast) und dem „Rauschen“ (der zufälligen Streuung in deinen Daten) vorstellen.

Um diesen t-Wert zu bestimmen, brauchen wir zwei Bausteine:

  1. Das Signal: Der tatsächliche Unterschied zwischen den Mittelwerten.
  2. Das Rauschen: Der Standardfehler, der uns sagt, wie stark die Daten rein zufällig schwanken.
t-Wert berechnen

Einstichproben-t-Test

Beim t-Test für eine Stichprobe berechnen wir die Differenz zwischen dem Mittelwert der Stichprobe und dem bekannten Referenzwert. s ist die Standardabweichung der erhobenen Daten und n ist die Anzahl der Fälle.

t-Wert beim t-Test für eine Stichprobe

s durch die Wurzel aus n ist dann die Standardabweichung vom Mittelwert bzw. der Standardfehler.

t-Wert Standardfehler

t-Test für unabhängige Stichproben

Beim t-Test für unabhängige Stichproben wird die Differenz einfach aus der Differenz der beiden Stichprobenmittelwerte berechnet.

t-Wert beim t-Test unabhängige Stichproben

Für die Berechnung des Standardfehlers benötigen wir die Standardabweichung und die Fallzahl der ersten und der zweiten Stichprobe.

Je nachdem, ob wir für unsere Daten gleiche oder ungleiche Varianzen annehmen können, gibt es unterschiedliche Formeln für den Standardfehler. Mehr dazu im Tutorial über den t-Test für unabhängige Stichproben

t-Test für abhängige Stichproben

Bei einem t-Test für abhängige Stichproben brauchen wir nur die Differenz der gepaarten Werte zu berechnen und daraus den Mittelwert zu bilden. Der Standardfehler ist dann derselbe wie beim t-Test für eine Stichprobe.

t-Wert beim t-Test abhängige Stichproben Hier ist die Übersetzung ins Deutsche, die den Begriff „Kern“ (statt Herzstück) nutzt und die Metapher von Signal und Rauschen präzise einbettet.

t-Wert und p-Wert

Jetzt, wo du deinen t-Wert berechnet hast, bleibt eine letzte Frage: Ist dieser t-Wert „groß genug“, um bedeutend zu sein, oder ist er nur Hintergrundrauschen?

Es gibt zwei Wege, diese Entscheidung zu treffen:

1. Der moderne Weg: Der p-Wert

Dies ist die Methode, die von fast jeder modernen Software und in der Forschung verwendet wird. Anstatt in einer Tabelle nachzuschlagen, berechnet der Computer eine spezifische Wahrscheinlichkeit für dich: den p-Wert.

  • Der p-Wert gibt an, wie wahrscheinlich es ist, ein mindestens so extremes Ergebnis wie deines zu erhalten, wenn die Nullhypothese wahr wäre (d. h. wenn es in Wirklichkeit gar keinen Unterschied gäbe).
  • Die Regel: Wenn p < 0,05 ist, gilt das Ergebnis als „signifikant“. Dies bietet eine starke Evidenz dafür, dass der gefundene Effekt keine bloße zufällige Fluktuation ist, sondern in der echten Welt (Grundgesamtheit) existiert.

2. Der klassische Weg: Der kritische t-Wert

Dies ist der traditionelle Weg. Du vergleichst deinen berechneten t-Wert mit einem festen Schwellenwert, dem sogenannten kritischen t-Wert.

  • Wenn dein berechneter t-Wert höher ist als der kritische Wert, lehnst du die Nullhypothese ab.
  • Gut zu wissen: Da das Ablesen aus physischen Tabellen heute meist nur noch für Universitätsprüfungen relevant ist, haben wir einen separaten Deep-Dive für dich erstellt: Wie man die t-Verteilungstabelle liest.

Das Ergebnis bleibt gleich: Egal welchen Weg du wählst, sie führen immer zur gleichen Schlussfolgerung. Beide Methoden sind einfach unterschiedliche Arten, dieselbe Frage zu stellen: „Ist mein Signal stark genug, um ernst genommen zu werden?“

Was ist der p-Wert?

Der p-Wert beantwortet die Frage:

„Unter der Annahme, dass die Nullhypothese gilt: Wie wahrscheinlich ist es, ein Ergebnis zu beobachten, das mindestens so extrem ist wie das gemessene - allein durch Zufall?“

In einfachen Worten:

Stell dir vor, in der realen Welt gäbe es tatsächlich keinen Unterschied (die Nullhypothese stimmt) – zum Beispiel wirken zwei Medikamente gleich gut. Dann fragt der p-Wert: Wie wahrscheinlich ist es, dass ich trotzdem ein so deutliches (oder noch deutlicheres) Ergebnis sehe, nur durch Zufall?

  • Ein hoher p-Wert (z. B. 0,45): Bedeutet, dass dein Ergebnis völlig gewöhnlich ist, selbst wenn es gar keinen echten Effekt gibt. Das „Signal“ ist dann wahrscheinlich nur zufällige Fluktuation.
  • Ein niedriger p-Wert (z. B. 0,03): Bedeutet, dass dein Ergebnis sehr selten wäre, wenn es keinen echten Effekt gäbe. Das liefert starke Evidenz gegen die Nullhypothese.

Die 0,05-Schwelle

In den meisten wissenschaftlichen Disziplinen nutzen wir einen Schwellenwert von 0,05 (5 %).

  • Wenn p < 0,05: Wir nennen das Ergebnis „statistisch signifikant“. Wir lehnen die Nullhypothese ab und kommen zu dem Schluss, dass der Unterschied wahrscheinlich auch in der echten Welt (Grundgesamtheit) existiert.
  • Wenn p > 0,05: Wir können die Nullhypothese nicht ablehnen. Die Daten liefern nicht genug Beweiskraft, um den reinen Zufall als Ursache auszuschließen.

Wichtig zu merken: Der p-Wert ist kein „Beweis“ für die absolute Wahrheit. Er ist lediglich ein Werkzeug, das uns hilft zu entscheiden, ob unsere beobachteten Daten ungewöhnlich genug sind, um das „Signal“ ernst zu nehmen. Er hilft uns, die Grenze zwischen einem Zufallstreffer in unserer Stichprobe und einem verlässlichen Trend in der Bevölkerung zu ziehen.

Freiheitsgrade (df)

Die Freiheitsgrade geben dem t-Test im Wesentlichen an, wie viel „Information“ in deinen Daten steckt. In der Praxis gilt: Je weniger Personen du misst, desto wahrscheinlicher ist es, dass zufällige Schwankungen extreme Ergebnisse erzeugen. Die df passen die t-Verteilung entsprechend an:

Wie berechnet man df?

Die Berechnung hängt davon ab, welche Art von t-Test du verwendest:

t-Test Freiheitsgrade

Wobei n die Anzahl der Teilnehmenden in jeder Gruppe bzw. die Anzahl der Paare ist.

Kurz gesagt: Du kannst keinen p-Wert allein aus dem t-Wert bestimmen. Du brauchst immer die df, damit der Computer (oder die Tabelle) weiß, welche konkrete Variante der t-Verteilung verwendet werden muss.

Einseitige vs. Zweiseitige Tests

Bevor du deinen p-Wert berechnest, musst du entscheiden, in welche „Richtung“ du nach einem Signal suchst. In der Statistik nennt man das die Wahl zwischen einem einseitigen und einem zweiseitigen Test. Diese Entscheidung bezieht sich auf die „Enden“ (Tails) der t-Verteilungskurve, in denen die extremen Ergebnisse liegen.

1. Zweiseitiger Test (nicht gerichtet)

Das ist der Standard. Du verwendest ihn, wenn du wissen willst, ob es überhaupt irgendeinen Unterschied gibt – unabhängig davon, ob es eine Zunahme oder eine Abnahme ist.

  • Die Hypothese: „Verändert das neue Trainingsprogramm die Leistung?“ (Sie könnte besser oder schlechter werden).
  • Die Logik: Du suchst in beide Richtungen nach einem Signal. Weil du deine Aufmerksamkeit auf beide Enden der Verteilung aufteilst, ist die „Hürde“ für ein signifikantes Ergebnis schwerer zu erreichen.

2. Einseitiger Test (gerichtet)

Den nutzt du nur, wenn du eine Veränderung in genau eine Richtung erwartest und du dir zu 100 % sicher bist, dass die andere Richtung unmöglich oder irrelevant ist.

  • Die Hypothese: „Verbessert das neue Trainingsprogramm die Leistung gezielt?“
  • Die Logik: Du steckst deine gesamte „statistische Power“ in ein Ende der Verteilung. Dadurch wird es leichter, in genau dieser Richtung ein signifikantes Ergebnis zu finden – aber du ignorierst jedes Signal in die entgegengesetzte Richtung, selbst wenn es riesig ist!
Im Zweifel: zweiseitig!

In der realen Welt (Population) passieren Überraschungen. Wenn du mit einem einseitigen Test nach einer „Verbesserung“ suchst, die Ergebnisse aber tatsächlich einen starken „Rückgang“ zeigen, bleibt dein Test trotzdem „nicht signifikant“. Deshalb bevorzugen die meisten Wissenschaftler zweiseitige Tests: Sie sind ehrlicher, weil sie Veränderungen in beide Richtungen zulassen.

t-Test mit numiqo berechnen

Wenn du einen t-Test mit numiqo berechnen möchtest, musst du nur deine eigenen Daten in diese Tabelle kopieren, auf "Hypothesentest" klicken und dann die gewünschten Variablen auswählen.

t-Test online berechnen

Wenn du z. B. prüfen möchtest, ob das Geschlecht einen Einfluss auf das Einkommen hat, klickst du einfach beide Variablen an und es wird automatisch ein t-Test für unabhängige Stichproben berechnet. Unten kannst du dann den p-Wert ablesen.

t-Test Ergebnisse

Wenn du noch unsicher bist, wie du die Ergebnisse interpretieren sollst, kannst du einfach auf "Interpretation in Worten" klicken:

Ein zweiseitiger t-Test für unabhängige Stichproben (gleiche Varianzen angenommen) zeigte, dass der Unterschied zwischen Männlich und Weiblich in Bezug auf die abhängige Variable Einkommen statistisch nicht signifikant war, t(10) = -1,93, p = 0,082, 95 % Konfidenzintervall [-1399,36, 99,36]. Die Nullhypothese wird damit beibehalten.

Statistik leichtgemacht

  • Viele anschauliche Beispiele
  • Ideal für Prüfungen und Abschlussarbeiten
  • Statistik leichtgemacht auf 378 Seiten
  • 5. überarbeitete Auflage (Juli 2025)
  • Nur 8,99 €
Leseprobe
numiqo

"Super einfach geschrieben"

"Einfacher geht es nicht"

"Soviele hilfreiche Beispiele"

Fragebogen leichtgemacht

Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,

  • Viele anschauliche Beispiele
  • Ideal für die Abschlussarbeit
  • Fragebogen leichtgemacht auf 61 Seiten
  • 3. überarbeitete Auflage (April 2024)
  • Nur 3,99 €
Leseprobe
numiqo

Statistik leichtgemacht

Endlich ohne Probleme Statistik verstehen.

Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.

numiqo
Leseprobe

numiqo zitieren: numiqo Team (2026). numiqo: Online Statistics Calculator. numiqo e.U. Graz, Austria. URL https://numiqo.de

Kontakt & Support Coaching FAQ & About Us Statistik Software Minitab Alternative Minitab in Excel konvertieren SPSS in Excel konvertieren SPSS Alternative DATAtab wird zu numiqo AGB Impressum & Datenschutz