Code Beispiele für Woche 6

Die t-Verteilung und ihre Bedeutung

Die t-Verteilung ist fundamental für die Schätzung von Mittelwerten aus Stichproben. Ihre Bedeutung erschließt sich aus folgenden Kernaspekten:

Grundlegende Konzepte:

Erwartungstreue:
- Mittelwertschätzer stimmen nicht exakt mit dem wahren Wert überein
- Nur bei wiederholter Stichprobenziehung wird im Mittel der wahre Wert getroffen
- Diese Unsicherheit wird durch den Standardfehler quantifiziert
Standardfehler des Mittelwertschätzers:
- Berechnet sich als s/√n
- s ist die Standardabweichung der Stichprobe
- n ist der Stichprobenumfang
- Je größer n und je kleiner s, desto präziser die Schätzung
Voraussetzungen:
- Die Grundgesamtheit muss normalverteilt sein
- Die standardisierte Differenz zwischen Schätzer und wahrem Mittelwert folgt der t-Verteilung
- Dies gilt für wiederholtes Stichprobenziehen

Eigenschaften der t-Verteilung:

Symmetrisch um den Mittelwert 0
Form abhängig von Freiheitsgraden (n-1)
Nähert sich mit steigenden Freiheitsgraden der Standardnormalverteilung an
Breiter als die Normalverteilung bei kleinen Stichproben
Berücksichtigt zusätzliche Unsicherheit durch Schätzung der Populationsstandardabweichung

Praktische Bedeutung:

Ermöglicht die Konstruktion von Konfidenzintervallen
Grundlage für verschiedene statistische Tests
Basis für weiterführende statistische Verfahren wie Regressionsanalysen

Berechnung von Mittelwertschätzer, Standardfehler und Konfidenzintervall

Mittelwertschätzer

Der Mittelwertschätzer ist der Durchschnittswert einer Stichprobe.

# Für Mittelwertberechnungen:
# mean()
# Beachten Sie die Behandlung fehlender Werte mit na.rm

Standardfehler des Mittelwertschätzers

Der Standardfehler des Mittelwerts misst, wie genau der Mittelwert der Stichprobe den tatsächlichen Populationsmittelwert schätzt.

# Standardfehler = Standardabweichung / √(Stichprobengröße)
# Benötigte R-Funktionen: sd(), sqrt(), sum(), is.na()

95%-Konfidenzintervall

Das 95%-Konfidenzintervall gibt einen Bereich an, in dem der wahre Mittelwert der Population mit einer Wahrscheinlichkeit von 95% liegt. Die qt() Funktion in R wird verwendet, um den Quantilswert der t-Verteilung zu bestimmen.

# Benötigte Elemente:
# 1. Freiheitsgrade (n-1)
# 2. t-Wert (qt-Funktion)
# 3. Standardfehler
# 4. Mittelwert