Code Beispiele für Woche 6

Die t-Verteilung und ihre Bedeutung

Die t-Verteilung ist fundamental für die Schätzung von Mittelwerten aus Stichproben. Ihre Bedeutung erschließt sich aus folgenden Kernaspekten:

Grundlegende Konzepte:

  1. Erwartungstreue:
    • Mittelwertschätzer stimmen nicht exakt mit dem wahren Wert überein
    • Nur bei wiederholter Stichprobenziehung wird im Mittel der wahre Wert getroffen
    • Diese Unsicherheit wird durch den Standardfehler quantifiziert
  2. Standardfehler des Mittelwertschätzers:
    • Berechnet sich als s/√n
    • s ist die Standardabweichung der Stichprobe
    • n ist der Stichprobenumfang
    • Je größer n und je kleiner s, desto präziser die Schätzung
  3. Voraussetzungen:
    • Die Grundgesamtheit muss normalverteilt sein
    • Die standardisierte Differenz zwischen Schätzer und wahrem Mittelwert folgt der t-Verteilung
    • Dies gilt für wiederholtes Stichprobenziehen

Eigenschaften der t-Verteilung:

  • Symmetrisch um den Mittelwert 0
  • Form abhängig von Freiheitsgraden (n-1)
  • Nähert sich mit steigenden Freiheitsgraden der Standardnormalverteilung an
  • Breiter als die Normalverteilung bei kleinen Stichproben
  • Berücksichtigt zusätzliche Unsicherheit durch Schätzung der Populationsstandardabweichung

Praktische Bedeutung:

  • Ermöglicht die Konstruktion von Konfidenzintervallen
  • Grundlage für verschiedene statistische Tests
  • Basis für weiterführende statistische Verfahren wie Regressionsanalysen

Berechnung von Mittelwertschätzer, Standardfehler und Konfidenzintervall

Mittelwertschätzer

Der Mittelwertschätzer ist der Durchschnittswert einer Stichprobe.

# Für Mittelwertberechnungen:
# mean()
# Beachten Sie die Behandlung fehlender Werte mit na.rm

Standardfehler des Mittelwertschätzers

Der Standardfehler des Mittelwerts misst, wie genau der Mittelwert der Stichprobe den tatsächlichen Populationsmittelwert schätzt.

# Standardfehler = Standardabweichung / √(Stichprobengröße)
# Benötigte R-Funktionen: sd(), sqrt(), sum(), is.na()

95%-Konfidenzintervall

Das 95%-Konfidenzintervall gibt einen Bereich an, in dem der wahre Mittelwert der Population mit einer Wahrscheinlichkeit von 95% liegt. Die qt() Funktion in R wird verwendet, um den Quantilswert der t-Verteilung zu bestimmen.

# Benötigte Elemente:
# 1. Freiheitsgrade (n-1)
# 2. t-Wert (qt-Funktion)
# 3. Standardfehler
# 4. Mittelwert