Quantilberechnung

Quantile sind wichtige Lagemaße, die die Verteilung der Daten beschreiben:

# Manuelle Berechnung des 0.025 und 0.975 Quantils
# 1) Daten sortieren
sorted_alter <- sort(df$Alter)
n <- length(sorted_alter)

# 2) Position der Quantile berechnen
p025 <- ceiling(n * 0.025)
p975 <- ceiling(n * 0.975)

# 3) Werte an den Positionen extrahieren
q025_manual <- sorted_alter[p025]
q975_manual <- sorted_alter[p975]

# Alternative: R-Funktion nutzen
quantile(df$Alter, probs = c(0.025, 0.975))
 2.5% 97.5% 
   17    29 

Vergleich der Berechnungsmethoden

Die manuelle Berechnung und die R-Funktion können leicht unterschiedliche Ergebnisse liefern, da die R-Funktion verschiedene Interpolationsmethoden verwendet, während unsere manuelle Methode die empirische Verteilung direkt nutzt.

Erweitern der Ergebnistabelle mit Quantilen

# Quantile einzeln berechnen und in Tabellenformat bringen
q025Tab <- df %>% summarise(across(c(Alter, groesse_m), \(x) quantile(x, 0.025, na.rm = TRUE))) %>% mutate(Parameter = "Q0.025")
q975Tab <- df %>% summarise(across(c(Alter, groesse_m), \(x) quantile(x, 0.975, na.rm = TRUE))) %>% mutate(Parameter = "Q0.975")

# Zu einer Tabelle kombinieren
quantile_results <- rbind(q025Tab, q975Tab)
quantile_results
  Alter groesse_m Parameter
1    17    1.6175    Q0.025
2    29    1.9325    Q0.975

Weitere wichtige Quantile

# Quartile einzeln berechnen
q1Tab <- df %>% summarise(across(c(Alter, groesse_m), \(x) quantile(x, 0.25, na.rm = TRUE))) %>% mutate(Parameter = "Q1")
medianTab <- df %>% summarise(across(c(Alter, groesse_m), \(x) median(x, na.rm = TRUE))) %>% mutate(Parameter = "Median")
q3Tab <- df %>% summarise(across(c(Alter, groesse_m), \(x) quantile(x, 0.75, na.rm = TRUE))) %>% mutate(Parameter = "Q3")

# Alle Quartile zu einer Tabelle kombinieren
quartile_stats <- rbind(q1Tab, medianTab, q3Tab)
quartile_stats
  Alter groesse_m Parameter
1    19     1.675        Q1
2    22     1.720    Median
3    25     1.840        Q3
# Diese können auch mit den anderen Quantilen kombiniert werden:
alle_quantile <- rbind(quantile_results, quartile_stats)
alle_quantile
  Alter groesse_m Parameter
1    17    1.6175    Q0.025
2    29    1.9325    Q0.975
3    19    1.6750        Q1
4    22    1.7200    Median
5    25    1.8400        Q3

Diese Quantile sind besonders wichtig für die Erstellung von Boxplots und das Verständnis der Datenverteilung.