Flugzeug stürzt nur mit 90% Wahrscheinlichkeit nicht ab (Hypothesentests)

| Back to Overview

Statistische Test

Seien f0,f1f_0, f_1 zwei mögliche Verteilungen für die Daten XX. Das ist das Testproblem, ob Xf0X \sim f_0 oder Xf1X \sim f_1.

Es wird die Nullhypothese H0:f=f0H_0: f = f_0 gegen die Alternativhypothese H1:f=f1H_1: f = f_1 getestet.

Ein Test ist dann eine Entscheidungsregel, die basiert auf der gegebenen Statistik T(X1,...,Xn)T(X_1, ..., X_n) (Statistik war einfach nur eine Funktion von den Daten) die entweder H0H_0 oder H1H_1 akzeptiert.

Fehlertypen

Es gibt nun folgende Fehlertypen:

H0H_0 richtigH1H_1 richtig
H0H_0KorrektFehler 2. Art
H1H_1Fehler 1. ArtKorrekt

Signifikanzniveau & Schärfe

Das Signifikanzniveau α\alpha ist die Wahrscheinlichkeit für einen Fehler 1. Art, also PH0("H1")aP_{H_0}("H_1") \le a.

Die Schärfe 1β 1 - \beta ist die Gegenwahrscheinlichkeit für einen Fehler 2. Art, also PH1("H0")βP_{H_1}("H_0") \le \beta.

H0H_0 richtigH1H_1 richtig
H0H_0Korrekt: 1α1-\alphaFehler 2. Art: β\beta
H1H_1Fehler 1. Art: α\alphaKorrekt: 1β1-\beta (Schärfe)

Hypothesen

Da man meistens nicht nur zwei Verteilungen gegenüberstellen möchte, sondern Einhalten von Grenzwerten testen möchte, gibt es folgende Hypothesen:

  • H0:μμ0H_0: \mu \le \mu_0 gegen H1:μ>μ0H_1: \mu > \mu_0 (rechtsseitiger Test)
  • H0:μμ0H_0: \mu \ge \mu_0 gegen H1:μ<μ0H_1: \mu < \mu_0 (linksseitiger Test)
  • H0:μ=μ0H_0: \mu = \mu_0 gegen H1:μμ0H_1: \mu \ne \mu_0 (zweiseitiger Test)

t-Test

Gegeben sei eine Stichprobe X1,...,XnX_1, ..., X_n mit XiN(μ,σ2)X_i \sim N(\mu, \sigma^2) mit unbekannter Varianz σ2\sigma^2. Ersetzte nun σ2\sigma^2 durch die Stichprobenvarianz S2S^2 und definiere die Teststatistik T=nXμ0ST = \sqrt{n}\frac{\overline{X} - \mu_0}{S} somit Ttn1T \sim t_{n-1}.

Tests:

  • verwerfe H0:μμ0H_0: \mu \le \mu_0 gegen H1:μ>μ0H_1: \mu > \mu_0 wenn: T>t(n1)1αT > t(n-1)_{1-\alpha}
  • verwerfe H0:μμ0H_0: \mu \ge \mu_0 gegen H1:μ<μ0H_1: \mu < \mu_0 wenn: T<t(n1)1α=t(n1)αT < -t(n-1)_{1-\alpha} = t(n-1)_\alpha
  • verwerfe H0:μ=μ0H_0: \mu = \mu_0 gegen H1:μμ0H_1: \mu \ne \mu_0 wenn: T>t(n1)1α2|T| > t(n-1)_{1-\frac{\alpha}{2}}

Beispiel aus der Vorlesung:

Die Schätzung der mittleren Ozonkonzentration während der Sommermonate ergaben für eine Großstadt anhand von n=26n = 26 Messungen den Mittelwert xn\overline{x}_n = 244 und die Stichproben-Standardabweichung s=5.1s = 5.1 (jeweils in μgm3\frac{\mu g}{m^3} ). Der im Ozongesetz von 1995 festgelegte verbindliche Alarmwert beträgt 240μgm3240 \frac{\mu g}{m^3} . Kann das gemessene Ergebnis als signifikante Überschreitung des Warnwerts gewertet werden zum Signifikanzniveau α=0.01\alpha = 0.01?

pp-Wert

Guckt sich an, wie wahrscheinlich es ist, dass bei einer Wiederholung ein Wert entsteht, der noch mehr gegen H0H_0 spricht als tobst_{obs}

Gütefunktionen & 2-Stichproben-Tests

Kein Bock darauf. Vielleicht später

Binomial-Test

X1,...,XnFX_1, ..., X_n \sim F F besitzt eindeutigen Median mm und F(m)=0.5F(m) = 0.5.

  • H0:mm0H_0: m \ge m_0 gegen H1:m<m0H_1: m < m_0 (linksseitiger Test)
  • H0:mm0H_0: m \le m_0 gegen H1:m>m0H_1: m > m_0 (rechtsseitiger Test)

Dies lässt sich zurückführen auf den Binomial-Test:

YBin(n,p)p=P(Y1>m0)Y \sim Bin(n,p) \quad p = P(Y_1 > m_0)

Bzw.

  • H0:p=p0H_0: p = p_0 gegen H1:pp0H_1: p \ne p_0
  • H0:pp0H_0: p \le p_0 gegen H1:p>p0H_1: p > p_0

Teststatistik: T=Ynp0np0(1p0)N(0,1)T = \frac{Y - np_0}{\sqrt{np_0(1-p_0)}} \sim N(0,1)

  • Lehne H0:pp0H_0: p \le p_0 ab, falls T>z1αT > z_{1-\alpha}
  • Lehne H0:pp0H_0: p \ge p_0 ab wenn T<zαT < z_\alpha
  • Lehne H0:p=p0H_0: p = p_0 ab wenn T>z1α2|T| > z_{1-\frac{\alpha}{2}}

Hierbei ist z1αz_{1-\alpha} das (1α)(1-\alpha)-Quantil der Standardnormalverteilung.

Regression und Lineare Regression

Was ist das?

\uparrow Das erster sinnvolle Bild auf tenor.com.

Also es geht um eine Menge von Werten z.B. produzierte Bauteile die von einer anderen Sachen abhängen. Soweit so einfach. In unserem Beispiel braucht Helmut, durchschnittlich über eine eine Woche, 55 Minuten um ein Laufrohr eines Kampfpanzers Leopard 2A8 zu produzieren.

Nun sollen wir eine Gerade f^(t)=a^+b^t\hat{f}(t) = \hat{a} + \hat{b}t finden, die in Abhängigkeit von der benötigten Zeit tt die Anzahl produzierter Laufrohre f(t)f(t) schätzt.

Wie findet man nun a^\hat{a} und b^\hat{b}?: Das gängigste ist die Methode der kleinsten Quadrate.

Q(a,b)=i=1n(yi(a+bti))2Q(a,b) = \sum_{i=1}^n (y_i - (a + bt_i))^2 soll minimal werden.

Das heißt b^=sxysx2\hat{b} = \frac{s_{xy}}{s_x^2} und a^=yb^x\hat{a} = \overline{y} - \hat{b}\overline{x} Hier ist sxy,sys_{xy}, s_{y} natürlich die Stichproben-Varianz