Vectoorrrrr (Zufallsvektoren)

| Back to Overview

Zufallsvektoren

Es wird noch viel besser.

Im Grunde sind Zufallsvektoren einfach nur mehrdimensionale Zufallsvariablen. Also

X:ΩRn,wX(w)=(X1(w),...,Xn(w))X: \Omega \to \mathbb{R}^n, \quad w \mapsto X(w) = (X_1(w), ..., X_n(w))

Ich schreibe hier jetzt XX für einen Vektor. Auch hierfür gibt es natürlich Verteilungen, Erwartungswerte etc.

Verteilung: PX(A)=P(XA)P_X(A) = P(X \in A). Wenn XRnX \in \mathbb{R}^n dann ist die Verteilungsfunktion so: F(x1,...,xn)=P(X1x1,...,XNxn)F(x_1, ..., x_n) = P(X_1 \le x_1, ..., X_N \le x_n) Die Eigenschaften der Verteilungsfunktion sind gleich zu den eindimensionalen nur halt eben für Vektoren.

  • Produktverteilung: XiFi(x)F(x1,...,xn)=F1(x1)...Fn(xn)X_i \sim F_i(x) F(x_1, ..., x_n) = F_1(x_1) \cdot ... \cdot F_n(x_n) Hier sind alle X1,...,XnX_1, ..., X_n stoch. unabhängig.

Diskrete Zufallsvektoren

Auch hier gibt es wieder eine Zähldichte/Wahrscheinlichkeitsfunktion: pX:Rn[0,1],pX(x)=P(X=x)p_X: \mathbb{R}^n \to [0,1], p_X(x) = P(X = x)

Produktzähldichte: Sind p1(x),...,pn(x)p_1(x), ..., p_n(x) Zähldichten, dann ist: p(x1,...,xn)=p(x1)...p(xn)p(x_1, ..., x_n) = p(x_1) \cdot ... \cdot p(x_n)

Stetige Zufallsvektoren

Die werden sehr schnell sehr doof, da sie nach einer Funktion fX(x1,...,xn)f_X(x_1, ..., x_n) verteilt sind also: P(X(a,b])=P(a1<X1b1,...,an<Xnbn)=anbn...a1b1fX(x1,...,xn)dx1...dxnP(X \in (a,b])= P(a_1 < X_1 \le b_1, ..., a_n < X_n \le b_n) = \int_{a_n}^{b_n}...\int_{a_1}^{b_1} f_X(x_1, ..., x_n)dx_1 ... dx_n

Die Dichte ist analog wie vorher definiert.

Bedingte Verteilungen / Dichten

Leider können auch in einem Zufallsvektor Zufallsvariablen untereinander abhängig sein. Wir gehen hier von zwei Vektor aus also (X,Y)(X,Y). Dann ist die bedingte Zähldichte definiert als:

pXY(xy)=P(X=xY=y)={p(x,y)pY(y)y{y1,y2,...}pX(x)y{y1,...}p_{X \mid Y}(x \mid y) = P(X =x \mid Y = y) = \begin{cases} \frac{p(x,y)}{p_Y(y)} & y \in \{ y_1, y_2, ...\} \\ p_X(x) & y \notin \{y_1, ...\} \end{cases}

für stetige ZV ist es analog definiert nur mit f(x)f(x) als Dichtefunktion statt der Zähldichte:

fXY(xy)={f(x,y)fY(y)fY(y)>0fX(x)fY(y)=0f_{X \mid Y}(x \mid y) = \begin{cases} \frac{f(x,y)}{f_Y(y)} & f_Y(y) > 0 \\ f_X(x) & f_Y(y) = 0 \end{cases}

Aber was heißt das jetzt? Das ist die Zähldichte/Dichtefunktion von XX, wenn yy gegeben ist. Wieder als Beispiel: Mein PC stürzt (ganz hypothetisch) immer Montags zwischen 10:00 und 18:00 ab. Aber wenn ich im Urlaub bin und er ausgeschaltet ist, ändert das natürlich die Dichtefunktion bedeutend.

Als Notation wird XY=yfXY(xy)X | Y = y \sim f_{X|Y}(x|y) bzw. XY=ypXY(xy)X|Y = y \sim p_{X|Y}(x|y) verwendet

Als Test ob stoch. unabhängig gibt: pXY(xy)=pX(x)p_{X|Y}(x|y) = p_X(x) und pYX(yx)=pY(y)p_{Y|X}(y|x) = p_Y(y) für alle xx und yy ebenso für stetige.

Aber leichter ist das Produktkriterium: FX,Y(x,y)=FX(x)FY(y)F_{X,Y}(x,y) = F_X(x) \cdot F_Y(y) für alle x,y

Bedingter Erwartungswerte

E(XY=y)=xXxpXY(xy)E(X|Y = y)= \sum_{x \in X} x p_{X|Y}(x|y) bzw. E(XY=y)=xfXY(xy)dxE(X|Y = y)= \int x f_{X|Y}(x|y)dx

Kovarianzmatrizen

Statt einen einzelnen Varianzwert bildet man aus Var(X)=(Cov(Xi,Xj))i,jVar(X) = (Cov(X_i, X_j))_{i,j} eine (n×nn \times n)-Kovarianzmatrix :(

Randdichte

Randdichte sind tatsächlich auch wichtig. Bsp. Man hat die Funktion fXY={4y2(2xy)x,y(0,1)0sonstf_{XY} = \begin{cases} 4y^2(2-x-y) & x,y \in (0,1) \\ 0 & sonst \end{cases}

Dann ist die Randdichte von XX: fX(x)=fXY(x,y)dyf_X(x) = \int_{-\infty}^{\infty} f_{XY}(x,y)dy

und von YY: fY(y)=fXY(x,y)dxf_Y(y) = \int_{-\infty}^{\infty} f_{XY}(x,y)dx

Somit kann dann auch der Erwartungswert von E(Y)=yfY(y)dyE(Y) = \int_{-\infty}^{\infty} y f_Y(y)dy berechnet werden.

Bei diskreten Zufallsvektoren ist das analog nur statt Integral wird einfach summiert :)

mehrdimensionale Verteilungen

  • Multivariate Normalverteilung XNn(μ,I)X \sim N_n(\mu, I)
    φ(x1,...,xn)=(12π)ne12i=1nxi2\varphi(x_1, ..., x_n) = (\frac{1}{\sqrt{2 \pi}})^n e^{-\frac{1}{2}\sum_{i=1}^{n}x_i^2}

    n-dimensional standardnormalverteilt heißt XNn(0,I)X \sim N_n(0, I). Dann gilt auch:

    Y=X+μNn(μ,I)Y = X + \mu \sim N_n(\mu, I)

    Es gibt zwar noch Multivariate Normalverteilung ohne Standard aber die will niemand hoffe ich.