III. 多元随机变量及其分布

本篇笔记主要介绍了多元随机变量及其分布的相关概念。首先讨论了二元随机变量的基本定义,包括离散型和连续型随机变量的联合分布、边际分布和条件分布。其次介绍了二元正态分布这一重要的特例。随后探讨了多元随机变量的独立性概念及其判定方法。最后讨论了多元随机变量函数的分布问题,包括和、商、积以及最大最小值等情形的分布推导方法。(由 claude-3.5-sonnet 生成摘要)

1. 二元随机变量及其分布

  • (二元随机变量)EE 是一个随机试验,样本空间是 S={e}S = \{e\},设 X=X(e)X = X(e)Y=Y(e)Y = Y(e) 是定义在 SS 上的随机变量,由它们构成向量的 (X,Y)(X,Y)二元随机变量
  • (二元离散型随机变量) 若二元随机变量 (X,Y)(X,Y) 全部可能取到的不同值是有限对或可列无限对,则称 (X,Y)(X,Y)二元离散型随机变量
  • (联合分布律) 设二元离散型随机变量 (X,Y)(X,Y) 的所有可能取值为 (xi,yj)i,j=1,2,(x_{i},y_{j})\,\quad i,j=1,2,\cdots,设 pij=P(X=xi,Y=yj)p_{ij} = P(X=x_{i},Y=y_{j})(X,Y)(X,Y)联合(概率)分布律
    • (联合分布律的性质)
      • pij0i,j=1,2,p_{ij} \geq 0\quad i,j=1,2,\cdots
      • i=1j=1pij=1\displaystyle{\sum_{i=1}^{\infty} \sum_{j=1}^{\infty} p_{ij} = 1}
      • (边际分布律) 在上述条件下,设 (X,Y)(X,Y)边际(概率)分布律P(Y=yj)=P(X<,Y=yj)=pjP(Y=y_{j})=P(X<\infty,Y=y_{j})=p_{\cdot j}P(X=xi)=P(X=xi,Y<)=piP(X=x_{i})=P(X=x_{i},Y<\infty) = p_{i\cdot}
      • (条件分布律) 在上述条件下,设 (X,Y)(X,Y)条件(概率)分布律P(X=xiY=yj)=pijpjP(X=x_{i}\mid Y=y_{j})=\dfrac{p_{ij}}{p_{\cdot j}}P(Y=yjX=xi)=pijpiP(Y=y_{j}\mid X=x_{i})=\dfrac{p_{ij}}{p_{i\cdot}}
  • (联合分布函数)(X,Y)(X,Y) 为二元随机变量,对于任意实数 x,yx,y,二元函数 F(x,y)=P{(Xx)(Yy)}=P(Xx,Yy)F(x,y)=P\{ (X\leq x) \cap (Y\leq y) \}=P(X\leq x,Y\leq y) 称为二元随机变量 (X,Y)(X,Y)联合(概率)分布函数
    • (联合分布函数的性质)
      • F(x,y)F(x,y) 关于 x,yx,y 分别单调不减
      • 0F(x,y)1, F(+,+)=10\leq F(x,y)\leq 1,\ F(+\infty,+\infty)=1 且对任意 x,yx,yF(,y)=F(x,)=F(,)=0F(-\infty,y)=F(x,-\infty)=F(-\infty,-\infty)=0
      • F(x,y)F(x,y) 关于 x,yx,y 右连续,即 limε0+F(x+ε,y)=limε0+F(x,y+ε)=F(x,y)\displaystyle{\lim_{ \varepsilon \to 0^{+} } F(x+\varepsilon,y) = \lim_{ \varepsilon \to 0^{+} } F(x,y+\varepsilon)=F(x,y)}
      • x1<x2,y1<y2x_{1}<x_{2},y_{1}<y_{2},则 F(x2,y2)F(x2,y1)F(x1,y2)+F(x1,y1)=P(x1<Xx2,y1<Yy2)0F(x_{2},y_{2})-F(x_{2},y_{1})-F(x_{1},y_{2})+F(x_{1},y_{1})= P(x_{1}<X\leq x_{2},y_{1}<Y\leq y_{2}) \geq 0
    • (边际分布函数) 在上述条件下,设 X,YX,Y边际(概率)分布函数 分别为 FX(x)=F(x,+)F_{X}(x) = F(x,+\infty)FY(y)=F(+,y)F_{Y}(y) = F(+\infty,y)
    • (条件分布函数) 在上述条件下,设 X,YX,Y条件(概率)分布函数 分别为 FXY(xy)=P(XxY=y)=P(Xx,Y=y)P(Y=y)F_{X\mid Y}(x\mid y)=P(X\leq x\mid Y=y)=\dfrac{P(X\leq x,Y=y)}{P(Y=y)}。特别地,若 P(Y=y)=0P(Y=y)=0,则记 P(XxY=y)=limε0+P(Xx,y<Y<y+ε)P(y<Y<y+ε)\displaystyle{P(X\leq x\mid Y=y)=\lim_{ \varepsilon \to 0^{+}} \dfrac{P(X\leq x,y<Y<y+ \varepsilon)}{P(y<Y<y+\varepsilon)}}
  • (联合密度函数) 对于二元随机变量 (X,Y)(X,Y),如果存在非负函数 f(x,y)f(x,y) 使对于任意 (x,y)(x,y) 满足 F(x,y)=yxf(u,v)dudv\displaystyle{F(x,y)=\int_{-\infty}^{y}\int_{-\infty}^{x} f(u,v) \text{d}u\text{d}v},则称 (X,Y)(X,Y)二元连续型随机变量,称 f(x,y)f(x,y) 为二元随机变量的 联合(概率)密度函数
    • (联合密度函数的性质)
      • f(x,y)0f(x,y) \geq 0
      • ++f(x,y)dxdy=1\displaystyle{\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f(x,y) \text{d} x \text{d}y = 1}
      • GG 是平面上区域,则 (X,Y)(X,Y) 落在 GG 内的概率 P{(X,Y)G}=Gf(x,y)dxdy\displaystyle{P\{ (X,Y) \in G \} = \iint_{G} f(x,y) \text{d}x\text{d}y}
      • f(x,y)f(x,y) 的连续点 (x,y)(x,y),有 2F(x,y)xy=f(x,y)\dfrac{\partial^{2} F(x,y)}{\partial x \partial y} = f(x,y)
    • (边际密度函数) 在上述条件下,设 X,YX,Y边际(概率)密度函数 分别为 fX(x)=f(x,y)dy=xfX(u)du\displaystyle{f_{X} (x) = \int_{-\infty}^{\infty} f(x,y) \text{d}y=\int_{-\infty}^{x} f_{X} (u) \text{d}u}fY(y)=+f(x,y)dx=yfY(v)dvf_{Y} (y) = \displaystyle{\int_{-\infty}^{+\infty} f(x,y) \text{d} x=\int_{-\infty}^{y} f_{Y} (v)\text{d}v}
    • (条件密度函数) 在上述条件下,设 X,YX,Y条件(概率)密度函数 分别为 fXY(xy)=f(x,y)fY(y), fY(y)>0f_{X\mid Y}(x\mid y)=\dfrac{f(x,y)}{f_{Y}(y)},\ f_{Y}(y)>0fYX(yx)=f(x,y)fX(x), fX(x)>0f_{Y\mid X}(y\mid x)=\dfrac{f(x,y)}{f_{X}(x)},\ f_{X}(x)>0
      • (条件密度函数的性质)
        • fXY(xy)0f_{X\mid Y} (x\mid y)\geq0
        • +fXY(xy) dx=1\displaystyle{\int_{-\infty}^{+\infty} f_{X\mid Y} (x \mid y) \text{ d}x = 1}
        • P{a<X<bY=y}=abfXY(xy)dxP\{a<X<b \mid Y=y\} = \displaystyle{ \int_{a}^{b} f_{X\mid Y} (x\mid y)\text{d}x }
        • fXY(xy)f_{X \mid Y} (x\mid y) 的连续点 xx,有 dFXY(xy)dx=fXY(xy)\dfrac{\text{d} F_{X\mid Y}(x \mid y)}{\text{d}x} =f_{X \mid Y} (x\mid y)
        • f(x,y)=fXY(xy)fY(y)=fX(x)fYX(yx)f(x,y) = f_{X\mid Y}(x \mid y) f_{Y} (y) = f_{X}(x) f_{Y\mid X} (y \mid x)
  • (二元正态分布) 设二元随机变量 (X,Y)(X,Y) 的概率密度函数为 f(x,y)=12πσ1σ21ρ2exp(12(1ρ2)((xμ1)2σ122ρ(xμ1)(yμ2)σ1σ2+(yμ2)2σ22))\displaystyle{f(x,y) = \dfrac{1}{2\pi \sigma_{1} \sigma_{2} \sqrt{1-\rho^{2}}} \cdot \exp \left( -\dfrac{1}{2(1-\rho^{2})} \left( \frac{\left(x-\mu_1\right)^2}{\sigma_1^2}-2\rho\frac{\left(x-\mu_1\right)\left(y-\mu_2\right)}{\sigma_1\sigma_2}+\frac{\left(y-\mu_2\right)^2}{\sigma_2^2} \right)\right)} (<x<+, <y<+)\quad (-\infty<x<+\infty,\ -\infty<y<+\infty) 其中 μ1,μ2,σ1,σ2,ρ\mu_{1},\mu_{2},\sigma_{1},\sigma_{2},\rho 都是常数,且 σ1>0,σ2>0,1<ρ<1\sigma_{1}>0,\sigma_{2}>0,-1<\rho<1;称 (X,Y)(X,Y) 为服从参数为 μ1,μ2,σ1,σ2,ρ\mu_{1},\mu_{2},\sigma_{1},\sigma_{2},\rho二元正态分布,记为 (X,Y)N(μ1,μ2,σ12,σ22,ρ)(X,Y) \sim N(\mu_{1},\mu_{2},\sigma_{1}^{2},\sigma_{2}^{2},\rho )
    • 图例:

2. 多元随机变量的独立性

  • (二元随机变量的独立性)F(x,y)F(x,y)FX(x),FY(y)F_{X}(x),F_{Y}(y) 分别是随机变量 (X,Y)(X,Y) 的联合分布函数及边际分布函数,若对所有实数 x,yx,y 都有 P(Xx,Yy)=P(Xx)P(Yy)P(X\leq x,Y\leq y)=P(X\leq x)P(Y\leq y),即 F(x,y)=FX(x)FY(y)F(x,y)=F_{X}(x)F_{Y}(y),则称随机变量 X,YX,Y 相互独立
    • (X,Y)(X,Y) 是离散型随机变量,则 X,YX,Y 相互独立的条件等价于 pij=pipjp_{ij}=p_{i\cdot}p_{\cdot j} 对一切 i,ji,j 都成立。
    • (X,Y)(X,Y) 是连续型随机变量,则 X,YX,Y 相互独立的条件等价于 f(x,y)=fX(x)fY(y)f(x,y)=f_{X}(x)f_{Y}(y) 在平面上除去“零面积”集以外处处成立。
    • 连续型随机变量 X,YX,Y 相互独立的充分必要条件是存在连续函数 m(),n()m(\cdot),n(\cdot) 使得 f(x,y)=m(x)n(y), x<+,y<+f(x,y)=m(x)\cdot n(y),\ |x|<+\infty,|y|<+\infty

证明:对于二维正态随机变量 (X,Y)(X,Y)XXYY 相互独立的充要条件是参数 ρ=0\rho=0

TBD

3. 多元随机变量的函数的分布

  • Z=X+YZ=X+Y 的情形
    • (卷积公式) 设连续型随机变量 (X,Y)(X,Y) 的密度函数为 f(x,y)f(x,y)XXYY 相互独立,则 Z=X+YZ=X+Y 的密度函数为 fZ(z)=+fX(zy)fY(y)dy=fX(x)fY(zx)dx\displaystyle{f_{Z}(z)=\int_{-\infty}^{+\infty} f_{X}(z-y)f_{Y}(y) \text{d}y=\int_{-\infty}^{\infty} f_{X}(x)f_{Y}(z-x)\text{d}x},称为 卷积公式
      • XXYY 相互独立且 XN(μ1,σ12), YN(μ2,σ22)X \sim N(\mu_{1},\sigma_{1}^{2}),\ Y\sim N(\mu_{2},\sigma_{2}^{2}),则 aX+bY+cN(aμ1+bμ2+c,a2σ12+b2σ22)aX+bY+c\sim N(a\mu_{1}+b\mu_{2}+c,a^{2}\sigma_{1}^{2}+b^{2}\sigma_{2}^{2})
  • Z=YXZ=\dfrac{Y}{X}Z=XYZ=XY 的情形:
    • Z=YXZ=\dfrac{Y}{X} 的概率密度函数为:fZ(z)=+xf(x,xz)dx\displaystyle{f_{Z}(z)=\int_{-\infty}^{+\infty} |x| f(x,xz)\text{d}x}
    • Z=XYZ=XY 的概率密度函数为:fZ(z)=+1xf(x,zx)dx\displaystyle{f_{Z} (z) = \int_{-\infty}^{+\infty} \dfrac{1}{|x|} f \left( x, \dfrac{z}{x} \right) \text{d}x}
  • M=max{X,Y}M=\max \{ X,Y \}N=min{X,Y}N=\min \{ X,Y \} 的情形
    • X,YX,Y 是两个相互独立的随机变量,则 M=max{X,Y}M=\max \{ X,Y\} 的分布函数为 FM(z)=FX(z)FY(z)F_{M}(z) = F_{X}(z)F_{Y}(z)N=min{X,Y}N=\min \{ X,Y \} 的分布函数为 FN(z)=1(1FX(z))(1FY(z))F_{N}(z)=1-(1-F_{X}(z))(1-F_{Y}(z))

评论

TABLE OF CONTENTS

1. 二元随机变量及其分布
2. 多元随机变量的独立性
3. 多元随机变量的函数的分布