IV. 随机变量的数字特征

本篇笔记介绍了随机变量的三个重要数字特征:数学期望、方差和协方差。首先讨论了离散型和连续型随机变量的数学期望定义及其性质,包括线性性和独立变量的期望。其次介绍了方差和标准差的概念、计算方法以及切比雪夫不等式,并总结了常见分布的均值与方差。最后探讨了协方差与相关系数,阐述了它们的计算公式、基本性质,以及在描述随机变量之间线性关系中的重要作用。(由 claude-3.5-sonnet 生成摘要)

1. 数学期望

  • (数学期望) 对于离散型随机变量 XX,设其分布律为 P(X=xk)=pkP(X=x_{k}) = p_{k},若级数 k=1+xkpk\displaystyle{\sum_{k=1}^{+\infty} x_{k} p_{k}} 绝对收敛,则称 k=1+xkpk\displaystyle{\sum_{k=1}^{+\infty} x_{k} p_{k}} 的值为 XX数学期望,记为 E(X)E(X);对于离散型随机变量 XX,设其密度函数为 f(x)f(x),若积分 xf(x)dx\displaystyle{\int_{-\infty}^{\infty} x f(x) \text{d}x} 绝对收敛,则称 xf(x)dx\displaystyle{\int_{-\infty}^{\infty} x f(x) \text{d}x} 的值为 XX数学期望
  • 随机变量函数的数学期望:
    • XX 是离散型随机变量且 E(Y)E(Y) 存在,则有 E(Y)=E(g(X))=k=0+g(xk)pk\displaystyle{E(Y)=E(g(X))=\sum_{k=0}^{+\infty} g(x_k) p_{k}}
    • XX 是连续型随机变量且 E(Y)E(Y) 存在,则有 E(Y)=E(g(X))=+g(x)f(x)dx\displaystyle{E(Y)=E(g(X))=\int_{-\infty}^{+\infty} g(x) f(x) \text{d}x}
    • (X,Y)(X,Y) 是二元离散型随机变量且 E(Z)E(Z) 存在,则有 E(Z)=E(h(X,Y))=i=1j=1h(xi,yj)pij\displaystyle{E(Z)=E(h(X,Y))=\sum_{i=1}^{\infty} \sum_{j=1}^{\infty} h(x_{i},y_{j}) p_{ij}}
    • (X,Y)(X,Y) 是二元连续型随机变量且 E(Z)E(Z) 存在,则有 E(Z)=E(h(X,Y))=++h(x,y)f(x,y)dxdyE(Z)=E(h(X,Y))=\displaystyle{\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} h(x,y) f(x,y) \text{d}x\text{d}y}
  • (期望的线性性)X1,X2,,XnX_1,X_2,\cdots,X_n 是随机变量,则 E(c0+i=1nciXi)=c0+i=1nciE(Xi)\displaystyle{E \left( c_{0} + \sum_{i=1}^{n} c_{i} X_{i} \right) = c_{0} +\sum_{i=1}^{n} c_{i} E(X_{i})}
  • (独立变量的期望)X1,X2,,XnX_1,X_2,\cdots,X_n 是相互独立的随机变量,则 E(i=1nXi)=i=1nE(Xi)\displaystyle{E \left( \prod_{i=1}^{n} X_{i} \right) = \prod_{i=1}^{n} E(X_{i})}

2. 方差

  • (方差与标准差)XX 是随机变量,若 E((XE(X))2)E \left( \left( X-E(X) \right)^{2} \right) 存在,则称其为 XX方差,记为 D(X)D(X)Var(X)\operatorname*{Var}(X)。又称 D(X)\sqrt{D(X)}标准差均方差,记为 σ(X)\sigma(X)
    • 对于离散型随机变量 XXD(X)D(X) 存在,则 D(X)=i=1(xiE(X))2pi\displaystyle{D(X) = \sum_{i=1}^{\infty} (x_{i} - E(X))^{2} p_{i}}
    • 对于连续型随机变量 XXD(X)D(X) 存在,则 D(X)=+(xE(X))2f(x)dx\displaystyle{D(X) = \int_{-\infty}^{+\infty} (x-E(X))^{2} f(x) \text{d} x}
  • D(X)=E(X2)[E(X)]2D(X)=E(X^{2}) - [E(X)]^{2};“平方的期望减期望的平方”。
    • 可以通过这一公式和期望的定义式,通过积分/求和计算随机变量的方差与标准差。
  • (切比雪夫不等式) 设随机变量 XX 具有数学期望 E(X)=μE(X)=\mu,方差 D(X)=σ2D(X)=\sigma^{2},则对于任意正数 ε\varepsilon,不等式 P{Xμε}σ2ε2\displaystyle{P\{|X-\mu|\geq\varepsilon\}\leq\frac{\sigma^2}{\varepsilon^2}} 成立。
  • 几种常见分布的均值与方差几种常见分布的均值与方差
  • (标准化变量) 设随机变量 XX 具有数学期望 E(X)=μE(X)=\mu,方差 D(X)=σ20D(X)=\sigma^{2} \neq 0,则记 X=XμσX^{\ast} = \dfrac{X-\mu}{\sigma}XX标准化变量

3. 协方差与相关系数

  • (协方差)Cov(X,Y)=E{[EE(X)][EE(Y)]}\operatorname*{Cov}(X,Y)=E\{ [E-E(X)] [E-E(Y)] \} 为随机变量 XXYY协方差
    • (协方差的计算公式) Cov(X,Y)=E(XY)E(X)E(Y)\operatorname*{Cov}(X,Y)=E(XY)-E(X)E(Y)
    • (方差的加法性质) D(X+Y)=D(X)+D(Y)+2Cov(X,Y)D(X+Y)=D(X)+D(Y)+2\operatorname*{Cov}(X,Y)
    • (协方差的基本性质)
      • Cov(X,Y)=Cov(Y,X)\operatorname*{Cov}(X,Y)=\operatorname*{Cov}(Y,X)
      • Cov(X,X)=D(X)\operatorname*{Cov}(X,X)=D(X)
      • Cov(aX,bY)=abCov(X,Y)\operatorname*{Cov}(aX,bY)=ab\cdot\operatorname*{Cov}(X,Y),其中 a,bRa,b\in \mathbb{R}
      • Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)\operatorname*{Cov}(X_{1}+X_{2},Y)=\operatorname*{Cov}(X_{1},Y)+\operatorname*{Cov}(X_{2},Y)
      • D(X)D(Y)0D(X)D(Y) \neq 0 时有 (Cov(X,Y))2D(X)D(Y)\left( \operatorname*{Cov}(X,Y) \right)^{2} \leq D(X)D(Y),当 XXYY 有严格的线性关系时取等号。
  • (相关系数)ρXY=Cov(X,Y)D(X)D(Y)\displaystyle{\rho_{XY}=\dfrac{\operatorname*{Cov}(X,Y)}{\sqrt{D(X) \cdot D(Y)}}} 为随机变量 XXYY相关系数,这是一个无量纲的量,用于表征 X,YX,Y 之间线性关系的紧密程度
    • 当且仅当 ρXY=0\rho_{XY}=0 时称随机变量 X,YX,Y 不相关。(注意:不相关不意味着相互独立!但相互独立的随机变量一定不相关)
    • (相关系数的基本性质)
      • ρXY1|\rho_{XY}| \leq 1
      • 当且仅当 P{Y=a+bX}=1P\{ Y=a+bX \}=1 时上式取等号,且 b>0b>0ρXY=1\rho_{XY}=1;当 b<0b<0ρXY=1\rho_{XY}=-1
    • 用关于 XX 的线性函数 a+bXa+bX 来近似表示 YY,以均方误差 e(a,b)=E((Y(a+bX))2)e(a,b)=E\left( (Y-(a+bX))^{2} \right) 衡量近似表示的好坏程度,e(a,b)e(a,b) 越小,X.YX.Y 之间的相关系数越大。

证明:线性近似时均方误差最小时相关系数最大

根据已知,

e(a,b)=E(Y2)+b2E(X2)+a22bE(XY)+2abE(X)2aE(Y)e(a,b)=E(Y^2)+b^2E(X^2)+a^2-2bE(XY)+2abE(X)-2aE(Y)

分别关于 a,ba,b 求偏导可以得到

{ea=2a+2bE(X)2E(Y)=0eb=2bE(X2)2E(XY)+2aE(X)=0\begin{cases}\dfrac{\partial e}{\partial a}=2a+2bE(X)-2E(Y)=0\\\dfrac{\partial e}{\partial b}=2bE(X^2)-2E(XY)+2aE(X)=0\end{cases}

解得:

b0=Cov(X,Y)D(X),a0=E(Y)b0E(X)b_0=\frac{Cov(X,Y)}{D(X)},\quad a_0=E(Y)-b_0E(X)

代入得此时:

emin(a,b)=(1ρXY2)D(Y)e_{\min}(a,b)=(1-\rho_{XY}^2)D(Y)

4. 其他数字特征

  • (kk 阶(原点)矩)XX 是随机变量,若 E(Xk)(k=1,2,)E(X^{k})\, (k=1,2,\cdots) 存在则称它为 XXkk 阶(原点)距
  • (kk 阶中心矩)XX 是随机变量,若 E((XE(X))k)(k=1,2,)E((X-E(X))^{k})\, (k=1,2,\cdots) 存在则称它为 XXkk 阶中心矩
  • (k+lk+l 阶混合(原点)矩)X,YX,Y 是随机变量,若 E(XkYl)(k,l=1,2,)E(X^{k}Y^{l})\, (k,l=1,2,\cdots) 存在则称它为 X,YX,Yk+lk+l 阶混合(原点)矩
  • (k+lk+l 阶混合中心矩)X,YX,Y 是随机变量,若 E((XE(X))k(YE(Y))l)(k,l=1,2,)E((X-E(X))^{k}(Y-E(Y))^{l})\, (k,l=1,2,\cdots) 存在则称它为 X,YX,Yk+lk+l 阶混合中心矩

评论

TABLE OF CONTENTS

1. 数学期望
2. 方差
3. 协方差与相关系数
4. 其他数字特征