IV. 随机变量的数字特征
本篇笔记介绍了随机变量的三个重要数字特征:数学期望、方差和协方差。首先讨论了离散型和连续型随机变量的数学期望定义及其性质,包括线性性和独立变量的期望。其次介绍了方差和标准差的概念、计算方法以及切比雪夫不等式,并总结了常见分布的均值与方差。最后探讨了协方差与相关系数,阐述了它们的计算公式、基本性质,以及在描述随机变量之间线性关系中的重要作用。(由 claude-3.5-sonnet 生成摘要)
1. 数学期望
- (数学期望) 对于离散型随机变量 X,设其分布律为 P(X=xk)=pk,若级数 k=1∑+∞xkpk 绝对收敛,则称 k=1∑+∞xkpk 的值为 X 的 数学期望,记为 E(X);对于离散型随机变量 X,设其密度函数为 f(x),若积分 ∫−∞∞xf(x)dx 绝对收敛,则称 ∫−∞∞xf(x)dx 的值为 X 的 数学期望。
- 随机变量函数的数学期望:
- 设 X 是离散型随机变量且 E(Y) 存在,则有 E(Y)=E(g(X))=k=0∑+∞g(xk)pk。
- 设 X 是连续型随机变量且 E(Y) 存在,则有 E(Y)=E(g(X))=∫−∞+∞g(x)f(x)dx。
- 设 (X,Y) 是二元离散型随机变量且 E(Z) 存在,则有 E(Z)=E(h(X,Y))=i=1∑∞j=1∑∞h(xi,yj)pij。
- 设 (X,Y) 是二元连续型随机变量且 E(Z) 存在,则有 E(Z)=E(h(X,Y))=∫−∞+∞∫−∞+∞h(x,y)f(x,y)dxdy。
- (期望的线性性) 设 X1,X2,⋯,Xn 是随机变量,则 E(c0+i=1∑nciXi)=c0+i=1∑nciE(Xi)。
- (独立变量的期望) 设 X1,X2,⋯,Xn 是相互独立的随机变量,则 E(i=1∏nXi)=i=1∏nE(Xi)。
2. 方差
- (方差与标准差) 设 X 是随机变量,若 E((X−E(X))2) 存在,则称其为 X 的 方差,记为 D(X) 或 Var(X)。又称 D(X) 为 标准差 或 均方差,记为 σ(X)。
- 对于离散型随机变量 X 且 D(X) 存在,则 D(X)=i=1∑∞(xi−E(X))2pi。
- 对于连续型随机变量 X 且 D(X) 存在,则 D(X)=∫−∞+∞(x−E(X))2f(x)dx。
- D(X)=E(X2)−[E(X)]2;“平方的期望减期望的平方”。
- 可以通过这一公式和期望的定义式,通过积分/求和计算随机变量的方差与标准差。
- (切比雪夫不等式) 设随机变量 X 具有数学期望 E(X)=μ,方差 D(X)=σ2,则对于任意正数 ε,不等式 P{∣X−μ∣≥ε}≤ε2σ2 成立。
- 几种常见分布的均值与方差
- (标准化变量) 设随机变量 X 具有数学期望 E(X)=μ,方差 D(X)=σ2=0,则记 X∗=σX−μ 为 X 的 标准化变量。
3. 协方差与相关系数
- (协方差) 设 Cov(X,Y)=E{[E−E(X)][E−E(Y)]} 为随机变量 X 与 Y 的 协方差。
- (协方差的计算公式) Cov(X,Y)=E(XY)−E(X)E(Y)。
- (方差的加法性质) D(X+Y)=D(X)+D(Y)+2Cov(X,Y)。
- (协方差的基本性质)
- Cov(X,Y)=Cov(Y,X);
- Cov(X,X)=D(X);
- Cov(aX,bY)=ab⋅Cov(X,Y),其中 a,b∈R;
- Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y);
- 当 D(X)D(Y)=0 时有 (Cov(X,Y))2≤D(X)D(Y),当 X 与 Y 有严格的线性关系时取等号。
- (相关系数) 设 ρXY=D(X)⋅D(Y)Cov(X,Y) 为随机变量 X 与 Y 的 相关系数,这是一个无量纲的量,用于表征 X,Y 之间线性关系的紧密程度。
- 当且仅当 ρXY=0 时称随机变量 X,Y 不相关。(注意:不相关不意味着相互独立!但相互独立的随机变量一定不相关)
- (相关系数的基本性质)
- ∣ρXY∣≤1;
- 当且仅当 P{Y=a+bX}=1 时上式取等号,且 b>0 时 ρXY=1;当 b<0 时 ρXY=−1。
- 用关于 X 的线性函数 a+bX 来近似表示 Y,以均方误差 e(a,b)=E((Y−(a+bX))2) 衡量近似表示的好坏程度,e(a,b) 越小,X.Y 之间的相关系数越大。
证明:线性近似时均方误差最小时相关系数最大
根据已知,
e(a,b)=E(Y2)+b2E(X2)+a2−2bE(XY)+2abE(X)−2aE(Y) 分别关于 a,b 求偏导可以得到
⎩⎨⎧∂a∂e=2a+2bE(X)−2E(Y)=0∂b∂e=2bE(X2)−2E(XY)+2aE(X)=0 解得:
b0=D(X)Cov(X,Y),a0=E(Y)−b0E(X) 代入得此时:
emin(a,b)=(1−ρXY2)D(Y)
4. 其他数字特征
- (k 阶(原点)矩) 设 X 是随机变量,若 E(Xk)(k=1,2,⋯) 存在则称它为 X 的 k 阶(原点)距。
- (k 阶中心矩) 设 X 是随机变量,若 E((X−E(X))k)(k=1,2,⋯) 存在则称它为 X 的 k 阶中心矩。
- (k+l 阶混合(原点)矩) 设 X,Y 是随机变量,若 E(XkYl)(k,l=1,2,⋯) 存在则称它为 X,Y 的 k+l 阶混合(原点)矩。
- (k+l 阶混合中心矩) 设 X,Y 是随机变量,若 E((X−E(X))k(Y−E(Y))l)(k,l=1,2,⋯) 存在则称它为 X,Y 的 k+l 阶混合中心矩。