VI. 样本及抽样分布
本篇笔记介绍了数理统计中的样本和抽样分布的基本概念。首先讲解了随机样本和简单随机样本的定义,以及样本的常用统计量(如样本均值、样本方差等)。接着详细阐述了三个重要的抽样分布:χ2 分布、t 分布和 F 分布,包括它们的定义、性质和上 α 分位数。最后讨论了正态总体下的抽样分布定理,为下一章节介绍枢轴量做铺垫。(由 claude-3.5-sonnet 生成摘要)
1. 样本
- (随机样本) 从总体中随机选取 n 个个体,称为一个 随机样本。
- (简单随机样本) 随机样本 (X1,X2,⋯,Xn) 称为容量是 n 的 简单随机样本 当且仅当满足以下条件:① 每个 Xi 与 X 同分布;② X1,X2,⋯,Xn 是相互独立的随机变量。
- 后面提到的样本均指简单随机样本。
- 若总体 X 具有概率密度函数 f(X),则样本 (X1,X2,⋯,Xn) 具有联合密度函数:f(X1,X2,⋯,Xn)=i=1∏nf(Xi)。
- 样本的常用统计量:
- (样本均值) X=n1i=1∑nXi
- (样本方差) S2=n−11i=1∑n(Xi−X)2
- (样本 k 阶矩) Ak=n1i=1∑nXik
- (样本 k 阶中心矩) Bk=n1i=1∑n(Xi−X)k
- 对总体方差的估计可以用 S2 也可以用 B2(区别在于前面的系数是 n−11 还是 n1)。主要的区别是 S2 作为总体方差是无偏估计,但 B2 作为总体方差的估计是有偏的。
2. 抽样分布
三个分布的概率密度函数不要求掌握。
- (χ2 分布) 设随机变量 X1,X2,⋯,Xn 相互独立,Xi∼N(0,1) (i=1,2,⋯,n) 则称 χn2=i=1∑nXi2 服从自由度为 n 的 χ2 分布,记为 χ2∼χ2(n)。
- 概率密度函数:fn(y)=⎩⎨⎧2Γ(n/2)1(2y)n/2−1e−y/2,0,y>0y≤0,其中 Γ(α)=∫0+∞xα−1e−xdx。
- 设 χ2∼χ2(n),则有 E(χ2)=n,D(χ2)=2n。
- (χ2 分布的可加性) 设 Y1∼χ2(n1), Y2∼χ2(n2),且 Y1,Y2 相互独立,则有 Y1+Y2∼χ2(n1+n2)。可以推广到有限个的情形。
- 对给定的概率 α (0<α<1),称满足条件 ∫χ2(n)∞fn(y)dy=α 的点 χα2(n) 为 χ2(n) 分布的 上 α 分位数。
- (t 分布) 设 X∼N(0,1),Y∼χ2(n),并且假设 X,Y 相互独立,则称随机变量 T=Y/nX 服从 自由度 为 n 的 t 分布,记为 T∼t(n)。
- 概率密度函数:f(t,n)=nπΓ(2n)Γ(2n+1)(1+nt2)−(n+1)/2, −∞<t<+∞。
- 对给定的 α (0<α<1),称满足条件 ∫tα(n)+∞f(t,n)dt=α 的点 tα(n) 为 t(n) 分布的上 α 分位数。
- tα(n)=−t1−α(n)。
- (F 分布) 设 X∼χ2(n1), Y∼χ2(n2),且 X,Y 独立,则称随机变量 F=Y/n2X/n1 服从自由度 (n1,n2) 的 F 分布,记为 F∼F(n1,n2),其中 n1 称为 第一自由度,n2 称为 第二自由度。
- 概率密度函数:f(x;n1,n2)={B(n1/2,n2/2)1n12n1n22n2x2n1−1(n2+n1x)−2n1+n20x>0x≤0,其中 B(a,b)=∫01xa−1(1−x)b−1dx=Γ(a+b)Γ(a)Γ(b)。
- 对给定的 α (0<α<1),称满足条件 ∫Fα(n1,n2)∞f(x;n1,n2)dx=α 的点 Fα(n1,n2) 为 F(n,m) 分布的 上 α 分位数。
- Fα(n1,n2)=F1−α(n2,n1)1。
3. 正态总体下的抽象分布
这些内容其实都是为了引出下一章枢轴量的概念。除了“X 与 S2 相互独立”这一条,别的不需要额外记忆。
- 设 X1,X2,⋯,Xn 为来自正态总体 N(μ,σ2) 的简单随机样本,X 是样本均值,S2 是样本方差,则有:
- X∼N(μ,nσ2)
- σ2(n−1)S2∼χ2(n−1)
- X 与 S2 相互独立
- S/nX−μ∼t(n−1)
- 设 X1,X2,⋯,Xn1,Y1,Y2,⋯,Yn2 分别是来自正态总体 N(μ1,σ12) 和 N(μ2,σ22) 的样本,且这两个样本相互独立,设 X=n11i=1∑n1Xi,Y=n21i=1∑n2Yi 分别是两样本的均值,S12,S22 分别是两样本的样本方差,则有
- S22/σ22S12/σ12∼F(n1−1,n2−1)
- n1σ12+n2σ22(X−Y)−(μ1−μ2)∼N(0,1)
- 当 σ12=σ22=σ2 时,Swn11+n21(X−Y)−(μ1−μ2)∼t(n1+n2−2),其中 Sw2=n1+n2−2(n1−1)S12+(n2−1)S22。