VI. 样本及抽样分布
本篇笔记介绍了数理统计中参数估计的基本概念和方法。首先讲解了点估计的两种主要方法:矩估计法和极大似然估计法。接着详细阐述了评价估计量优劣的四个准则:无偏性、有效性、均方误差和相合性。最后介绍了区间估计的概念,重点讨论了置信区间和枢轴量,并通过实例说明了如何利用枢轴量构造置信区间。(由 claude-3.5-sonnet 生成摘要)
1. 参数估计
- (参数) 反应总体某方面特征的量。
- (参数估计) 当总体的参数未知时,利用样本资料对其给出估计。
- (点估计) 设总体 X 有未知参数 θ,X1,⋯,Xn 是 X 的简单随机样本。构造合适的统计量 θ^=θ^(x1,⋯,xn) 用来估计未知参数 θ,称 θ^ 为参数 θ 的 点估计量,θ^(x1,⋯,xn) 为参数 θ 的 点估计值。
- (矩估计法)
- 统计思想:以样本矩估计总体矩,以样本矩的函数估计总体矩的函数。
- 步骤:
- ① 求总体前 k 阶矩关于 k 个参数的函数:μi=E(Xi)=hi(θ1,⋯,θk) (i=1,⋯,k)
- ② 求各参数关于 k 阶矩的反函数:θi=gi(μ1,⋯,μk) (i=1,⋯,k)
- ③ 以样本各阶矩 A1,⋯,Ak 代替总体各阶矩 μ1,⋯,μk 得各参数的矩估计 θ^i=gi(A1,⋯,Ak) (i=1,⋯,k)
- 在实际应用时,为求解方便,也可以用中心矩代替原点矩;采用的矩不同,得出的参数估计自然也不同。
- (极大似然估计)
- 设离散型总体 X∼p(x;θ), θ∈Θ,θ 未知,从总体 X 中取得样本 X1,X2,⋯,Xn,其观察值为 x1,x2,⋯,xn,则事件 {X1=x1,⋯,Xn=xn} 发生的概率为 L(θ)=P{X1=x1,⋯,Xn=xn}=p(x1;θ)⋯p(xn;θ)=i=1∏np(xi;θ)。称 θ^(x1,⋯,xn) 为 θ 的 极大似然估计值,相应统计量 θ^(X1,⋯,Xn) 为 θ 的 极大似然估计量。
- 极大似然原理:L(θ^(x1,x2,⋯,xn))=θ∈ΘmaxL(θ)。
- 说明:
- 未知参数可能不止一个,一般设为 θ=(θ1,θ2,⋯,θn)。
- 在求 L(θ) 的最大值时,通常转化为求 lnL(θ) 的最大值,其中 lnL(θ) 称为 对数似然函数。利用 ∂θi∂lnL(θ)=0 解得 θi^。
- 若 L(θ) 关于某个 θi 是单调增(减)函数,此时 θi 的极大似然估计在其边界取得。
- 若 θ^ 是 θ 的极大似然估计,则 g(θ) 的极大似然估计为 g(θ^)。
2. 估计量的评选准则
- (无偏性准则) 若参数 θ 的估计量 θ^=θ^(X1,X2,⋯,Xn),满足 E(θ^)=θ,则称 θ^ 是 θ 的一个 无偏估计量。
- 若 E(θ^)=θ,那么 ∣∣E(θ^)−θ∣∣ 称为估计量 θ^ 的 偏差。
- 若 n→∞limE(θ^)=θ,则称 θ^ 是 θ 的 渐进无偏估计量。
- 纠偏:若 E(θ^)=aθ+b, θ∈Θ,其中 a,b 是常数且 a=0,则 a1(θ^−b) 是 θ 的无偏估计。
- (有效性准则) 设 θ^1,θ^2 是 θ 的两个无偏估计,如果 D(θ^1)≤D(θ^2),对一切 θ∈Θ 成立,且不等号至少对某一 θ∈Θ 成立,则称 θ^1 比 θ^2 有效。
- (均方误差准则) 设 θ^ 是参数 θ 的点估计,方差存在,则称 E((θ^−θ)2) 是估计量的均方误差,记为 Mse(θ^)。若 θ^ 是 θ 的无偏估计,则有 Mse(θ^)=D(θ^)。
- (相合性准则) 设 θ^(X1,X2,⋯,Xn) 为参数 θ 的估计量,若对于任意 θ∈Θ,当 n→+∞ 时,θ^n 依概率收敛于 θ,即 ∀ε>0,有 n→∞limP{θ^n−θ}≥ε=0 成立,则称 θ^n 为 θ 的 相合估计量 或 一致估计量。
- 根据依概率收敛的性质,由 A1,⋯,Ak 是 μ1,⋯,μk 的相合估计,若 g(μ1,⋯,μk) 是连续函数,则 g(A1,⋯,Ak) 是 g(μ1,⋯,μk) 的 相合估计。
区间估计
置信区间是可以通过枢轴量推出的,建议掌握这样可以大大减少期末考试时的记忆量。
- (置信区间) 设总体 X 的分布函数 F(x;θ) 含有一个未知参数 θ,(X1,⋯,Xn) 是总体 X 的一个样本,对给定的值 α (0<α<1),如果有两个统计量 θ^L=θ^L(X1,⋯,Xn),θ^U=θ^U(X1,⋯,Xn),使得:P{θ^L(X1,⋯,Xn)<θ<θ^U(X1,⋯,Xn)}≥1−α (∀θ∈Θ)。则称随机区间 (θ^L,θ^U) 是 θ 的 双侧置信区间,称 1−α 为 置信度,θ^L 为 双侧置信下限,θ^U 为 双侧置信上限。
- (枢轴量) 设总体 X 的概率密度函数 f(x;θ),其中 θ 为待估参数,并设 X1,X2,⋯,Xn 是来自总体 X 的样本,如果样本和参数 θ 的函数 G(X1,X2,⋯,Xn;θ) 的分布完全已知,且形式上不依赖于其他未知参数,则称 G(X1,X2,⋯,Xn;θ) 为 枢轴量。
- 单个正态总体时的假设检验的枢轴量:
- 待估 μ,σ2 已知:Z=σ/nX−μ0∼N(0,1);
- 待估 μ,σ2 未知:T=S/nX−μ0∼t(n−1);
- 待估 σ2,μ 未知:χ2=σ2(n−1)S2∼χ2(n−1);
- 两个正态总体时的假设检验的枢轴量:
- 待估 μ1−μ2,σ12 和 σ22 已知:Z=n1σ12+n2σ22(X−Y)−(μ1−μ2)∼N(0,1);
- 待估 μ1−μ2,σ12=σ22 未知:t=Swn11+n21(X−Y)−(μ1−μ2)∼t(n1+n2−2),其中 Sw2=n1+n2−2(n1−1)S12+(n2−1)S22;
- 待估 σ22σ12,μ1,μ2 未知:F=σ12/σ22S12/S22∼F(n1−1,n2−1);
- 其余的仅了解即可,考试不考察。
根据枢轴量推出置信区间和单侧置信限(以待估 μ,σ2 已知的情况为例)
- Z=σ/nX−μ0∼N(0,1),故落在 (zα/2,z1−α/2) 中的概率恰为 1−α;
- zα/2<σ/nX−μ0<z1−α/2
- ⟹nσzα/2<X−μ0<nσz1−α/2
- ⟹X+nσz1−α/2<μ0<X+nσzα/2
- 这样就得到了置信区间为:X+nσz1−α/2<μ0<X+nσzα/2