VI. 样本及抽样分布

本篇笔记介绍了数理统计中的样本和抽样分布的基本概念。首先讲解了随机样本和简单随机样本的定义,以及样本的常用统计量(如样本均值、样本方差等)。接着详细阐述了三个重要的抽样分布:χ2\chi^{2} 分布、tt 分布和 FF 分布,包括它们的定义、性质和上 α\alpha 分位数。最后讨论了正态总体下的抽样分布定理,为下一章节介绍枢轴量做铺垫。(由 claude-3.5-sonnet 生成摘要)

1. 样本

  • (随机样本) 从总体中随机选取 nn 个个体,称为一个 随机样本
  • (简单随机样本) 随机样本 (X1,X2,,Xn)(X_{1},X_{2},\cdots,X_{n}) 称为容量是 nn简单随机样本 当且仅当满足以下条件:① 每个 XiX_{i}XX 同分布;② X1,X2,,XnX_{1},X_{2},\cdots,X_{n} 是相互独立的随机变量。
    • 后面提到的样本均指简单随机样本。
    • 若总体 XX 具有概率密度函数 f(X)f(X),则样本 (X1,X2,,Xn)(X_{1},X_2,\cdots,X_{n}) 具有联合密度函数:f(X1,X2,,Xn)=i=1nf(Xi)\displaystyle{f(X_{1},X_{2},\cdots,X_{n}) = \prod_{i=1}^{n} f(X_{i})}
  • 样本的常用统计量:
    • (样本均值) X=1ni=1nXi\displaystyle{\overline{X} = \dfrac{1}{n} \sum_{i=1}^{n} X_{i}}
    • (样本方差) S2=1n1i=1n(XiX)2\displaystyle{S^{2} ={\color{red}\dfrac{1}{n-1}} \sum_{i=1}^{n} (X_{i}-\overline{X})^{2}}
    • (样本 kk 阶矩) Ak=1ni=1nXik\displaystyle{A_{k}= \dfrac{1}{n}\sum_{i=1}^{n} X_{i}^{k}}
    • (样本 kk 阶中心矩) Bk=1ni=1n(XiX)k\displaystyle{B_{k}=\dfrac{1}{n} \sum_{i=1}^{n} \left( X_{i} - \overline{X} \right)^{k}}
  • 对总体方差的估计可以用 S2S^{2} 也可以用 B2B_2(区别在于前面的系数是 1n1\dfrac{1}{n-1} 还是 1n\dfrac{1}{n})。主要的区别是 S2S^{2} 作为总体方差是无偏估计,但 B2B_{2} 作为总体方差的估计是有偏的。

2. 抽样分布

三个分布的概率密度函数不要求掌握。

  • (χ2\chi^2 分布) 设随机变量 X1,X2,,XnX_{1},X_{2},\cdots,X_{n} 相互独立,XiN(0,1) (i=1,2,,n)X_{i} \sim N(0,1)\ (i=1,2,\cdots,n) 则称 χn2=i=1nXi2\displaystyle{\chi_{n}^{2}=\sum_{i=1}^{n} X_{i}^{2}} 服从自由度为 nnχ2\chi^{2} 分布,记为 χ2χ2(n)\chi^{2} \sim \chi^{2}(n)
    • 概率密度函数:fn(y)={12Γ(n/2)(y2)n/21ey/2,y>00,y0f_{n}(y)=\begin{cases}\dfrac{1}{2 \Gamma(n/2)} \left( \dfrac{y}{2} \right)^{n/2-1} e^{-y/2},\quad&y>0\\0,\quad&y\leq0\end{cases},其中 Γ(α)=0+xα1exdx\displaystyle{\Gamma(\alpha) = \int_{0}^{+\infty} x^{\alpha-1} e^{-x} \text{d} x}
    • χ2χ2(n)\chi^{2} \sim \chi^{2}(n),则有 E(χ2)=nE(\chi^{2})=nD(χ2)=2nD(\chi^{2})=2n
    • (χ2\chi^2 分布的可加性)Y1χ2(n1), Y2χ2(n2)Y_{1} \sim \chi^{2}(n_{1}),\ Y_{2} \sim \chi^{2}(n_{2}),且 Y1,Y2Y_{1},Y_{2} 相互独立,则有 Y1+Y2χ2(n1+n2)Y_{1}+Y_2 \sim \chi^{2}(n_{1}+n_{2})。可以推广到有限个的情形。
    • 对给定的概率 α (0<α<1)\alpha\ (0<\alpha<1),称满足条件 χ2(n)fn(y)dy=α\displaystyle{\int_{\chi^{2}(n)}^{\infty} f_{n}(y) \text{d} y = \alpha} 的点 χα2(n)\chi_{\alpha}^{2}(n)χ2(n)\chi^{2}(n) 分布的 α\alpha 分位数
  • (tt 分布)XN(0,1)X \sim N(0,1)Yχ2(n)Y \sim \chi^{2}(n),并且假设 X,YX,Y 相互独立,则称随机变量 T=XY/nT=\dfrac{X}{\sqrt{Y/n}} 服从 自由度nntt 分布,记为 Tt(n)T \sim t(n)
    • 概率密度函数:f(t,n)=Γ(n+12)nπΓ(n2)(1+t2n)(n+1)/2, <t<+f(t,n)=\dfrac{\Gamma\left( \frac{n+1}2 \right)}{\sqrt{n \pi} \Gamma\left( \frac n2 \right) }\left( 1+ \dfrac{t^{2}}{n}\right)^{-(n+1)/2},\ -\infty<t<+\infty
    • 对给定的 α (0<α<1)\alpha\ (0<\alpha<1),称满足条件 tα(n)+f(t,n)dt=α\displaystyle{\int_{t_{\alpha}(n)}^{+\infty} f(t,n) \text{d} t = \alpha} 的点 tα(n)t_{\alpha}(n)t(n)t(n) 分布的α\alpha 分位数
    • tα(n)=t1α(n)t_{\alpha}(n) = -t_{1-\alpha}(n)
  • (FF 分布)Xχ2(n1), Yχ2(n2)X \sim \chi^{2}(n_{1}),\ Y \sim \chi^{2}(n_{2}),且 X,YX,Y 独立,则称随机变量 F=X/n1Y/n2F=\dfrac{X / n_{1}}{Y / n_{2}} 服从自由度 (n1,n2)(n_{1},n_{2})FF 分布,记为 FF(n1,n2)F \sim F(n_{1},n_{2}),其中 n1n_{1} 称为 第一自由度n2n_{2} 称为 第二自由度
    • 概率密度函数:f(x;n1,n2)={1B(n1/2,n2/2)n1n12n2n22xn121(n2+n1x)n1+n22x>00x0f\left(x;n_1,n_2\right)=\begin{cases}\frac{1}{B\left(n_1/2,n_2/2\right)}n_1^{\frac{n_1}{2}}n_2^{\frac{n_2}{2}}x^{\frac{n_1}{2}-1}\left(n_2+n_1x\right)^{-\frac{n_1+n_2}{2}} & x>0 \\0 & x\leq0 & \end{cases},其中 B(a,b)=01xa1(1x)b1dx=Γ(a)Γ(b)Γ(a+b)\displaystyle{B\left(a,b\right)=\int_0^1x^{a-1}\left(1-x\right)^{b-1}dx=\frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}}
    • 对给定的 α (0<α<1)\alpha\ (0<\alpha<1),称满足条件 Fα(n1,n2)f(x;n1,n2)dx=α\displaystyle{\int_{F_\alpha(n_1,n_2)}^\infty f\left(x;n_1,n_2\right)\text{d} x=\alpha} 的点 Fα(n1,n2)F_{\alpha}(n_{1},n_{2})F(n,m)F(n,m) 分布的 α\alpha 分位数
    • Fα(n1,n2)=1F1α(n2,n1)F_{\alpha} (n_{1},n_{2}) = \dfrac{1}{F_{1-\alpha} (n_{2},n_{1})}

3. 正态总体下的抽象分布

这些内容其实都是为了引出下一章枢轴量的概念。除了“X\overline{X}S2S^{2} 相互独立”这一条,别的不需要额外记忆。

  • X1,X2,,XnX_{1},X_{2},\cdots,X_{n} 为来自正态总体 N(μ,σ2)N(\mu,\sigma^{2}) 的简单随机样本,X\overline{X} 是样本均值,S2S^{2} 是样本方差,则有:
    • XN(μ,σ2n)\displaystyle{\overline{X} \sim N\left( \mu, \dfrac{\sigma^{2}}{n} \right)}
    • (n1)S2σ2χ2(n1)\dfrac{(n-1)S^{2}}{\sigma^{2}} \sim \chi^{2}(n-1)
    • X\overline{X}S2S^{2} 相互独立
    • XμS/nt(n1)\dfrac{\overline{X}-\mu}{S/\sqrt{n}} \sim t(n-1)
  • X1,X2,,Xn1X_{1},X_{2},\cdots,X_{n_{1}}Y1,Y2,,Yn2Y_{1},Y_{2},\cdots,Y_{n_{2}} 分别是来自正态总体 N(μ1,σ12)N(\mu_{1},\sigma_{1}^{2})N(μ2,σ22)N(\mu_{2},\sigma_{2}^{2}) 的样本,且这两个样本相互独立,设 X=1n1i=1n1Xi\displaystyle{\overline{X}=\dfrac{1}{n_{1}} \sum_{i=1}^{n_{1}} X_{i}}Y=1n2i=1n2Yi\displaystyle{\overline{Y}=\dfrac{1}{n_{2}} \sum_{i=1}^{n_{2}} Y_{i} } 分别是两样本的均值,S12,S22S_{1}^{2},S_2^{2} 分别是两样本的样本方差,则有
    • S12/σ12S22/σ22F(n11,n21)\dfrac{S_{1}^{2} / \sigma_{1}^{2}}{S_{2}^{2} / \sigma_{2}^{2}} \sim F(n_{1}-1,n_{2}-1)
      • (XY)(μ1μ2)σ12n1+σ22n2N(0,1)\displaystyle{\frac{\left(\overline{X}-\overline{Y}\right)-\left(\mu_1-\mu_2\right)}{\sqrt{\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}}}\sim N(0,1)}
      • σ12=σ22=σ2\sigma_{1}^{2}=\sigma_{2}^{2}=\sigma^{2} 时,(XY)(μ1μ2)Sw1n1+1n2t(n1+n22)\displaystyle{\frac{\left(\overline{X}-\overline{Y}\right)-\left(\mu_1-\mu_2\right)}{S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}}\sim t(n_1+n_2-2)},其中 Sw2=(n11)S12+(n21)S22n1+n22\displaystyle{S_w^2=\frac{\left(n_1-1\right)S_1^2+\left(n_2-1\right)S_2^2}{n_1+n_2-2}}

评论

TABLE OF CONTENTS

1. 样本
2. 抽样分布
3. 正态总体下的抽象分布