II. 随机变量及其分布

本篇笔记主要介绍了随机变量及其分布的基本概念,包括离散型随机变量和连续型随机变量的定义、性质及其分布律。内容涵盖了两点分布、二项分布、泊松分布、均匀分布、指数分布和正态分布等重要分布类型,并详细阐述了每种分布的概率密度函数和分布函数的性质。通过这些内容,读者可以更好地理解随机变量的行为及其在概率论中的应用。(由 claude-3.5-sonnet 生成摘要)

1. 离散型随机变量及其分布

  • (随机变量) 设随机试验的样本空间为 S={e}S = \{e\}, X=X(e)X = X(e) 是定义在样本空间 SS 上的实值单值函数,则称 X=X(e)X = X(e)随机变量
  • (概率分布函数)XX 是一个随机变量,xx 是任意实数,称 F(x)=P{Xx},<x<\displaystyle{F(x) = P\{X \leq x\}, -\infty < x < \infty}XX分布函数
    • 对于任意实数 x1,x2(x1<x2)x_1, x_2(x_1 < x_2),有 P{x1<Xx2}=P{Xx2}P{Xx1}=F(x2)F(x1)P\{x_1 < X \leq x_2\} = P\{X \leq x_2\} - P\{X \leq x_1\} = F(x_2) - F(x_1)
  • (离散型随机变量) 称取值至多可数的随机变量为 离散型随机变量
  • (分布律) 设离散型随机变量 XX 所有可能取的值为 xk(k=1,2,...)x_k (k = 1,2,...)XX 取各个可能值的概率,即事件 {X=xk}\{X = x_k\} 的概率,为离散型随机变量 XX分布律P{X=xk}=pk, k=1,2,P\{X=x_{k}\}=p_{k},\space k=1,2,\ldots
    • (分布律的基本性质)
      • pk0, k=1,2,p_{k} \geq 0,\space k=1,2,\ldots
      • k=1pk=1\sum_{k=1}^{\infty} p_{k} = 1
    • 分布律也可以以表格的形式表示。
  • (两点分布) 设随机变量 XX 服从以 p (0<p<1)p\ (0<p<1) 为参数的 (0-1) 分布两点分布,记为 XB(1,p)X\sim B(1,p),则 XX 只能取 0011 两个值。
    • 分布律:P{X=k}=pk(1p)1k (k{0,1})P\{X=k\}=p^{k} (1-p)^{1-k}\ (k\in \{ 0,1 \})(即 k=1k=1 的概率为 ppk=0k=0 的概率为 1p1-p
    • (伯努利实验) 设试验 EE 只有两个可能结果:AAAˉ\bar{A},则称 EE伯努利试验。设 P(A)=p (0<p<1)P(A) = p\space (0 < p < 1),则 P(Aˉ)=1pP(\bar{A} )= 1 - p
  • (二项分布) 设随机变量 XX 服从以 p,n (0<p<1, nN+)p,n\ (0<p<1,\ n\in \mathbb{N}_{+}) 为参数的 二项分布,记为 XB(n,p)X \sim B(n,p)
    • 分布律:P{X=k}=(nk)pk(1p)nk\displaystyle{P\{ X=k \}=\binom nk p^{k} (1-p)^{n-k}}
    • (nn 重伯努利试验) 将伯努利实验独立重复地进行 nn 次,称这一串重复的独立试验为 n\boldsymbol{n} 重伯努利试验
  • (泊松分布) 设随机变量 XX 服从参数为 λ (λ>0)\lambda\ (\lambda>0)泊松分布,记为 XΠ(λ)X\sim \Pi(\lambda)XP(λ)X\sim P(\lambda)
    • 分布律:P{X=k}=λkeλk!,k=0,1,2,\displaystyle{P\{X = k\} = \frac{\lambda^k e^{-\lambda}}{k!},\quad k=0,1,2,\cdots}
      • k=0P{X=k}=k=0λkk!=eλk=0λkk!=eλeλ=1\displaystyle{\sum_{k=0}^{\infty} P\{X = k\} = \sum_{k=0}^{\infty} \frac{\lambda^k}{k!} = e^{-\lambda} \sum_{k=0}^{\infty} \frac{\lambda^k}{k!} = e^{-\lambda} e^{\lambda} = 1}
    • (泊松定理)λ>0\lambda>0 是一个常数,nn 是任意正整数,设 npn=λnp_{n} = \lambda,则对于任意固定的非负整数 kk,有 limn(nk)pnk(1pn)nk=λkeλk!\displaystyle{\lim_{n \to \infty} \binom{n}{k} p_n^k (1-p_n)^{n-k} = \frac{\lambda^k e^{-\lambda}}{k!}}。也就是说以 n,pn,p 为参数的二项分布的概率值可以由参数为 λ=np\lambda=np 的泊松分布的概率值近似。

2. 连续型随机变量及其分布

  • (概率密度函数) 如果对于随机变量 XX 的分布函数 F(x)F(x),存在非负函数 f(x)f(x) 使对于任意实数 xxF(x)=xf(t)dt\displaystyle{F(x) = \int_{-\infty}^x f(t)\text dt}。则称 XX连续型随机变量,其中函数 f(x)f(x) 称为 XX概率密度函数,简称 概率密度
    • (概率密度函数的基本性质)
      • f(x)0f(x)\geq0
      • f(x)dx=1\displaystyle{\int_{-\infty}^{\infty} f(x) \text{d}x} = 1
      • 对于任意实数 x1,x2 (x1x2)x_{1},x_{2}\ (x_{1}\leq x_{2}),有 P{x1<Xx2}=F(x2)F(x1)=x1x2f(x)dx\displaystyle{ P\{x_1 < X \leq x_2\} = F(x_2) - F(x_1) = \int_{x_1}^{x_2} f(x)\text dx}
      • f(x)f(x) 在点 xx 处连续,则 F(x)=f(x)F'(x) = f(x)
  • (均匀分布) 设连续型随机变量 XX 在区间 (a,b)(a,b) 上服从 均匀分布,记为 XU(a,b)X \sim U(a,b)
    • 概率密度函数:f(x)={1baa<x<b,0other.\displaystyle{f(x) = \begin{cases}\dfrac{1}{b-a} & a < x < b, \\ 0 & \text{other.}\end{cases}}
    • 概率分布函数:F(x)={0x<a,xabaax<b,1xb.\displaystyle{F(x) = \begin{cases}0 & x < a, \\\dfrac{x-a}{b-a} & a \leq x < b, \\1 & x \geq b.\end{cases}}
  • (指数分布) 设连续型随机变量 XX 服从参数为 λ (λ>0)\lambda\ (\lambda>0)指数分布,记为 XExp(λ)X \sim \operatorname*{Exp}(\lambda)XE(λ)X \sim E(\lambda)
    • 概率密度函数:f(x)={λexλx>0,0x0.\displaystyle{f(x) = \begin{cases}\lambda e^{- x \lambda} & x > 0,\\0 & x \leq 0.\end{cases}}
    • 概率分布函数:F(x)={1exλx>0,0x0.\displaystyle{F(x) = \begin{cases}1 - e^{-x \lambda} & x > 0 ,\\0 & x \leq 0.\end{cases}}
    • (指数分布的无记忆性)XX 服从指数分布,则 s,t>0\forall s, t > 0,有 P{X>s+tX>s}=P{X>t}P\{X > s + t|X > s\} = P\{X > t\},这种性质称为 无记忆性
      • 如果 XX 表示元件寿命,无记忆性说明只要元件还没坏掉,那么元件剩余寿命仍服从参数为 λ\lambda 的指数分布。
  • 设连续型随机变量 XX 服从参数为 μ,σ2 (σ>0)\mu,\sigma^{2}\ (\sigma>0)正态分布高斯分布,记为 XN(μ,σ2)X \sim N(\mu, \sigma^{2})
    • 概率密度函数:f(x)=12πσe(xμ)22σ2, <x<\displaystyle{f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}},\ -\infty < x < \infty}
      • f(x)f(x) 关于直线 x=μx=\mu 对称。
      • fmax=f(μ)=12πσf_{\max} = f(\mu) = \dfrac{1}{\sqrt{2\pi}\sigma}
      • limxμf(x)=0\displaystyle{\lim_{ |x-\mu| \to \infty } f(x) = 0}
    • 当固定 σ\sigma,调整 μ\mu 时,函数图像可以看作沿着 xx 轴的平移变换;当固定 μ\mu 调整 σ\sigma 时,函数图像可以看做 yy 轴方向上的拉伸变换,且 σ\sigma 越小,图形越高越瘦,σ\sigma 越大,图形越矮越胖。
    • Φ(x)=12πxet2/2dt\displaystyle{\Phi(x) = \frac{1}{\sqrt{2\pi}}\int_{-\infty}^x e^{-t^2/2}dt},则 P(Xb)=Φ(bμσ)P(X\leq b) = \Phi \left( \dfrac{b-\mu}{\sigma} \right)。当 XN(μ,σ)X \sim N(\mu,\sigma)XμσN(0,1)\dfrac{X-\mu}{\sigma} \sim N(0,1),故 Φ(x)\Phi(x) 是常值函数。
      • 需背诵:Φ(0)=0.5\Phi(0) = 0.5Φ(1)=0.8413\Phi(1) = 0.8413Φ(2)=0.9772\Phi(2) = 0.9772Φ(3)=0.9987\Phi(3) = 0.9987
      • Φ(x)=1Φ(x)\Phi(-x) = 1-\Phi(x)
    • XN(μ,σ2)X \sim N(\mu,\sigma^{2})Y=aX+bY=aX + b,则 YN(aμ+b,a2σ2)Y \sim N(a \mu +b, a^{2} \sigma^{2})
  • 设随机变量 XX 具有概率密度 fX(x)f_X(x), <x<-\infty < x < \infty, 又设函数 g(x)g(x) 处处可导且恒有 g(x)>0g'(x) > 0 (或恒有 g(x)<0g'(x) < 0), 则 Y=g(x)Y = g(x) 是连续型随机变量,且其概率密度为 fY(y)={fX[h(y)]h(y),α<y<β,0,other.\displaystyle{f_Y(y) = \begin{cases}f_X[h(y)]|h'(y)|, & \alpha < y < \beta ,\\0, & \text{other.}\end{cases}} 其中 h(y)h(y)g(x)g(x) 的反函数,α=min{g(),g(+)}\alpha = \min\{g(-\infty), g(+\infty)\}, β=max{g(),g(+)}\beta = \max\{g(-\infty), g(+\infty)\}
    • 解决类似问题,关键在于找等价事件。在这一过程中,常常需要通过转化成概率分布函数作为媒介。

证明:正态分布的概率密度函数积分为 1

(xμ)/σ=t(x-\mu)/\sigma = t, 记 I=et2/2dtI = \int_{-\infty}^{\infty} e^{-t^2/2} dt, 则有 I2=e(t2+u2)/2dtduI^2 = \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} e^{-(t^2+u^2)/2} dtdu

利用极坐标得

I2=02π0rer2/2drdθ=2πI^2 = \int_0^{2\pi} \int_0^{\infty} re^{-r^2/2} drd\theta = 2\pi

评论

TABLE OF CONTENTS

1. 离散型随机变量及其分布
2. 连续型随机变量及其分布