II. 随机变量及其分布
本篇笔记主要介绍了随机变量及其分布的基本概念,包括离散型随机变量和连续型随机变量的定义、性质及其分布律。内容涵盖了两点分布、二项分布、泊松分布、均匀分布、指数分布和正态分布等重要分布类型,并详细阐述了每种分布的概率密度函数和分布函数的性质。通过这些内容,读者可以更好地理解随机变量的行为及其在概率论中的应用。(由 claude-3.5-sonnet 生成摘要)
1. 离散型随机变量及其分布
- (随机变量) 设随机试验的样本空间为 S={e}, X=X(e) 是定义在样本空间 S 上的实值单值函数,则称 X=X(e) 为 随机变量。
- (概率分布函数) 设 X 是一个随机变量,x 是任意实数,称 F(x)=P{X≤x},−∞<x<∞ 为 X 的 分布函数。
- 对于任意实数 x1,x2(x1<x2),有 P{x1<X≤x2}=P{X≤x2}−P{X≤x1}=F(x2)−F(x1)。
- (离散型随机变量) 称取值至多可数的随机变量为 离散型随机变量。
- (分布律) 设离散型随机变量 X 所有可能取的值为 xk(k=1,2,...),X 取各个可能值的概率,即事件 {X=xk} 的概率,为离散型随机变量 X 的 分布律:P{X=xk}=pk, k=1,2,…。
- (分布律的基本性质)
- pk≥0, k=1,2,…
- ∑k=1∞pk=1
- 分布律也可以以表格的形式表示。
- (两点分布) 设随机变量 X 服从以 p (0<p<1) 为参数的 (0-1) 分布 或 两点分布,记为 X∼B(1,p),则 X 只能取 0 或 1 两个值。
- 分布律:P{X=k}=pk(1−p)1−k (k∈{0,1})(即 k=1 的概率为 p,k=0 的概率为 1−p)
- (伯努利实验) 设试验 E 只有两个可能结果:A 及 Aˉ,则称 E 为 伯努利试验。设 P(A)=p (0<p<1),则 P(Aˉ)=1−p。
- (二项分布) 设随机变量 X 服从以 p,n (0<p<1, n∈N+) 为参数的 二项分布,记为 X∼B(n,p)。
- 分布律:P{X=k}=(kn)pk(1−p)n−k
- (n 重伯努利试验) 将伯努利实验独立重复地进行 n 次,称这一串重复的独立试验为 n 重伯努利试验。
- (泊松分布) 设随机变量 X 服从参数为 λ (λ>0) 的 泊松分布,记为 X∼Π(λ) 或 X∼P(λ)。
- 分布律:P{X=k}=k!λke−λ,k=0,1,2,⋯
- k=0∑∞P{X=k}=k=0∑∞k!λk=e−λk=0∑∞k!λk=e−λeλ=1
- (泊松定理) 设 λ>0 是一个常数,n 是任意正整数,设 npn=λ,则对于任意固定的非负整数 k,有 n→∞lim(kn)pnk(1−pn)n−k=k!λke−λ。也就是说以 n,p 为参数的二项分布的概率值可以由参数为 λ=np 的泊松分布的概率值近似。
2. 连续型随机变量及其分布
- (概率密度函数) 如果对于随机变量 X 的分布函数 F(x),存在非负函数 f(x) 使对于任意实数 x 有 F(x)=∫−∞xf(t)dt。则称 X 为 连续型随机变量,其中函数 f(x) 称为 X 的 概率密度函数,简称 概率密度。
- (概率密度函数的基本性质)
- f(x)≥0
- ∫−∞∞f(x)dx=1
- 对于任意实数 x1,x2 (x1≤x2),有 P{x1<X≤x2}=F(x2)−F(x1)=∫x1x2f(x)dx
- 若 f(x) 在点 x 处连续,则 F′(x)=f(x)。
- (均匀分布) 设连续型随机变量 X 在区间 (a,b) 上服从 均匀分布,记为 X∼U(a,b)。
- 概率密度函数:f(x)=⎩⎨⎧b−a10a<x<b,other.
- 概率分布函数:F(x)=⎩⎨⎧0b−ax−a1x<a,a≤x<b,x≥b.
- (指数分布) 设连续型随机变量 X 服从参数为 λ (λ>0) 的 指数分布,记为 X∼Exp(λ) 或 X∼E(λ)。
- 概率密度函数:f(x)={λe−xλ0x>0,x≤0.
- 概率分布函数:F(x)={1−e−xλ0x>0,x≤0.
- (指数分布的无记忆性) 设 X 服从指数分布,则 ∀s,t>0,有 P{X>s+t∣X>s}=P{X>t},这种性质称为 无记忆性。
- 如果 X 表示元件寿命,无记忆性说明只要元件还没坏掉,那么元件剩余寿命仍服从参数为 λ 的指数分布。
- 设连续型随机变量 X 服从参数为 μ,σ2 (σ>0) 的 正态分布 或 高斯分布,记为 X∼N(μ,σ2)。
- 概率密度函数:f(x)=2πσ1e−2σ2(x−μ)2, −∞<x<∞
-
- f(x) 关于直线 x=μ 对称。
- fmax=f(μ)=2πσ1
- ∣x−μ∣→∞limf(x)=0
- 当固定 σ,调整 μ 时,函数图像可以看作沿着 x 轴的平移变换;当固定 μ 调整 σ 时,函数图像可以看做 y 轴方向上的拉伸变换,且 σ 越小,图形越高越瘦,σ 越大,图形越矮越胖。
- 设 Φ(x)=2π1∫−∞xe−t2/2dt,则 P(X≤b)=Φ(σb−μ)。当 X∼N(μ,σ) 时 σX−μ∼N(0,1),故 Φ(x) 是常值函数。
- 需背诵:Φ(0)=0.5,Φ(1)=0.8413,Φ(2)=0.9772,Φ(3)=0.9987。
- Φ(−x)=1−Φ(x)。
- 若 X∼N(μ,σ2),Y=aX+b,则 Y∼N(aμ+b,a2σ2)。
- 设随机变量 X 具有概率密度 fX(x), −∞<x<∞, 又设函数 g(x) 处处可导且恒有 g′(x)>0 (或恒有 g′(x)<0), 则 Y=g(x) 是连续型随机变量,且其概率密度为 fY(y)={fX[h(y)]∣h′(y)∣,0,α<y<β,other. 其中 h(y) 是 g(x) 的反函数,α=min{g(−∞),g(+∞)}, β=max{g(−∞),g(+∞)}。
- 解决类似问题,关键在于找等价事件。在这一过程中,常常需要通过转化成概率分布函数作为媒介。
证明:正态分布的概率密度函数积分为 1
令 (x−μ)/σ=t, 记 I=∫−∞∞e−t2/2dt, 则有 I2=∫−∞∞∫−∞∞e−(t2+u2)/2dtdu。
利用极坐标得
I2=∫02π∫0∞re−r2/2drdθ=2π