第14讲 二维正态分布 中心极限定理
教学目的:了解二维正态分布,理解独立同分布的中心极限定理和棣莫佛—拉普拉斯定理。 教学重点:独立同分布的中心极限定理。
教学难点:应用独立同分布的中心极限定理解决实际问题。
教学学时:2学时
教学过程:
第四章 正态分布
§4.4 二维正态分布
定义 若二维连续随机变量(X,Y)的联合概率密度为
12xy1r212(1r2)[(xx)2f(x,y)ex22r(xx)(yy)xy(yy)2y2]
( x, y )
22,0, y0, |r|1(X,Y)~N(x,y,x,2,r)(X,Y)则称服从二维正态分布,记作 。其中xy,x都是分布的参数。
f(x,y)满足概率密度的两条基本性质:
1
(1)f(x,y)0。
(2)f(x,y)dxdy1。
下面我们来讨论二维正态分布的边缘分布问题。
随机变量X的边缘概率密度为
fX(x)f(x,y)dy12xy1r2eu(x,y)dy
其中
2(xx)22r(xx)(yy)(yy)u(x,y)[]222xy2(1r)xy1
(xx)22x212(1r2)[yyyr(xx)x]2
12设21r[yyyr(xx)x]t,则有
fX(x)12x(xx)22x2eet22dt12x(xx)22x2e
2
由X与Y的对称性可求得Y的边缘密度为
fY(y)12y(yy)22y2e
由此可见,二维正态分布的两个边缘分布都是正态分布,并且可以知道
xE(X),yE(Y),xD(X),yD(Y)
下面我们可以看到参数r为随机变量X,Y的相关系数。
cov(X,Y)D(X)D(Y)E{[XE(X)][YE(Y)]}D(X)D(Y)R(X,Y)
(xx)(yy)f(x,y)dxdyxy1
r(定积分计算略)
注 由第三章的内容可知,若随机变量X与Y相互独立,则相关系数R(X,Y)0;但是,当
R(X,Y)0时,X与Y却不一定相互独立。然而,在正态分布的情形下,当相关系数R(X,Y)r0时,二维正态分布的联合概率密度可化为
f(x,y)12xye1xx)2(yy)[]2x2y22
3
12x(xx)22x2e1(yy)22y2.
2ye
fX(x)fY(y).
所以,若随机变量(X,Y)服从二维正态分布,则随机变量X与Y相互独立的充要条件是r0。
例1 若随机变量X与Y相互独立,都服从标准正态分布N(0,1),求随机变量
22函数ZXY的概率密度。
解 由于X与Y都服从标准正态分布N(0,1),概率密度分别为
x22y22fX(x)12e,
fY(x)12e
又随机变量X与Y相互独立,联合概率密度为
x2y2e2f(x,y)12
22由此得随机变量ZXY的分布函数
FZ(z)P(Zz)P(X2Y2z)
4
当z0时,显然有FZ(z)0;当z0时,有
x2y22dxdyFZ(z)
12x2y2ze
22z21 202dz0ed1e
所以z的分布函数为
z2FZ(z)1e0z0z0
由此得z的概率密度为
z12fZ(z)2e0z0z0
22注 若随机变量X与Y相互独立,都服从标准正态分布N(0,1),则随机变量函数ZXY的
2分布称为自由度为2的分布。
§4.5 中心极限定理
中心极限定理是研究在适当的条件下独立随机变量的部分和i1问题。
Xin的分布收敛于正态分布的
5
定理1 (林德伯格(Lindeberg)—列维(Levy)中心极限定理)设相互独立的随机变量
X1,X2,,Xn,服从同一分布,且
E(Xi)2D(X)0,i1,2,,n,,则对于任意实数x,i,
有
nt2Xinx12limPi1xedtnn2
定理的证明略,仅对定理的含义作一些说明。
设
YnXii1n,则有
E(Yn)E(Xi)E(Xi)ni1i1nn
n
D(Yn)D(Xi)D(Xi)n2i1i1n
2(Y)nn n
YE(Yn)Znn(Yn)又设随机变量
Xini1nn,则Zn的分布函数
FZ(x)P(Znx)P(i1Xinnx)n
6
趋于标准正态分布函数。
2结论 设相互独立的随机变量X1,X2,,Xn服从同一分布,已知均值为,方差为0,但
分布函数未知。当n充分大时,随机变量
N(n,n2)。
X1,X2,,Xn的和
YnXii1n将近似地服从正态分布
2 推论 设相互独立的随机变量X1,X2,,Xn服从同一分布,已知均值为,方差为0,
21nXXiN(,)nnni1但分布函数未知。当充分大时,近似服从正态分布。
由推论知,不论X1,X2,,Xn服从什么分布,只要它们相互独立且服从同一分布,则它们的平均数X,当n充分大时,总是近似地服从正态分布。
例2 某单位内部有260部电话分机,每个分机有4%的时间要与外线通话,可以认为每个电话分机用不同的外线是相互独立的。问总机需备多少条外线才能95%满足每个分机在用外线时不用等候?
1XK0解 令
第k个分机要用外线 (k1,2,,260)第k个分机不用外线,X1,X2,,X260是260个相互独立的随机变
量,且E(Xi)0.04。mX1X2X260表示同时使用外线的分机数,根据题意应确定最小的x使P{mx}95%成立。由上面的定理知
m260pP{mx}P260p(1p)tb12edt260p(1p)2
x260p2 7
查得(1.65)0.95050.95,故取b1.65。于是有
xb260p(1p)260p1.652600.040.962600.0415.61
也就是说,至少需要16条外线才能95%满足每个分机在用外线时不用等候。
例3 用机器包装味精,每袋净重为随机变量,期望值为100克,标准差为10克,一箱内装200袋味精。求一箱味精净重大于20500克的概率。
解 设一箱味精净重为X克,箱中第k袋味精的净重为Xk克,k1,2,,200。则X1,X2,,X200是相互独立的随机变量,且E(Xk)100,D(Xk)100,k1,2,,200。故
E(X)E(X1X2X200)20000,D(X)20000,D(X)1002
因而有
P{X20500}1P{X20500}
500X200001P1(3.54)0.000210021002
定理2 (德莫佛(De Movire)—拉普拉斯(Laplace)中心极限定理)设在独立试验序列中,事件A发生的概率为p(0p1),随机变量Yn表示事件A在n次试验中发生的次数。则对任意实数x,有
8
tx12YnnplimPxedtnnp(1p)2
2证 随机变量Xi表示事件A在第i次试验中发生的次数(i1,2,n,),则这些随机变量相互独立,服从相同的“0-1”分布,且有E(Xi)p,D(Xi)p(1p),i1,2,,n,,
则
YnXii1n。由定理1知
limPnnXnpt2ixYnnp1xlimPi1xe2dt2nnp(1p)np(1p)
注 在n次独立试验中,事件A发生的次数Yn~B(n,p)。定理2说明:当n充分大时,服从二项分布的随机变量Yn将近似地服从正态分布。一般来说,当n较大时,二项分布的概率计算非常复杂,这时我们可以用正态分布来近似地计算二项分布。计算公式为
kn1kknkCp(1p)P{n1mnn2}P{nn2n1npnp(1p)mnnpnp(1p)n2npnp(1p)}
(n2npnp(1p))(n1npnp(1p))
例4 设随机变量X服从B(100,0.8),求P{80X100}。
解
9
P{80X100}P((100801000.80.2)(80npnp(1p)8080Xnpnp(1p))100npnp(1p))
1000.80.2
(5)(0)10.50.5
例5 某电站供应10000户居民用电,设在高峰时每户用电的概率为0.8,且各户用电量多少是相互独立的。求:
(1) 同一时刻有8100户以上用电的概率。
(2) 若每户用电功率为100W,则电站至少需要多少电功率才能保证以0.975的概率供应居民用电?
解 (1)设随机变量Yn表示在10000户中同时用电的用户,则Yn~B(10000,0.8),于是
np100000.88000,np(1p)100000.80.240。
所求概率为
P(8100Yn10000)P(2.5Ynnpnp(1p)50)
(50)(2.5)10.99380.0062
(2)若每户用电功率为100W,则Yn户用电功率为100YnW。设供电站功率为QW,则由题
10
意得
P(100YnQ)P(YnYnpQQ/1008000)P(n)10040np(1p)
(Q/1008000)0.97540
Q/10080001.96(1.96)0.97540查表可知,故,Q807840。所以,电站供电功率不应少于
807.84kW。
11
因篇幅问题不能全部显示,请点此查看更多更全内容