搜索
您的当前位置:首页正文

二维正态分布

来源:爱够旅游网


第14讲 二维正态分布 中心极限定理

教学目的:了解二维正态分布,理解独立同分布的中心极限定理和棣莫佛—拉普拉斯定理。 教学重点:独立同分布的中心极限定理。

教学难点:应用独立同分布的中心极限定理解决实际问题。

教学学时:2学时

教学过程:

第四章 正态分布

§4.4 二维正态分布

定义 若二维连续随机变量(X,Y)的联合概率密度为

12xy1r212(1r2)[(xx)2f(x,y)ex22r(xx)(yy)xy(yy)2y2]

( x, y )

22,0, y0, |r|1(X,Y)~N(x,y,x,2,r)(X,Y)则称服从二维正态分布,记作 。其中xy,x都是分布的参数。

f(x,y)满足概率密度的两条基本性质:

1

(1)f(x,y)0。

(2)f(x,y)dxdy1。

下面我们来讨论二维正态分布的边缘分布问题。

随机变量X的边缘概率密度为

fX(x)f(x,y)dy12xy1r2eu(x,y)dy

其中

2(xx)22r(xx)(yy)(yy)u(x,y)[]222xy2(1r)xy1

(xx)22x212(1r2)[yyyr(xx)x]2

12设21r[yyyr(xx)x]t,则有

fX(x)12x(xx)22x2eet22dt12x(xx)22x2e

2

由X与Y的对称性可求得Y的边缘密度为

fY(y)12y(yy)22y2e

由此可见,二维正态分布的两个边缘分布都是正态分布,并且可以知道

xE(X),yE(Y),xD(X),yD(Y)

下面我们可以看到参数r为随机变量X,Y的相关系数。

cov(X,Y)D(X)D(Y)E{[XE(X)][YE(Y)]}D(X)D(Y)R(X,Y)

(xx)(yy)f(x,y)dxdyxy1

r(定积分计算略)

注 由第三章的内容可知,若随机变量X与Y相互独立,则相关系数R(X,Y)0;但是,当

R(X,Y)0时,X与Y却不一定相互独立。然而,在正态分布的情形下,当相关系数R(X,Y)r0时,二维正态分布的联合概率密度可化为

f(x,y)12xye1xx)2(yy)[]2x2y22

3

12x(xx)22x2e1(yy)22y2.

2ye

fX(x)fY(y).

所以,若随机变量(X,Y)服从二维正态分布,则随机变量X与Y相互独立的充要条件是r0。

例1 若随机变量X与Y相互独立,都服从标准正态分布N(0,1),求随机变量

22函数ZXY的概率密度。

解 由于X与Y都服从标准正态分布N(0,1),概率密度分别为

x22y22fX(x)12e,

fY(x)12e

又随机变量X与Y相互独立,联合概率密度为

x2y2e2f(x,y)12

22由此得随机变量ZXY的分布函数

FZ(z)P(Zz)P(X2Y2z)

4

当z0时,显然有FZ(z)0;当z0时,有

x2y22dxdyFZ(z)

12x2y2ze

22z21 202dz0ed1e

所以z的分布函数为

z2FZ(z)1e0z0z0

由此得z的概率密度为

z12fZ(z)2e0z0z0

22注 若随机变量X与Y相互独立,都服从标准正态分布N(0,1),则随机变量函数ZXY的

2分布称为自由度为2的分布。

§4.5 中心极限定理

中心极限定理是研究在适当的条件下独立随机变量的部分和i1问题。

Xin的分布收敛于正态分布的

5

定理1 (林德伯格(Lindeberg)—列维(Levy)中心极限定理)设相互独立的随机变量

X1,X2,,Xn,服从同一分布,且

E(Xi)2D(X)0,i1,2,,n,,则对于任意实数x,i,

nt2Xinx12limPi1xedtnn2

定理的证明略,仅对定理的含义作一些说明。

YnXii1n,则有

E(Yn)E(Xi)E(Xi)ni1i1nn

n

D(Yn)D(Xi)D(Xi)n2i1i1n

2(Y)nn n

YE(Yn)Znn(Yn)又设随机变量

Xini1nn,则Zn的分布函数

FZ(x)P(Znx)P(i1Xinnx)n

6

趋于标准正态分布函数。

2结论 设相互独立的随机变量X1,X2,,Xn服从同一分布,已知均值为,方差为0,但

分布函数未知。当n充分大时,随机变量

N(n,n2)。

X1,X2,,Xn的和

YnXii1n将近似地服从正态分布

2 推论 设相互独立的随机变量X1,X2,,Xn服从同一分布,已知均值为,方差为0,

21nXXiN(,)nnni1但分布函数未知。当充分大时,近似服从正态分布。

由推论知,不论X1,X2,,Xn服从什么分布,只要它们相互独立且服从同一分布,则它们的平均数X,当n充分大时,总是近似地服从正态分布。

例2 某单位内部有260部电话分机,每个分机有4%的时间要与外线通话,可以认为每个电话分机用不同的外线是相互独立的。问总机需备多少条外线才能95%满足每个分机在用外线时不用等候?

1XK0解 令

第k个分机要用外线 (k1,2,,260)第k个分机不用外线,X1,X2,,X260是260个相互独立的随机变

量,且E(Xi)0.04。mX1X2X260表示同时使用外线的分机数,根据题意应确定最小的x使P{mx}95%成立。由上面的定理知

m260pP{mx}P260p(1p)tb12edt260p(1p)2

x260p2 7

查得(1.65)0.95050.95,故取b1.65。于是有

xb260p(1p)260p1.652600.040.962600.0415.61

也就是说,至少需要16条外线才能95%满足每个分机在用外线时不用等候。

例3 用机器包装味精,每袋净重为随机变量,期望值为100克,标准差为10克,一箱内装200袋味精。求一箱味精净重大于20500克的概率。

解 设一箱味精净重为X克,箱中第k袋味精的净重为Xk克,k1,2,,200。则X1,X2,,X200是相互独立的随机变量,且E(Xk)100,D(Xk)100,k1,2,,200。故

E(X)E(X1X2X200)20000,D(X)20000,D(X)1002

因而有

P{X20500}1P{X20500}

500X200001P1(3.54)0.000210021002

定理2 (德莫佛(De Movire)—拉普拉斯(Laplace)中心极限定理)设在独立试验序列中,事件A发生的概率为p(0p1),随机变量Yn表示事件A在n次试验中发生的次数。则对任意实数x,有

8

tx12YnnplimPxedtnnp(1p)2

2证 随机变量Xi表示事件A在第i次试验中发生的次数(i1,2,n,),则这些随机变量相互独立,服从相同的“0-1”分布,且有E(Xi)p,D(Xi)p(1p),i1,2,,n,,

YnXii1n。由定理1知

limPnnXnpt2ixYnnp1xlimPi1xe2dt2nnp(1p)np(1p)

注 在n次独立试验中,事件A发生的次数Yn~B(n,p)。定理2说明:当n充分大时,服从二项分布的随机变量Yn将近似地服从正态分布。一般来说,当n较大时,二项分布的概率计算非常复杂,这时我们可以用正态分布来近似地计算二项分布。计算公式为

kn1kknkCp(1p)P{n1mnn2}P{nn2n1npnp(1p)mnnpnp(1p)n2npnp(1p)}

(n2npnp(1p))(n1npnp(1p))

例4 设随机变量X服从B(100,0.8),求P{80X100}。

9

P{80X100}P((100801000.80.2)(80npnp(1p)8080Xnpnp(1p))100npnp(1p))

1000.80.2

(5)(0)10.50.5

例5 某电站供应10000户居民用电,设在高峰时每户用电的概率为0.8,且各户用电量多少是相互独立的。求:

(1) 同一时刻有8100户以上用电的概率。

(2) 若每户用电功率为100W,则电站至少需要多少电功率才能保证以0.975的概率供应居民用电?

解 (1)设随机变量Yn表示在10000户中同时用电的用户,则Yn~B(10000,0.8),于是

np100000.88000,np(1p)100000.80.240。

所求概率为

P(8100Yn10000)P(2.5Ynnpnp(1p)50)

(50)(2.5)10.99380.0062

(2)若每户用电功率为100W,则Yn户用电功率为100YnW。设供电站功率为QW,则由题

10

意得

P(100YnQ)P(YnYnpQQ/1008000)P(n)10040np(1p)

(Q/1008000)0.97540

Q/10080001.96(1.96)0.97540查表可知,故,Q807840。所以,电站供电功率不应少于

807.84kW。

11

因篇幅问题不能全部显示,请点此查看更多更全内容

Top