搜索
您的当前位置:首页正文

线性回归方程(提高)

来源:爱够旅游网
 ·

线性回归方程(提高)

学习目标

1.明确两个变量具有相关关系的意义; 2.知道回归分析的意义;

3.知道回归直线、回归直线方程、线性回归分析的意义;

4.掌握对两个变量进行线性回归的方法和步骤,并能借助科学计算器确定实际问题中两个变量间的回归直线 方程;

要点梳理

要点一、变量之间的相关关系

变量与变量之间存在着两种关系:一种是函数关系,另一种是相关关系。

1.函数关系

函数关系是一种确定性关系,如y=kx+b,变量取的每一个值,和它相对应。

2.相关关系

变量间确定存在关系,但又不具备函数关系所要求的确定性 相关关系分为两种: 正相关和负相关 要点诠释:

对相关关系的理解应当注意以下几点:

(1)相关关系与函数关系不同.因为函数关系是一种非常确定 的关系,而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.而函数关系可以看成是两个非随机变量之间的关系.因此,不能把相关关系等同于函数关系.

(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系.然而,学会新词并不能使脚变大,而是涉及到第三个因素——年龄.当儿童长大一些,他们的阅读能力会提高而且由于长大脚也变大.

(3)函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化.例如正方形面积S与其边长x间虽然是一种确定性关系,但在每次测量边长时,由于测量误差等原因,其数值大小又表现出一种随机性.而对于具有线性关系的两个变量来说,当求得其回归直线后,我们又可以用一种确定性的关系对这两个变量间的关系进行估计.

Word资料

都有唯一确定的值

·

3.散点图

将收集到的两个变量的统计数据分别作为横、纵坐标,在直角坐标系中描点,这样的图叫做散点图。通过散点图可初步判断两个变量之间是否具有相关关系,她反映了各数据的密切程度。

要点二、正相关、负相关

(1)正相关:在统计数据中的两个变量,一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关。如:家庭年收入越高,年饮食支出越高。反映在散点图上它们散布在从左下角到右上角的区域,按表中所列数据制作散点图如图 A 0 5 10 15 20 25 30 35 B 541.67 602.66 670.09 704.99 806.71 908.59 975.42 1034.75

(2)负相关:如果两个变量中,一个变量的值由小到大变化时,另一个变量的值由大到小变化,那么这种相关称为负相关。在散点图中,对应数据的位置为从左上角到右下角的区域。按表中所列数据制作的散点图如图。 C 5 8 16 18 28 30 35 D 64 56 50 42 37 32 21 Word资料

·

(3)无相关关系:如果关于两个变量统计数据的散点图如下图所示,那么这两个变量之间不具有相关关系。例如,学生的身高与学生的学习成绩没有相关关系。

要点诠释:

利用散点图可以大致判断两个变量之间有无相关关系。

要点三、线性回归方程

1. 回归直线方程

(1)回归直线:观察散点图的特征,发现各个大致分布在通过散点图中心的一条直线附近。如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线。求出的回归直线方程简称回归方程。

2.回归直线方程的求法 设与个观测点(是待定系数. 则

显见,偏差

.于是得到各个偏差

.

的符号有正有负,若将它们相加会造成相互抵消,所以它们的和不

最接近的直线方程为

,其中a、b

能代表几个点与相应直线在整体上的接近程度,故采用n个偏差的平方和.

表示n个点与相应直线在整体上的接近程度.

Word资料

·

记.

上述式子展开后,是一个关于a、b的二次多项式,应用配方法,可求出使Q为最小值时的a、b的值.即

, ,

相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析 上述求回归直线的方法是使得样本数据的点到回归直线的距离的平方和最小的方法,叫做最小二乘法。 要点诠释:

1.对回归直线方程只要求会运用它进行具体计算a、b,求出回归直线方程即可.不要求掌握回归直线方程的推导过程.

2.求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实标意义.否则,求出的回归直线方程毫无意义.因此,对一组数据作线性回归分析时,应先看其散点图是否成线性.

3.求回归直线方程,关键在于正确地求出系数a、b,由于求a、b的计算量较大,计算时仔细谨慎、分层进行,避免因计算产生失误.

4.回归直线方程在现实生活与生产中有广泛的应用.应用回归直线方程可以把非确定性问题转化成确定性问题,把“无序”变为“有序”,并对情况进行估测、补充.因此,学过回归直线方程以后,应增强学生应用回归直线方程解决相关实际问题的意识.

典型例题

类型一:变量间的相关关系与函数关系

1.下列两个变量之间的关系中,不是函数关系的是( ) A.角度和它的余弦值 B.正方形的边长和面积

C.正n边形的边数和其角度数之和 D.人的年龄和身高 【答案】D

【解析】函数关系是一种确定的关系。而相关关系是非确定性关系。选项A、B、C都是函数关系,可以写出它们的函数表达式:

选项D不是函数关系,在相同年龄的人群中,仍可以有不同身高的人,故选D. 【总结升华】

本题考查非数据型两个变量的相关性判断.要根据两个变量之间是否具有确定性关系及因素关系进行判断.

Word资料

·

【变式1】下列图形中具有相关关系的两个变量是( )

【答案】C

【解析】A、B中显然任给一个x都有唯一确定的y值和它对应,是函数关系;C中从散点图可看出所有点看上去都在某条直线附近波动,具有相关关系,因此变量间是不相关的。 【变式2】下列关系是相关关系的是________(填序号).

①人的年龄与他拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系;⑤学生与其学号之间的关系. 【答案】①③④

2.某小卖部为了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶杯数与当天气温的对比表。 气温x/℃ 杯数y 20 24 34 39 50 64 26 18 13 10 4 -1 请画出散点图,并判断它们是否有相关关系。 【解析】

散点图如下图:

从图中发现气温与杯数之间具有相关关系,当气温的值由小到大变化时杯数值由大变小,

所以气温和杯数成负相关。 【总结升华】画出散点图可帮助分析变量间是否具有相关关系,但不是唯一的判断途径。

【变式1】下表是某地的年降雨量与年平均气温,判断两者是相关关系吗?求回归直线方程有意义吗?

Word资料

·

年平均气温(℃) 年降雨量(mm) 12.51 12.74 12.74 13.69 13.33 12.84 13.05 748 542 507 813 574 701 432 【解析】 以x轴为年平均气温,y轴为年降雨量,可得相应的散点图如下图所示。

因为图中各点并不在一条直线的附近,所以两者不具有相关关系,求回归直线方程是没有意义的。

【总结升华】

用回归直线进行拟合两变量关系的一般步骤为: ①作出散点图,判断各点是否散布在一条直线附近。 ②如果各点散布在一条直线附近,那么可用公式求出线性回归方程;如果各点不在一条直线附近,那么求出的回归直线方程没有意义。

类型二:回归直线方程的求解

3.在钢铁中碳含量对于电阻的效应的研究中,得到如下表所示的一组数据: 碳含量/% 0.10 0.30 0.40 0.55 0.70 0.80 23.8 0.95 26 20℃时电阻/ 15 18 19 21 μΩ (1)画出散点图; (2)求回归方程. 【解析】

22.6 由散点图知能用回归直线拟合样本数据,然后,利用表中的数据,可以得到,计算公式中所需的数据,代入易得,. (1)作出散点图如下图所示.

Word资料

·

(2)由散点图可以看出,这些点大致分布在一条直线的附近,可求回归方程.由表中的数据可求得

,,,

所以回归方程为

【总结升华】

求线性回归直线方程的步骤为: 第一步:列表

第二步:计算 第三步:代入公式计算 第四步:写出直线方程.

的值;

【变式1】 某产品的广告费用x与销售额y的统计数据如下表: 广告费用x(万元) 4 销售额y(万元) 49 根据上表可得回归方程销售额为

A.63.6万元 B.65.5万元 C.67.7万元 D.72.0万元

Word资料

2 26 3 39 5 54 中的为9.4,据此模型预报广告费用为6万元时

·

【答案】选B

【解析】

【变式2】 观察两相关变量得如下数据: x - - - - - 5 3 4 2 1 1 2 3 4 5 当

时,

回归方程为

=65.5,故选B.

y - - - - - 1 5 3 7 9 9 7 5 3 1 求两变量间的回归方程. 【答案】 【解析】 列表: i 1 2 3 4 5 6 7 8 4 9 10 2 1 xi - -2 -3 -4 -5 5 3 1 yi - -7 -5 -3 -1 1 5 9 xiyi 9 14 15 计算得:

12 。

5 3 7 9 5 15 12 14 9 ,。

∴。

Word资料

·

∴所求回归直线方程为

类型三:利用回归直线对总体进行估计

4.给出了随机抽取的10位男性的收缩血压.

年龄x(岁) 37 35 41 43 42 年龄x(岁) 收缩压y(毫米汞柱) 收缩压y(毫米汞柱) 110 117 125 130 138 50 49 54 60 65 146 148 150 154 160 (1)画出散点图;

(2)求出收缩压与年龄之间的回归直线;

(3)利用所求回归直线分别预测20岁、45岁的人的收缩压是多少? (4)就(3)所得预测结果,比较其预测的精确性。 【解析】

(1)散点图为:

(2)收缩压与年龄之间的回归直线 列表: 序号 x y x 2

xy Word资料

·

1 2 3 4 5 6 7 8 9 10 求和

37 110 1369 4070 35 117 1225 4095 41 125 1681 5125 43 130 1849 5590 42 138 1764 5796 50 146 2500 7300 49 148 2401 7252 54 150 2916 8100 60 154 3600 9240 65 160 4225 10400 476 1378 23530 66968

所以y对x的回归直线方程为:

(3)根据所求的回归直线方程可以预测20岁的收缩压为

45岁的收缩压为:

毫米汞柱

(4)预测20岁的结果时,20是外推的,所以不是很精确;而45是插值,所以精确性比20的预测结果要好。

【总结升华】只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.

【变式1】为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:

Word资料

·

父亲身高x(cm) 174 儿子身高y(cm) 175 176 175 176 176 176 177 178 177 则y对x的线性回归方程为( ).

【答案】C

【变式2】下表是某地搜集到的新房屋的销售价格y,(单位:万元)和房屋的面积x(单位:m。)的数据: x y 115 44.8 110 41.6 80 38.4 135 49.2 105 42 (1)画出散点图; (2)求回归方程;

(3)根据(2)的结果估计当房屋面积为150 m时的销售价格. 【解析】

据已知样本数据得到回归直线方程后,即得到两个变量之间相关关系的一个规律,因此可将给定的x值代入回归直线方程预测y值. (1)散点图如下图所示.

2

(2)由散点图可以看出,这些点大致分布在一条直线的附近,可求回归方程.由表中的数据,

用计算器计算得,,,.

.故所求回归方程为

(3)根据上面求得的回归方程,当房屋面积为1500时销售价格的估计值为0.196×150+21.836=51.236(万元)

Word资料

·

巩固练习

1.下列所给出的两个变量之间存在相关关系的是( ). A.学生的座号与数学成绩 B.学生的学号与身高

C.曲线上的点与该点的坐标之间的关系 D.学生的身高与体重

2.下列各图中所示两个变量具有相关关系的是( ).

A.①② B.①③ C.②④ D.②③

3.一位母亲记录了她儿子3岁到9岁的身高,建立了儿子身高 (单位:cm)与年龄的回归方程 为

,用这个方程预测儿子10岁时的身高,则下面的叙述正确的是( ).

A.她儿子10岁时的身高一定是145.83 cm B.她儿子10岁时的身高在145.83 cm以上 C.她儿子10岁时的身高在145.83 cm左右 D.她儿子10岁时的身高在145.83 cm以下

4.对变量x,y,有观测数据(xi,yi)(i=1,2,…,10),得散点图(1); 对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( ).

A.变量x与y正相关,u与v正相关

Word资料

·

B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关

5.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),表示变量Y与X之间的线性相关系数,间的线性相关系数,则( ) A.

6.下列说法中,错误的是( ).

A.如果变量x与y之间存在着线性相关关系,那么根据实验数据得到的点(xi,yi)(i=1,2,…,n)将散布在某一条直线的附近

B.如果变量x和y之间不存在线性相关关系,那么根据它们的一组数据(xi,yi)(i=1,2,…,n)不能写出一个线性回归方程

C.设x、y是具有相关关系的两个变量,且y关于x的线性回归方程为就是回归系数

D.为使求出的线性回归直线方程有意义,可用统计假设检验的方法来判断变量x和y之间是否存在线性相关关系

7.已知x与y之间的一组数据: x y 0 1 1 3 2 5 3 7 ,、

B.

C.

D.

表示变量V与U之

则y与x的线性回归方程为必过( )

A.(2,2)点 B.(1.5,0)点 C.(1,2)点 D.(1.5,4)点

8.为了考察两个变量x和y之间的线性关系,甲、乙两位同学各自独立做了10次和15次试验,并且利用线性回归方法求得回归直线分别为1、2,已知两人得到的试验数据中,变量x和y的数据的平均值都相等, 且分别都是s、t,那么下列说确的是( ). A.直线

Word资料

1

2

一定有公共点(s,t)

·

B.直线

1

2

相交,但交点不一定是(s,t)

C.必有直线1∥2 D.

9.经实验得(x,y)的四个值,即(1,2),(2,3),(3,4),(4,5).y与x之间的回归直线方程 是______.

10.回归分析是处理变量之间的________关系的一种统计方法.两个变量之间具有线性相关关系时,称相应的回归分析为________.

11.为了解篮球爱好者小的投篮命中率与打篮球时间之间的关系,下表记录了小某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系: 时间x 命中率y 1 0.4 2 0.5 3 0.6 4 0.6 5 0.4 1

2

必定重合

小这5天的平均投篮命中率为________;用线性回归分析的方法,预测小该月6号打6小时篮球的投篮命中率为________。

12.某农场粮食产量的统计结果如图所示,从图中我们可以看到前年的粮食总产量与之间的关系。则从目前的统计结果来看,前______年的年平均粮食产量最高。

13.假设学生在七年级和八年级数学成绩是线性相关的,若10个学生七年级(x)和八年级(y)数学分数如下 x 74 71 72 68 76 73 67 70 65 74 y 76 75 71 70 76 79 65 77 62 72 试求七年级和八年级数学分数间的回归直线方程.

14.一般来说,一个人的身高越高,他的手就越大,为调查这一问题,对某校10名高一男生的身高与右手长度进行测量得到如下数据(单位:cm): 身高 168 170 171 172 174 176 178 178 180 181 Word资料

·

右手长 19.0 20.0 21.0 21.5 21.0 22.0 24.0 23.0 22.5 23.0 度 (1)根据上述数据制作散点图,判断两者有无线性相关关系; (2)如果具有线性相关关系,求回归方程;

(3)如果一名同学身高为185 cm,估计他的右手长.

【答案与解析】 1.【答案】D

【解析】A与B中的两个变量之间没有任何关系;C中的两个变量之间具有函数关系.故选D. 2.【答案】D

【解析】具有相关关系的两个变量的数据所对应的图形是散点图,②③能反映两个变量的变化规律,

它们之间是相关关系.故选D. 3.【答案】C

【解析】利用回归方程进行预测,只能说身高在某一预测值附近. 由回归方程预测儿子10岁时的身高

(cm).故选C. 4.【答案】C

【解析】由这两个散点图可以判断,变量x与y负相关,u与v正相关.故选C. 5.【答案】C 【解析】画散点图,由散点图可知X与Y正相关,则相关系数关,相关系数

,故选C.

U与V是负相

6.【答案】D

【解析】B中,相关系数的正负体现两变量之间是正相关还是负相关.两变量若具有相关关系,

才能进行回归分析.若不具有相关关系,求得的方程无意义,故D错,C对. 7.【答案】D 【解析】本题考查的是回归直线方程

经过样本的中心(

点,,

在本题中,样本中心为(1.5,4),所以直线过(1.5,4)点. 8.【答案】A 【解析】线性回归直线方程为

,而

1

,即

2

,.

∴(s,t)在回归直线上.∴直线 9.【答案】

一定有公共点(s,t).

【解析】 四个点的坐标适合方程x+1=y,所以回归直线方程.

Word资料

·

10.【答案】相关 线性回归分析

【解析】了解回归分析是怎么回事,它的作用是什么.就可求解. 11.【答案】0.5 0.53

【解析】平均命中率y=×(0. 4+0.5+0.6+0.6+0.4)=0.5;而,

0.1)=0.1,

(-2)×(-0.1)+( -1)×0+0×0.1+1×0.1+2×(-

(-2)+(-1)+0+1+2=10,于是

22222

∴ 12.【答案】3 13.【答案】

,令x=6,得

【解析】因为,,,,

所以,

所以回归直线方程是 14.【解析】

(1)散点图如下图所示.

可见,身高与右手长之间的总体趋势成一条直线,即它们线性相关. (2)设回归直线方程是

根据以上数据可由计算器计算得

Word资料

,,,

·

∴回归直线方程为 (3)当x=185时,cm.

.故该同学的右手长可能为24.8

Word资料

因篇幅问题不能全部显示,请点此查看更多更全内容

Top