
班级_________ 姓名_________ 小组__________
学习目标
1.理解一次函数模型与线性回归模型的区别.
2.会求残差,画残差图,并能用残差图或相关指数来研究模型的精确度.
3.熟练掌握线性相关的知识点.
预习案
知识点梳理
(一)变量间相关关系知识点复习梳理
1.变量间的关系分为
2.线性回归方程 ,其中 = ;
3.y与x之间的线性回归方程必定过 点
4.相关系数
r的 与相同.
,当相关强度 ;当相关强度
(2)精读课本完成填空
1.女大学生的体重和身高之间的关系并不能用一次函数来严格刻画,可以用下面的线性回归模型来表示 ,其中和为模型的未知参数,称为________
2.线性回归模型中,自变量称为________,变量称为___ _____.
3.残差分析:
残差
残差图:横坐标表示 ,纵坐标表示 .
残差点比较均匀地落在 的区的区域中,说明选用的模型 ,带状区域的宽度越 说明拟合精度越 ,回归方程的预报精度越 .
4相关指数:
表示 对 的贡献,的值越大,说明残差平方和 ,说明模型拟合效果 .
探究案- - - 小组合作探究
问题一:某大学中随机选取8名女大学生,其身高和体重数据如下表所示.
| 编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| 身高/cm | 165 | 165 | 157 | 170 | 175 | 165 | 155 | 170 |
| 体重/kg | 48 | 57 | 50 | 54 | 61 | 43 | 59 |
思考:身高为172cm的女大学生的体重一定是60.316kg吗?如果不是,解释原因.
问题二:以问题一的例子为例,回归分析中,利用线性回归方程求出的函数值一定是真实值吗?为什么?
问题三:如何用残差发现数据中的错误,如何用残差图衡量模型的拟合效果?
| 编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| 身高/cm() | 165 | 165 | 157 | 170 | 175 | 165 | 155 | 170 |
| 体重/kg() | 48 | 57 | 50 | 54 | 61 | 43 | 59 | |
| 残差 |
课堂训练案
1.在下列各图中,两个变量具有较强正相关关系的散点图是( )
A. B. C. D.
2.观察下列关于变量x和y的三个散点图,它们从左到右的对应关系依次是( )
A.正相关、负相关、不相关 B.负相关、不相关、正相关
C.负相关、正相关、不相关 D.正相关、不相关、负相关
3.对相关系数r,下列说法正确的是( )
A.r越大,线性相关程度越大
B.r越小,线性相关程度越大
C.|r|越大,线性相关程度越小,|r|越接近0,线性相关程度越大
D.|r|≤1且|r|越接近1,线性相关程度越大,|r|越接近0,线性相关程度越小
4.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )
A.﹣1 B.0 C. D.1
5.已知x与y之间的一组数据,则y与x的线性回归方程=x+必过点( )
| x | 0 | 1 | 2 | 3 |
| y | 1 | 3 | 5 | 7 |
6.根据如下的样本数据:
| x | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| y | 7.3 | 5.1 | 4.8 | 3.1 | 2.0 | 0.3 | ﹣1.7 |
A.a>0,b>0 B.a>0,b<0 C.a<0,b>0 D.a<0,b<0
7.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )
A.x和y的相关系数为直线l的斜率
B.x和y的相关系数在0到1之间
C.当n为偶数时,分布在l两侧的样本点的个数一定相同
D.直线l过点(,)
8.在线性回归模型y=bx+a+e中,下列说法正确的是( )
A.y=bx+a+e是一次函数
B.因变量y是由自变量x唯一确定的
C.因变量y除了受自变量x的影响外,可能还受到其它因素的影响,这些因素会导致随机误差e的产生
9.某种产品的广告费支出x与销售额y(单位:万元)之间有下表关系y与x的线性回归方程为,当广告支出5万元时,随机误差的效应(残差)为( )
| x | 2 | 4 | 5 | 6 | 8 |
| y | 30 | 40 | 60 | 50 | 70 |
10.在两个变量y与x的回归模型中,分别选择了四个不同的模型,它们的相关指数R2如下,其中拟合效果最好的为( )
A.模型①的相关指数为0.976 B.模型②的相关指数为0.776
C.模型③的相关指数为0.076 D.模型④的相关指数为0.351
11.变量U与V相对应的一组样本数据为(1,1.4),(2,2.2),(3,3),(4,3.8),由上述样本数据得到U与V的线性回归分析,R2表示解释变量对于预报变量变化的贡献率,则R2=( )
A. B. C.1 D.3
12.今有一组数据,如下表:
| X | 1.993 | 3.002 | 4.001 | 5.032 | 6.121 |
| Y | 1.501 | 4.413 | 7.498 | 12.04 | 17.93 |
A.y=﹣2x﹣2 B.y= C.y=2x﹣1+1 D.y=﹣
自我评价:
