資源簡介 8.2 一元線性回歸模型及其應用第1課時 一元線性回歸模型及其應用(概念課逐點理清式教學)課時目標1.了解最小二乘原理,掌握一元線性回歸模型參數的最小二乘估計方法,建立一元線性回歸模型進行預測.2.了解隨機誤差、殘差、殘差圖的概念.3.會通過殘差分析一元線性回歸模型的擬合效果.逐點清(一) 一元線性回歸模型[多維度理解] 我們稱為Y關于x的 模型.其中,Y稱為 或 ,x稱為 或 ;a和b為模型的未知參數,a稱為 參數,b稱為 參數;e是Y與bx+a之間的 . [細微點練明]1.[多選]在線性回歸模型Y=bx+a+e中,下列說法不正確的是 ( )A.Y=bx+a+e是一次函數B.響應變量Y是由解釋變量x唯一確定的C.響應變量Y除了受解釋變量x的影響外,可能還受到其他因素的影響,這些因素會導致隨機誤差e的產生D.隨機誤差e是由于計算不準確造成的,可通過精確計算避免隨機誤差e的產生2.某地的財政收入x與支出y滿足線性回歸方程=bx+a+e(單位:億元),其中b=0.8,a=2,|e|≤0.5,如果今年該地區財政收入10億元,則今年支出預計不會超過 億. 3.判斷下列變量間哪些能用函數模型刻畫,哪些能用回歸模型刻畫 (1)某公司的銷售收入和廣告支出;(2)某城市寫字樓的出租率和每平方米月租金;(3)航空公司的顧客投訴次數和航班正點率;(4)某地區的人均消費水平和人均國內生產總值(GDP);(5)學生期末考試成績和考前用于復習的時間;(6)一輛汽車在某段路程中的行駛速度和行駛時間;(7)正方形的面積與周長.逐點清(二) 最小二乘法和經驗回歸方程[多維度理解] 我們將=x+稱為Y關于x的 ,也稱經驗回歸函數或經驗回歸公式,其圖形稱為 .這種求經驗回歸方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估計,其中 微點助解(1)經驗回歸直線過點(,).(2)經驗回歸直線的截距和斜率都是通過樣本估計而得的,存在著誤差,這種誤差可能導致預報結果的偏差.(3)經驗回歸方程=+x中的表示x增加1個單位時,y的平均變化量為,而表示y不隨x的變化而變化的部分.[細微點練明]1.某單位為了了解辦公樓用電量y(度)與氣溫x(℃)之間的關系,隨機統計了四個工作日的用電量與當天平均氣溫,并制作了對照表:氣溫x/℃ 18 13 10 -1用電量y/度 24 34 38 64由表中數據得到經驗回歸方程=-2x+,則當氣溫為-3 ℃時,預測用電量為 ( )A.68度 B.66度C.28度 D.12度2.若根據變量x與y的對應關系(如表),求得y關于x的經驗回歸方程為=6.5x+17.5,則表中m的值為 ( )x 2 4 5 6 8y 30 40 m 50 70A.60 B.55C.50 D.453.某地隨著經濟的發展,居民收入逐年增長,該地一銀行連續五年年底的儲蓄存款情況如表所示.年份x 2019 2020 2021 2022 2023儲蓄存款額 y/千億元 5 6 7 8 10為了計算方便,工作人員將上表的數據進行了處理,令t=x-2 018,z=y-5,得到下表.t 1 2 3 4 5z 0 1 2 3 5(1)作z關于t的散點圖,求z關于t的經驗回歸方程;(2)通過(1)中的方程,求出y關于x的回歸方程.逐點清(三) 線性回歸分析[多維度理解]1.殘差與殘差分析(1)對于響應變量Y,通過觀測得到的數據稱為觀測值,通過經驗回歸方程得到的稱為預測值,觀測值減去預測值所得到的差稱為 .殘差是隨機誤差的估計結果,通過殘差的分析可以判斷模型刻畫數據的效果,以及判斷原始數據中是否存在可疑數據等,這方面工作稱為 . (2)殘差圖中,若殘差點比較均勻地落在水平的帶狀區域內,帶狀區域 ,則說明擬合效果越好. 微點助解 在使用經驗回歸方程進行預測時,需要注意的問題:(1)經驗回歸方程只適用于所研究的樣本的總體.(2)所建立的經驗回歸方程一般都有時效性.(3)解釋變量的取值不能離樣本數據的范圍太遠.一般解釋變量的取值在樣本數據范圍內,經驗回歸方程的預報效果會比較好,超出這個范圍越遠,預報的效果越差.(4)不能期望經驗回歸方程得到的預報值就是響應變量的精確值.2.決定系數(1)殘差平方和 (yi-)2越 ,模型的擬合效果越 . (2) R2的計算公式為R2=1-.在R2表達式中, (yi-)2與經驗回歸方程無關,殘差平方和 (yi-i)2與經驗回歸方程有關.因此R2越大,表示殘差平方和 ,即模型的擬合效果 ;R2越小,表示殘差平方和越大,即模型的擬合效果 . [細微點練明]1.[多選]對變量y和x的一組成對樣本數據(x1,y1),(x2,y2),…,(xn,yn)進行回歸分析,建立回歸模型,則 ( )A.殘差平方和越大,模型的擬合效果越好B.在做線性回歸分析時,殘差圖中殘差點分布的帶狀區域的寬度越窄表示回歸效果越好C.用決定系數R2來刻畫回歸效果,R2越小,說明模型的擬合效果越好D.若y和x的樣本相關系數r=-0.95,則y和x之間具有很強的負線性相關關系2.對變量x,y進行回歸分析時,依據得到的4個不同的回歸模型畫出殘差圖,則下列模型擬合精度最高的是 ( )3.已知一系列樣本點(xi,yi)(i=1,2,3,…,n)的經驗回歸方程為=2x+a,若樣本點(r,1)與(1,s)的殘差相同,則有 ( )A.r=s B.s=2rC.s=-2r+3 D.s=2r+14.假定小麥基本苗數x與成熟期有效穗y之間存在相關關系,今測得5組數據如下:x 15.0 25.8 30.0 36.6 44.4y 39.4 42.9 42.9 43.1 49.2若由最小二乘法計算得經驗回歸方程=0.29x+34.7.(1)計算各組殘差,并計算殘差平方和;(2)求R2,并說明回歸模型擬合效果的好壞.第1課時 一元線性回歸模型及其應用[逐點清(一)][多維度理解] 一元線性回歸 因變量 響應變量 自變量 解釋變量 截距 斜率 隨機誤差[細微點練明]1.選ABD 對于A,線性回歸模型Y=bx+a+e中,方程表示的不是確定性關系,因此不是一次函數,所以A錯誤;對于B,響應變量Y不是由解釋變量x唯一確定的,所以B錯誤;對于C,響應變量Y除了受解釋變量x的影響外,可能還受到其他因素的影響,這些因素會導致隨機誤差e的產生,所以C正確;對于D,隨機誤差是不能避免的,只能將誤差縮小,所以D錯誤.2.解析:由題設,=0.8x+2+e,∴當x=10時,=10+e,又|e|≤0.5,即-0.5≤e≤0.5,∴9.5≤≤10.5,故今年支出預計不會超過10.5億.答案:10.53.解:(1)(2)(3)(4)(5)屬于回歸模型,(6)(7)屬于函數模型.[逐點清(二)][多維度理解] 經驗回歸方程 經驗回歸直線 -[細微點練明]1.選B 由表中數據可知==10,==40,所以經驗回歸直線=-2x+過點(10,40),即40=-2×10+,得=60,則經驗回歸方程為=-2x+60,當x=-3時,=-2×(-3)+60=66.2.選A 由表中數據,得=×(2+4+5+6+8)=5,=×(30+40+m+50+70)=38+,因為經驗回歸直線=6.5x+17.5過點,所以38+=6.5×5+17.5,解得m=60.3.解:(1)作散點圖,直觀看z與t具有線性相關關系.根據z關于t的表格數據,得=×(1+2+3+4+5)=3,=×(0+1+2+3+5)=2.2,且tizi=45,t=55,所以===1.2,=-=2.2-1.2×3=-1.4.所以z關于t的經驗回歸方程為=1.2t-1.4.(2)由(1)知=1.2t-1.4,代入t=x-2 018,z=y-5,得-5=1.2(x-2 018)-1.4,即=1.2x-2 418.故y關于x的回歸方程為=1.2x-2 418.[逐點清(三)][多維度理解] 1.(1)殘差 殘差分析 (2)越窄 2.(1)小 好 (2)越小 越好 越差[細微點練明]1.選BD 因為殘差平方和越小,模型的擬合效果越好,故A錯誤;在做線性回歸分析時,殘差圖中殘差點分布的帶狀區域的寬度越窄表示回歸效果越好,故B正確;因為決定系數R2越接近1,說明模型的擬合效果越好,故C錯誤;由樣本相關系數為負且接近-1,可知y和x之間具有很強的負線性相關關系,故D正確.2.選A 用殘差圖判斷模型的擬合效果,殘差點比較均勻地落在水平的帶狀區域中,說明這樣的模型比較合適,帶狀區域的寬度越窄,說明模型的擬合精度越高.3.選C 樣本點(r,1)的殘差為1-2r-a,樣本點(1,s)的殘差為s-a-2.依題意得1-2r-a=s-a-2,故s=-2r+3.4.解: (1)由i=xi+,可以算得i=yi-i.分別為1=0.35,2=0.718,3=-0.5,4=-2.214,5=1.624,所以殘差平方和為 (i)2≈8.43.(2)因為 (yi-)2=50.18,故R2=1-≈1-≈0.832,所以回歸模型的擬合效果較好.1 / 4(共64張PPT)8.2一元線性回歸模型及其應用一元線性回歸模型及其應用(概念課——逐點理清式教學)第1課時課時目標1.了解最小二乘原理,掌握一元線性回歸模型參數的最小二乘估計方法,建立一元線性回歸模型進行預測.2.了解隨機誤差、殘差、殘差圖的概念.3.會通過殘差分析一元線性回歸模型的擬合效果.CONTENTS目錄123逐點清(一) 一元線性回歸模型逐點清(二) 最小二乘法和經驗回歸方程逐點清(三) 線性回歸分析4課時跟蹤檢測逐點清(一) 一元線性回歸模型01多維度理解我們稱為Y關于x的______________模型.其中,Y稱為_________或___________,x稱為________或___________;a和b為模型的未知參數,a稱為______參數,b稱為_______參數;e是Y與bx+a之間的___________.一元線性回歸因變量響應變量自變量解釋變量截距斜率隨機誤差細微點練明1.[多選]在線性回歸模型Y=bx+a+e中,下列說法不正確的是 ( )A.Y=bx+a+e是一次函數B.響應變量Y是由解釋變量x唯一確定的C.響應變量Y除了受解釋變量x的影響外,可能還受到其他因素的影響,這些因素會導致隨機誤差e的產生D.隨機誤差e是由于計算不準確造成的,可通過精確計算避免隨機誤差e的產生√√√解析:對于A,線性回歸模型Y=bx+a+e中,方程表示的不是確定性關系,因此不是一次函數,所以A錯誤;對于B,響應變量Y不是由解釋變量x唯一確定的,所以B錯誤;對于C,響應變量Y除了受解釋變量x的影響外,可能還受到其他因素的影響,這些因素會導致隨機誤差e的產生,所以C正確;對于D,隨機誤差是不能避免的,只能將誤差縮小,所以D錯誤.2.某地的財政收入x與支出y滿足線性回歸方程=bx+a+e(單位:億元),其中b=0.8,a=2,|e|≤0.5,如果今年該地區財政收入10億元,則今年支出預計不會超過_______億. 解析:由題設,=0.8x+2+e,∴當x=10時,=10+e,又|e|≤0.5,即-0.5≤e≤0.5,∴9.5≤≤10.5,故今年支出預計不會超過10.5億.10.53.判斷下列變量間哪些能用函數模型刻畫,哪些能用回歸模型刻畫 (1)某公司的銷售收入和廣告支出;(2)某城市寫字樓的出租率和每平方米月租金;(3)航空公司的顧客投訴次數和航班正點率;(4)某地區的人均消費水平和人均國內生產總值(GDP);(5)學生期末考試成績和考前用于復習的時間;(6)一輛汽車在某段路程中的行駛速度和行駛時間;(7)正方形的面積與周長.解:(1)(2)(3)(4)(5)屬于回歸模型,(6)(7)屬于函數模型.逐點清(二) 最小二乘法和經驗回歸方程02多維度理解我們將=x+稱為Y關于x的________________,也稱經驗回歸函數或經驗回歸公式,其圖形稱為________________.這種求經驗回歸方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估計, 其中經驗回歸方程經驗回歸直線微點助解(1)經驗回歸直線過點(,).(2)經驗回歸直線的截距和斜率都是通過樣本估計而得的,存在著誤差,這種誤差可能導致預報結果的偏差.(3)經驗回歸方程=+x中的表示x增加1個單位時,y的平均變化量為,而表示y不隨x的變化而變化的部分.細微點練明1.某單位為了了解辦公樓用電量y(度)與氣溫x(℃)之間的關系,隨機統計了四個工作日的用電量與當天平均氣溫,并制作了對照表:由表中數據得到經驗回歸方程=-2x+,則當氣溫為-3 ℃時,預測用電量為( )A.68度 B.66度 C.28度 D.12度氣溫x/℃ 18 13 10 -1用電量y/度 24 34 38 64√解析:由表中數據可知==10,==40,所以經驗回歸直線=-2x+過點(10,40),即40=-2×10+,得=60,則經驗回歸方程為=-2x+60,當x=-3時,=-2×(-3)+60=66.2.若根據變量x與y的對應關系(如表),求得y關于x的經驗回歸方程為=6.5x+17.5,則表中m的值為( )√x 2 4 5 6 8y 30 40 m 50 70A.60 B.55C.50 D.45解析:由表中數據,得=×(2+4+5+6+8)=5,=×(30+40+m+50+70)=38+,因為經驗回歸直線=6.5x+17.5過點,所以38+=6.5×5+17.5,解得m=60.3.某地隨著經濟的發展,居民收入逐年增長,該地一銀行連續五年年底的儲蓄存款情況如表所示.年份x 2019 2020 2021 2022 2023儲蓄存款額 y/千億元 5 6 7 8 10為了計算方便,工作人員將上表的數據進行了處理,令t=x-2 018,z=y-5,得到下表.t 1 2 3 4 5z 0 1 2 3 5(1)作z關于t的散點圖,求z關于t的經驗回歸方程;解:作散點圖,直觀看z與t具有線性相關關系.根據z關于t的表格數據,得=×(1+2+3+4+5)=3,=×(0+1+2+3+5)=2.2,(2)通過(1)中的方程,求出y關于x的回歸方程.解:由(1)知=1.2t-1.4,代入t=x-2 018,z=y-5,得-5=1.2(x-2 018)-1.4,即=1.2x-2 418.故y關于x的回歸方程為=1.2x-2 418.逐點清(三) 線性回歸分析03多維度理解1.殘差與殘差分析(1)對于響應變量Y,通過觀測得到的數據稱為觀測值,通過經驗回歸方程得到的稱為預測值,觀測值減去預測值所得到的差稱為______.殘差是隨機誤差的估計結果,通過殘差的分析可以判斷模型刻畫數據的效果,以及判斷原始數據中是否存在可疑數據等,這方面工作稱為___________.(2)殘差圖中,若殘差點比較均勻地落在水平的帶狀區域內,帶狀區域_____,則說明擬合效果越好.殘差殘差分析越窄微點助解 在使用經驗回歸方程進行預測時,需要注意的問題:(1)經驗回歸方程只適用于所研究的樣本的總體.(2)所建立的經驗回歸方程一般都有時效性.(3)解釋變量的取值不能離樣本數據的范圍太遠.一般解釋變量的取值在樣本數據范圍內,經驗回歸方程的預報效果會比較好,超出這個范圍越遠,預報的效果越差.(4)不能期望經驗回歸方程得到的預報值就是響應變量的精確值.R2越大,表示殘差平方和______,即模型的擬合效果_____;R2越小,表示殘差平方和越大,即模型的擬合效果______.小好越小越好越差1.[多選]對變量y和x的一組成對樣本數據(x1,y1),(x2,y2),…,(xn,yn)進行回歸分析,建立回歸模型,則 ( )A.殘差平方和越大,模型的擬合效果越好B.在做線性回歸分析時,殘差圖中殘差點分布的帶狀區域的寬度越窄表示回歸效果越好C.用決定系數R2來刻畫回歸效果,R2越小,說明模型的擬合效果越好D.若y和x的樣本相關系數r=-0.95,則y和x之間具有很強的負線性相關關系細微點練明√√解析:因為殘差平方和越小,模型的擬合效果越好,故A錯誤;在做線性回歸分析時,殘差圖中殘差點分布的帶狀區域的寬度越窄表示回歸效果越好,故B正確;因為決定系數R2越接近1,說明模型的擬合效果越好,故C錯誤;由樣本相關系數為負且接近-1,可知y和x之間具有很強的負線性相關關系,故D正確.2.對變量x,y進行回歸分析時,依據得到的4個不同的回歸模型畫出殘差圖,則下列模型擬合精度最高的是 ( )√解析:用殘差圖判斷模型的擬合效果,殘差點比較均勻地落在水平的帶狀區域中,說明這樣的模型比較合適,帶狀區域的寬度越窄,說明模型的擬合精度越高.3.已知一系列樣本點(xi,yi)(i=1,2,3,…,n)的經驗回歸方程為=2x+a,若樣本點(r,1)與(1,s)的殘差相同,則有( )A.r=s B.s=2rC.s=-2r+3 D.s=2r+1解析:樣本點(r,1)的殘差為1-2r-a,樣本點(1,s)的殘差為s-a-2.依題意得1-2r-a=s-a-2,故s=-2r+3.√4.假定小麥基本苗數x與成熟期有效穗y之間存在相關關系,今測得5組數據如下:x 15.0 25.8 30.0 36.6 44.4y 39.4 42.9 42.9 43.1 49.2若由最小二乘法計算得經驗回歸方程=0.29x+34.7.(1)計算各組殘差,并計算殘差平方和;(2)求R2,并說明回歸模型擬合效果的好壞.課時跟蹤檢測041345678910111221.在兩個變量y與x的回歸模型中,分別選擇了4個不同的模型,它們的R2如下,其中擬合效果最好的模型是 ( )√模型 模型1 模型2 模型3 模型4R2 0.98 0.80 0.50 0.25A.模型1 B.模型2C.模型3 D.模型4解析:決定系數R2=0.98最大,擬合效果最好.1567891011122342.在一次試驗中,測得(x,y)的四組值分別是(1,2),(2,3),(3,4),(4,5),則y關于x的經驗回歸方程為 ( )A.=x+1 B.=x+2C.=2x+1 D.=x-1解析:易求=2.5,=3.5,且=1,所以=3.5-1×2.5=1,因此經驗回歸方程為=x+1.√1567891011123423.兩個線性相關變量x與y的統計數據如表所示:其經驗回歸方程是=x+40,則相對應于點(11,5)的殘差為( )A.0.1 B.0.2C.0.3 D.0.4√x 9 9.5 10 10.5 11y 11 10 8 6 5156789101112342解析:由于=x+40過樣本中心點(10,8),所以8=10+40,則=-3.2,因此=-3.2x+40.當x=11時,=-3.2×11+40=4.8,所以殘差=5-=5-4.8=0.2.1567891011123424.根據變量Y和x的成對樣本數據,由一元線性回歸模型得到經驗回歸方程=x+,對應的殘差如圖所示,模型誤差( )156789101112342A.滿足一元線性回歸模型的所有假設B.滿足回歸模型E(e)=0的假設C.滿足回歸模型D(e)=σ2的假設D.不滿足回歸模型E(e)=0和D(e)=σ2的假設解析:由殘差圖可以看出,圖中的殘差點不能擬合成一條直線,且不滿足D(e)=σ2.√1567891011123425.[多選]已知變量x,y之間的經驗回歸方程為=-0.7x+10.3,且變量x,y之間的一組相關數據如下表所示,則下列說法正確的是( )√x 6 8 10 12y 6 m 3 2A.變量x,y之間呈負相關關系B.m=4C.可以預測,當x=11時,y約為2.6D.由表格數據知,該經驗回歸直線必過點(9,4)√√156789101112342解析:由=-0.7x+10.3,得=-0.7,故x,y呈負相關關系,則A正確.==9,=-0.7×9+10.3=4=,解得m=5,B錯誤.當x=11時,y的預測值為2.6,故C正確.=9,=4,故經驗回歸直線必過點(9,4),則D正確.156789101112342√1567891011123421567891011123427.[多選]設(x1,y1),(x2,y2),…,(x2 024,y2 024)是變量x和y的2 024個樣本點,直線l是由這些樣本點通過最小二乘法得到的經驗回歸直線,如圖所示,下列結論正確的是 ( )A.直線l過點(,)B.直線l過點(x1 012,y1 012)C.x和y的樣本相關系數在區間[-1,0)上D.因為2 024是偶數,所以分布在直線l兩側的樣本點的個數一定相同√√156789101112342解析:經驗回歸直線一定過樣本中心點,但不一定過某個樣本點,故A正確,B錯誤;由題圖可知x和y的樣本相關系數在區間[-1,0)上,故C正確;不能因為2 024是偶數就斷定分布在直線l兩側的樣本點的個數相同,故D錯誤.1567891011123428.[多選]已知兩個變量y與x線性相關,為研究其具體的線性關系進行了10次試驗.試驗中不慎丟失2個數據點,根據剩余的8個數據點求得的經驗回歸方程為=3x+4.5,且=4,又增加了2次試驗,得到2個數據點(2,11),(6,22),根據這10個數據點重新求得經驗回歸方程為=mx+n(其中m,n∈R),則( )156789101112342A.變量y與x正相關B.m<3C.n<4.5D.經驗回歸直線=mx+n經過點(4,16.5)√√√156789101112342解析:設A(2,11),B(6,22),由kAB=<3,而8個數據點的經驗回歸方程中=3,∴0==16.5,∴經驗回歸直線過定點(4,16.5),則16.5=4m+n,n=16.5-4m,0<16.5,即4.51567891011123429.為了解籃球愛好者小李的投籃命中率與打籃球時間之間的關系,下表記錄了小李某月1號到5號每天打籃球時間x(單位:h)與當天投籃命中率y之間的關系:時間x 1 2 3 4 5命中率y 0.4 0.5 0.6 0.6 0.4小李這5天的平均投籃命中率為______,用線性回歸分析的方法,預測小李該月6號打6 h籃球的投籃命中率為_______. 0.50.53156789101112342解析:===0.5,==3.由公式得=0.01,從而=-=0.5-0.01×3=0.47,所以經驗回歸方程為=0.47+0.01x,所以當x=6時,=0.47+0.01×6=0.53.15678910111234210.某工廠為研究某種產品產量x(噸)與所需某種原料y(噸)的相關性,在生產過程中收集4組對應數據(x,y)如表所示:x 3 4 6 7y 2.5 3 4 m根據表中數據,得出y關于x的經驗回歸方程為=0.7x+.據此計算出在樣本(4,3)處的殘差為-0.15,則表中m的值為______. 5.9156789101112342解析:根據樣本(4,3)處的殘差為-0.15,即3-(0.7×4+)=-0.15,可得=0.35,故經驗回歸方程為=0.7x+0.35,又由樣本數據的平均數為==5,=,所以0.7×5+0.35=,解得m=5.9.156789101112342156789101112342156789101112342(2)判斷變量x與y之間是正相關還是負相關;解:由于變量y的值隨x值的增加而增加(=0.3>0),故x與y之間是正相關.156789101112342解:將x=7代入經驗回歸方程可以預測該家庭的月儲蓄為=0.3×7-0.4=1.7(千元).15678910111234212.假設關于某設備的使用年限x(單位:年)和支出的維修費用y(單位:萬元),有如表的統計資料:使用年限x/年 2 3 4 5 6維修費用y/萬元 2.2 3.8 5.5 6.5 7.0若由資料知y對x呈線性相關關系,試求:(1)經驗回歸方程=x+;156789101112342156789101112342(2)估計使用年限為10年時,維修費用是多少 156789101112342(3)計算殘差平方和;156789101112342(4)求R2并說明模型的擬合效果.課時跟蹤檢測(二十四) 一元線性回歸模型及其應用1.在兩個變量y與x的回歸模型中,分別選擇了4個不同的模型,它們的R2如下,其中擬合效果最好的模型是 ( )模型 模型1 模型2 模型3 模型4R2 0.98 0.80 0.50 0.25A.模型1 B.模型2C.模型3 D.模型42.在一次試驗中,測得(x,y)的四組值分別是(1,2),(2,3),(3,4),(4,5),則y關于x的經驗回歸方程為 ( )A.=x+1 B.=x+2C.=2x+1 D.=x-13.兩個線性相關變量x與y的統計數據如表所示:x 9 9.5 10 10.5 11y 11 10 8 6 5其經驗回歸方程是=x+40,則相對應于點(11,5)的殘差為 ( )A.0.1 B.0.2C.0.3 D.0.44.根據變量Y和x的成對樣本數據,由一元線性回歸模型得到經驗回歸方程=x+,對應的殘差如圖所示,模型誤差 ( )A.滿足一元線性回歸模型的所有假設B.滿足回歸模型E(e)=0的假設C.滿足回歸模型D(e)=σ2的假設D.不滿足回歸模型E(e)=0和D(e)=σ2的假設5.[多選]已知變量x,y之間的經驗回歸方程為=-0.7x+10.3,且變量x,y之間的一組相關數據如下表所示,則下列說法正確的是 ( )x 6 8 10 12y 6 m 3 2A.變量x,y之間呈負相關關系B.m=4C.可以預測,當x=11時,y約為2.6D.由表格數據知,該經驗回歸直線必過點(9,4)6.為了研究某班學生的聽力成績x(單位:分)與筆試成績y(單位:分)的關系,從該班隨機抽取20名學生,根據散點圖發現x與y之間有線性關系,設其經驗回歸方程為=x+,已知xi=400,yi=1 580,=-1,若該班某學生的聽力成績為26,據此估計其筆試成績約為 ( )A.99 B.101 C.103 D.1057.[多選]設(x1,y1),(x2,y2),…,(x2 024,y2 024)是變量x和y的2 024個樣本點,直線l是由這些樣本點通過最小二乘法得到的經驗回歸直線,如圖所示,下列結論正確的是 ( )A.直線l過點(,)B.直線l過點(x1 012,y1 012)C.x和y的樣本相關系數在區間[-1,0)上D.因為2 024是偶數,所以分布在直線l兩側的樣本點的個數一定相同8.[多選]已知兩個變量y與x線性相關,為研究其具體的線性關系進行了10次試驗.試驗中不慎丟失2個數據點,根據剩余的8個數據點求得的經驗回歸方程為=3x+4.5,且=4,又增加了2次試驗,得到2個數據點(2,11),(6,22),根據這10個數據點重新求得經驗回歸方程為=mx+n(其中m,n∈R),則 ( )A.變量y與x正相關B.m<3C.n<4.5D.經驗回歸直線=mx+n經過點(4,16.5)9.為了解籃球愛好者小李的投籃命中率與打籃球時間之間的關系,下表記錄了小李某月1號到5號每天打籃球時間x(單位:h)與當天投籃命中率y之間的關系:時間x 1 2 3 4 5命中率y 0.4 0.5 0.6 0.6 0.4小李這5天的平均投籃命中率為 ,用線性回歸分析的方法,預測小李該月6號打6 h籃球的投籃命中率為 . 10.某工廠為研究某種產品產量x(噸)與所需某種原料y(噸)的相關性,在生產過程中收集4組對應數據(x,y)如表所示:x 3 4 6 7y 2.5 3 4 m根據表中數據,得出y關于x的經驗回歸方程為=0.7x+.據此計算出在樣本(4,3)處的殘差為-0.15,則表中m的值為 . 11.從某居民區隨機抽取10個家庭,獲得第i個家庭的月收入xi(單位:千元)與月儲蓄yi(單位:千元)的數據資料, 算得xi=80,yi=20,xiyi=184,x=720.(1)求家庭的月儲蓄y對月收入x的經驗回歸方程=x+;(2)判斷變量x與y之間是正相關還是負相關;(3)若該居民區某家庭月收入為7千元,預測該家庭的月儲蓄.附:經驗回歸方程=x+中,=,=-,其中,為樣本平均值.12.假設關于某設備的使用年限x(單位:年)和支出的維修費用y(單位:萬元),有如表的統計資料:使用年限x/年 2 3 4 5 6維修費用y/萬元 2.2 3.8 5.5 6.5 7.0若由資料知y對x呈線性相關關系,試求:(1)經驗回歸方程=x+;(2)估計使用年限為10年時,維修費用是多少 (3)計算殘差平方和;(4)求R2并說明模型的擬合效果.參考數據:xiyi=112.3, (yi-)2=15.78.課時跟蹤檢測(二十四)1.選A 決定系數R2=0.98最大,擬合效果最好.2.選A 易求=2.5,=3.5,且=1,所以=3.5-1×2.5=1,因此經驗回歸方程為=x+1.3.選B 由于=x+40過樣本中心點(10,8),所以8=10+40,則=-3.2,因此=-3.2x+40.當x=11時,=-3.2×11+40=4.8,所以殘差=5-=5-4.8=0.2.4.選D 由殘差圖可以看出,圖中的殘差點不能擬合成一條直線,且不滿足D(e)=σ2.5.選ACD 由=-0.7x+10.3,得=-0.7,故x,y呈負相關關系,則A正確.==9,=-0.7×9+10.3=4=,解得m=5,B錯誤.當x=11時,y的預測值為2.6,故C正確.=9,=4,故經驗回歸直線必過點(9,4),則D正確.6. 選C xi=400,故==20;yi=1 580,故==79,故點(20,79)在經驗回歸直線上,即79=20-1,得=4,即=4x-1,當x=26時,代入計算得到=103.7.選AC 經驗回歸直線一定過樣本中心點,但不一定過某個樣本點,故A正確,B錯誤;由題圖可知x和y的樣本相關系數在區間[-1,0)上,故C正確;不能因為2 024是偶數就斷定分布在直線l兩側的樣本點的個數相同,故D錯誤.8.選ABD 設A(2,11),B(6,22),由kAB=<3,而8個數據點的經驗回歸方程中=3,∴09.解析:===0.5,==3.由公式得=0.01,從而=-=0.5-0.01×3=0.47,所以經驗回歸方程為=0.47+0.01x,所以當x=6時,=0.47+0.01×6=0.53.答案:0.5 0.5310.解析:根據樣本(4,3)處的殘差為-0.15,即3-(0.7×4+)=-0.15,可得=0.35,故經驗回歸方程為=0.7x+0.35,又由樣本數據的平均數為==5,=,所以0.7×5+0.35=,解得m=5.9.答案:5.911.解: (1)由題意,知n=10,=xi==8,=yi==2,又x-102=720-10×82=80,xiyi-10 =184-10×8×2=24,則==0.3,=-=2-0.3×8=-0.4,故所求經驗回歸方程為=0.3x-0.4.(2)由于變量y的值隨x值的增加而增加(=0.3>0),故x與y之間是正相關.(3)將x=7代入經驗回歸方程可以預測該家庭的月儲蓄為=0.3×7-0.4=1.7(千元).12.解: (1)由統計表格,易知=4,=5,x=90.又xiyi=112.3.設經驗回歸方程為=x+,于是有===1.23,=-=5-1.23×4=0.08,所以經驗回歸方程是=1.23x+0.08.(2)當x=10時,=1.23×10+0.08=12.38,估計使用年限為10年時維修費用是12.38萬元.(3)因為1=2.46+0.08=2.54,2=3.77,3=5,4=6.23,5=7.46,所以殘差平方和 (yi-i)2=0.651.(4)R2=1-=1-≈0.958 7,模型的擬合效果較好.4 / 4 展開更多...... 收起↑ 資源列表 8.2 第1課時 一元線性回歸模型及其應用.docx 8.2 第1課時 一元線性回歸模型及其應用.pptx 課時跟蹤檢測(二十四) 一元線性回歸模型及其應用.docx 縮略圖、資源來源于二一教育資源庫