資源簡介 §8.2.1 一元線性回歸模型及參數的最小二乘估計[學習目標] 1.了解最小二乘原理,掌握一元線性回歸模型參數的最小二乘估計方法,建立一元線性回歸模型進行預測.2.了解隨機誤差、殘差、殘差圖的概念.3.會通過殘差分析一元線性回歸模型的擬合效果.一、一元線性回歸模型生活經驗告訴我們,兒子的身高與父親的身高具有正相關的關系,為了進一步研究兩者之間的關系,有人調查了某所高校14名男大學生的身高及其父親的身高,得到的數據如表所示:編號 1 2 3 4 5 6 7父親身高/cm 174 170 173 169 182 172 180兒子身高/cm 176 176 170 170 185 176 178編號 8 9 10 11 12 13 14父親身高/cm 172 168 166 182 173 164 180兒子身高/cm 174 170 168 178 172 165 182我們畫出散點圖(課本105頁圖8.2-1)并通過計算得到樣本相關系數r≈0.886.問題1 由樣本相關系數可以得到什么結論?問題2 這兩個變量之間的關系可以用函數模型來刻畫嗎?知識梳理一元線性回歸模型:我們稱為Y關于x的____________________模型,其中,Y稱為____________或________________,x稱為____________或______________;a和b為模型的未知參數,a稱為________參數,b稱為________參數;e是Y與bx+a之間的______________.例1 判斷下列變量間哪些能用函數模型刻畫,哪些能用回歸模型刻畫?(1)某公司的銷售收入和廣告支出;(2)某城市寫字樓的出租率和每平方米月租金;(3)航空公司的顧客投訴次數和航班正點率;(4)某地區的人均消費水平和人均國內生產總值(GDP);(5)學生期末考試成績和考前用于復習的時間;(6)一輛汽車在某段路程中的行駛速度和行駛時間;(7)正方形的面積與周長.反思感悟 在函數關系中,變量X對應的是變量Y的確定值,而在相關關系中,變量X對應的是變量Y的概率分布.換句話說,相關關系是隨機變量之間或隨機變量與非隨機變量之間的一種數量依存關系,對于這種關系,通常運用統計方法進行研究.通過對相關關系的研究又可以總結規律,從而指導人們的生活與生活實踐.跟蹤訓練1 若某地財政收入x與支出y滿足一元線性回歸模型y=bx+a+e(單位:億元),其中b=0.7,a=3,|e|≤0.5,如果今年該地區財政收入為10億元,年支出預計不會超過( )A.9億元 B.9.5億元C.10億元 D.10.5億元二、最小二乘法和經驗回歸方程問題3 在一元線性回歸模型中,表達式Y=bx+a+e刻畫的是變量Y與x之間的線性相關關系,其中參數a和b未知,確定參數a和b的原則是什么?知識梳理最小二乘法:我們將=x+稱為Y關于x的________________________,也稱經驗回歸函數或經驗回歸公式,其圖形稱為經驗回歸直線.這種求經驗回歸方程的方法叫做________________,求得的,叫做b,a的____________________,例2 (1)某單位為了了解辦公樓用電量y(度)與氣溫x(℃)之間的關系,隨機統計了四個工作日的用電量與當天平均氣溫,并制作了對照表:氣溫x(℃) 18 13 10 -1用電量y(度) 24 34 38 64由表中數據得到經驗回歸方程=-2x+,則當氣溫為-3 ℃時,預測用電量為( )A.68度 B.66度C.28度 D.12度(2)某商場為了迎接暑期旅游旺季,確定暑期營銷策略,進行了投入促銷費用x和商場實際銷售額y的試驗,得到如下四組數據.投入促銷費用x(萬元) 2 3 5 6商場實際銷售額y(萬元) 100 200 300 400①畫出上述數據的散點圖,并據此判斷兩個變量是否具有較強的線性相關關系;②求出x,y之間的經驗回歸方程=x+;③若該商場計劃實際銷售額不低于600萬元,則至少要投入多少萬元的促銷費用?反思感悟 求經驗回歸方程的步驟(3)寫:寫出經驗回歸方程.跟蹤訓練2 (1)若根據變量x與y的對應關系(如表),求得y關于x的經驗回歸方程為y=6.5x+17.5,則表中m的值為( )x 2 4 5 6 8y 30 40 m 50 70A.60 B.55 C.50 D.45(2)重樓,中藥名,具有清熱解毒、消腫止痛、涼肝定驚之功效,具有極高的藥用價值.近年來,隨著重樓的藥用潛力被不斷開發,野生重樓資源已經滿足不了市場的需求,巨大的經濟價值提升了家種重樓的熱度,某機構統計了近幾年某地家種重樓年產量y(單位:噸),統計數據如表所示.年份 2016 2017 2018 2019 2020 2021 2022年份代碼x 1 2 3 4 5 6 7年產量y/噸 130 180 320 390 460 550 630①根據表中的統計數據,求出y關于x的經驗回歸方程;②根據①中所求方程預測2024年該地家種重樓的年產量.三、線性回歸分析問題4 如果給出了兩個模型,那么如何比較這兩個模型的擬合效果?知識梳理1.殘差:對于響應變量Y,通過觀測得到的數據稱為__________,通過經驗回歸方程得到的稱為__________,____________減去__________稱為殘差.2.殘差分析:________是隨機誤差的估計結果,通過對________的分析可以判斷模型刻畫數據的效果,以及判斷原始數據中是否存在可疑數據等,這方面工作稱為________________.3.殘差平方和法殘差平方和越________,模型的擬合效果越好.4.決定系數R2可以用R2=1-來比較兩個模型的擬合效果,R2越________,模型的擬合效果越________,R2越________,模型的擬合效果越________.例3 (1)(多選)對變量y和x的一組成對樣本數據(x1,y1),(x2,y2),…,(xn,yn)進行回歸分析,建立回歸模型,則( )A.殘差平方和越大,模型的擬合效果越好B.在做線性回歸分析時,殘差圖中殘差點分布的帶狀區域的寬度越窄表示回歸效果越好C.用決定系數R2來刻畫回歸效果,R2越小,說明模型的擬合效果越好D.若y和x的樣本相關系數r=-0.95,則y和x之間具有很強的負線性相關關系(2)假定小麥基本苗數x與成熟期有效穗y之間存在線性相關關系,今測得5組數據如下表:x 15.0 25.8 30.0 36.6 44.4y 39.4 42.9 42.9 43.1 49.2并由最小二乘法計算得經驗回歸方程為=0.29x+34.7.①計算各組殘差,并計算殘差平方和;②求R2.參考數據:=50.18.反思感悟 刻畫回歸效果的三種方法(1)殘差圖法:殘差點比較均勻地落在水平帶狀區域內說明選用的模型比較合適.(2)殘差平方和法:殘差平方和越小,模型的擬合效果越好.(3)決定系數R2法:R2=1-越接近1,表明模型的擬合效果越好.跟蹤訓練3 已知某種商品的價格x(單位:元)與需求量y(單位:件)之間的關系有如下一組數據:x 14 16 18 20 22y 12 10 7 5 3求y關于x的經驗回歸方程,并借助殘差平方和及R2說明回歸模型擬合效果的好壞.1.知識清單:(1)一元線性回歸模型.(2)最小二乘法、經驗回歸方程的求法.(3)線性回歸分析:殘差圖法、殘差平方和法和R2法.2.方法歸納:數形結合、轉化化歸.3.常見誤區:混淆殘差圖法、殘差平方和法和R2法的概念,導致刻畫回歸效果出錯.1.收集一只棉鈴蟲的產卵數y與溫度x的幾組數據后發現兩個變量有相關關系,按不同的曲線來擬合y與x之間的關系,并算出了對應的決定系數R2如表所示,擬合曲線 直線 指數曲線 拋物線 二次曲線回歸模型 y=19.8x-463.7 y=e0.27x-3.84 y=0.367x2-202 y=R2 0.746 0.996 0.902 0.002則應選擇擬合最好的回歸模型為( )A.y=19.8x-463.7B.y=e0.27x-3.84C.y=0.367x2-202D.y=2.(多選)已知變量y與x具有線性相關關系,統計得到6組數據如下表:x 2 4 7 10 15 22y 8.1 9.4 12 14.4 18.5 24若y關于x的經驗回歸方程為=0.8x+,則( )A.變量y與x之間正相關B.=14.4C.=6.8D.當x=12時,y的估計值為15.63.某車間為了提高工作效率,需要測試加工零件所花費的時間,為此進行了5次試驗,這5次試驗的數據列(個數x,加工時間y)為:(10,62),(20,a),(30,75),(40,81),(50,89).若用最小二乘法求得其經驗回歸方程為=0.67x+54.9,則a的值為________.4.下表是某飲料專賣店一天賣出奶茶的杯數y與當天氣溫x(單位:°C)的對比表,已知由表中數據計算得到y關于x的經驗回歸方程為=x+27,則相應于點(10,20)的殘差為________.氣溫x/°C 5 10 15 20 25杯數y 26 20 16 14 14§8.2 一元線性回歸模型及其應用第1課時 一元線性回歸模型及參數的最小二乘估計問題1 通過樣本相關系數可知兒子的身高與父親的身高正線性相關,且相關程度較高.問題2 不能.因為這兩個變量之間不是函數關系,也就不能用函數模型刻畫.知識梳理一元線性回歸 因變量 響應變量 自變量 解釋變量 截距 斜率 隨機誤差例1 解 (1)(2)(3)(4)(5)回歸模型,(6)(7)函數模型.跟蹤訓練1 D [因為財政收入x與支出y滿足一元線性回歸模型y=bx+a+e,其中b=0.7,a=3,所以y=0.7x+3+e.當x=10時,得y=0.7×10+3+e=10+e,又|e|≤0.5,即-0.5≤e≤0.5,所以9.5≤y≤10.5,所以年支出預計不會超過10.5億元.]問題3 使表示成對樣本數據的這些散點在整體上與一條適當的直線盡可能地接近.知識梳理經驗回歸方程 最小二乘法最小二乘估計例2 (1)B [由表中數據可知==10,==40,所以經驗回歸直線=-2x+過點(10,40),即40=-2×10+,得=60,則經驗回歸方程為=-2x+60,當x=-3時,=-2×(-3)+60=66.](2)解 ①散點圖如圖所示.從散點圖上可以看出兩個變量具有較好的線性相關關系.②因為==4,==250,=-=250-70×4=-30.故所求的經驗回歸方程為=70x-30.③由題意得70x-30≥600,即x≥=9,所以若該商場計劃實際銷售額不低于600萬元,則至少要投入9萬元的促銷費用.跟蹤訓練2 (1)A [由表中數據,得=×(2+4+5+6+8)=5,=×(30+40+m+50+70)=38+,因為經驗回歸直線=6.5x+17.5過點,所以38+=6.5×5+17.5,解得m=60.](2)解 ①由表格數據,得==4,==380,則===85,所以=-=380-85×4=40,所以y關于x的經驗回歸方程為=85x+40.②由題可知,2024年的年份代碼為9,即x=9,將x=9代入經驗回歸方程,得=85×9+40=805,所以預測2024年該地家種重樓的年產量為805噸.問題4 殘差圖、殘差平方和、決定系數.知識梳理1.觀測值 預測值 觀測值 預測值2.殘差 殘差 殘差分析3.小4.大 好 小 差例3 (1)BD [因為殘差平方和越小,模型的擬合效果越好,故A錯誤;在做線性回歸分析時,殘差圖中殘差點分布的帶狀區域的寬度越窄表示回歸效果越好,故B正確;因為決定系數R2越接近1,說明模型的擬合效果越好,故C錯誤;由樣本相關系數為負且接近-1,可知y和x之間具有很強的負線性相關關系,故D正確.](2)解 ①由i=xi+,可以算得i=yi-i分別為1=0.35,2=0.718,3=-0.5,4=-2.214,5=1.624,殘差平方和為8.43.②R2≈1-≈0.832.跟蹤訓練3 解 =×(14+16+18+20+22)=18,=×(12+10+7+5+3)=7.4,所以==-1.15,=7.4+1.15×18=28.1,所以所求經驗回歸方程是=-1.15x+28.1.列出殘差表為yi-i 0 0.3 -0.4 -0.1 0.2yi- 4.6 2.6 -0.4 -2.4 -4.4R2≈0.994,所以回歸模型的擬合效果很好.隨堂演練1.B [由決定系數R2來刻畫回歸效果,R2的值越大越接近1,說明模型的擬合效果最好.由表可知指數模型的決定系數最接近1.]2.AB [由y關于x的經驗回歸方程=0.8x+,可知變量y與x之間正相關,故A正確;由表中數據可知==10,==14.4,故B正確;又經驗回歸直線過點(,),將其代入=0.8x+可得=14.4-0.8×10=6.4,故C錯誤;因此,y關于x的經驗回歸方程為=0.8x+6.4,將x=12代入可得,=0.8×12+6.4=16,即當x=12時,y的估計值為16,故D錯誤.]3.68解析 根據題意可得,=×=30,=×=61.4+.又經驗回歸直線經過點(,),故可得61.4+=0.67×30+54.9,解得a=68.4.-1解析 ==15,==18,代入經驗回歸方程=x+27得18=15+27,解得=-0.6,則經驗回歸方程為=-0.6x+27.所以相應于點(10,20)的殘差為20-(-0.6×10+27)=-1. 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫