資源簡(jiǎn)介 人教A版高中數(shù)學(xué)選擇性必修三8.2第2課時(shí)-一元線性回歸模型的綜合問(wèn)題-導(dǎo)學(xué)案學(xué)習(xí)目標(biāo) 1.了解殘差的推導(dǎo)過(guò)程,理解殘差的概念.2.會(huì)通過(guò)分析殘差和利用R2判斷回歸模型的擬合效果.一、殘差及殘差分析問(wèn)題1 上節(jié)課中我們知道兒子身高Y關(guān)于父親身高x的經(jīng)驗(yàn)回歸方程為=0.839x+28.957,那么當(dāng)x=172時(shí),=0.839×172+28.957=173.265(cm),如果一位父親的身高為172 cm,他兒子長(zhǎng)大成人后的身高一定是173 cm嗎?為什么?問(wèn)題2 對(duì)于課本105頁(yè)表8.2-1中的第6個(gè)觀測(cè),我們發(fā)現(xiàn)當(dāng)父親身高為172 cm時(shí),兒子的身高實(shí)際為176 cm,實(shí)際身高與預(yù)測(cè)的身高相差了多少?知識(shí)梳理1.殘差:對(duì)于響應(yīng)變量Y,通過(guò)觀測(cè)得到的數(shù)據(jù)稱為_(kāi)_______,通過(guò)經(jīng)驗(yàn)回歸方程得到的稱為_(kāi)_______,________減去__________稱為殘差.2.殘差分析:________是隨機(jī)誤差的估計(jì)結(jié)果,通過(guò)對(duì)________的分析可以判斷模型刻畫(huà)數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為_(kāi)_______.例1 (1)對(duì)變量x,y進(jìn)行回歸分析時(shí),依據(jù)得到的4個(gè)不同的回歸模型畫(huà)出殘差圖,則下列模型擬合精度最高的是( )(2)已知一系列樣本點(diǎn)(xi,yi)(i=1,2,3,…,n)的經(jīng)驗(yàn)回歸方程為=2x+a,若樣本點(diǎn)(r,1)與(1,s)的殘差相同,則有( )A.r=s B.s=2rC.s=-2r+3 D.s=2r+1反思感悟 殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說(shuō)明選用的模型比較合適.這樣的帶狀區(qū)域的寬度越窄,說(shuō)明模型擬合精度越高,經(jīng)驗(yàn)回歸方程的預(yù)報(bào)精度越高.跟蹤訓(xùn)練1 (1)已知某成對(duì)樣本數(shù)據(jù)的殘差圖如圖,則樣本點(diǎn)數(shù)據(jù)中可能不準(zhǔn)確的是從左到右第________個(gè).(2)某種產(chǎn)品的廣告支出x與銷售額y(單位:萬(wàn)元)之間有如表關(guān)系,y與x的經(jīng)驗(yàn)回歸方程為=6.5x+17.5,當(dāng)廣告支出為5萬(wàn)元時(shí),隨機(jī)誤差的殘差為( )x 2 4 5 6 8y 30 40 60 50 70A.10 B.20 C.30 D.40二、對(duì)數(shù)函數(shù)模型y=c1+c2ln x例2 噪聲污染已經(jīng)成為影響人們身體健康和生活質(zhì)量的嚴(yán)重問(wèn)題,為了了解聲音強(qiáng)度D(單位:dB)與聲音能量I(單位:W/cm2)之間的關(guān)系,將測(cè)量得到的聲音強(qiáng)度Di和聲音能量Ii(i=1,2,…,10)數(shù)據(jù)作了初步處理,得到下面的散點(diǎn)圖及一些統(tǒng)計(jì)量的值.(Ii-)2 (Wi -)2 (Ii-)· (Di-) (Wi-)· (Di-)1.04×10-11 45.7 -11.5 1.56×10-21 0.51 6.88×10-11 5.1表中Wi=lg Ii,=Wi .(1)根據(jù)表中數(shù)據(jù),求聲音強(qiáng)度D關(guān)于聲音能量I的經(jīng)驗(yàn)回歸方程=+·lg I;(2)當(dāng)聲音強(qiáng)度大于60 dB時(shí)屬于噪音,會(huì)產(chǎn)生噪聲污染,城市中某點(diǎn)P共受到兩個(gè)聲源的影響,這兩個(gè)聲源的聲音能量分別是I1和I2,且+=1010.已知點(diǎn)P的聲音能量等于聲音能量I1與I2之和,請(qǐng)根據(jù)(1)中的經(jīng)驗(yàn)回歸方程,判斷P點(diǎn)是否受到噪聲污染的干擾,并說(shuō)明理由.附:對(duì)于一組數(shù)據(jù)(u1,v1),(u2,v2),…,(un,vn),其經(jīng)驗(yàn)回歸直線=+u的斜率和截距的最小二乘估計(jì)分別為=,=-·.反思感悟 對(duì)數(shù)函數(shù)模型y=c1+c2ln x的求法(1)確定變量,作出散點(diǎn)圖.(2)根據(jù)散點(diǎn)圖,做出y=c1+c2ln x的函數(shù)選擇.(3)變量置換,令z=ln x,通過(guò)變量置換把問(wèn)題轉(zhuǎn)化為=1+2z的經(jīng)驗(yàn)回歸問(wèn)題,并求出經(jīng)驗(yàn)回歸方程=1+2z.(4)根據(jù)相應(yīng)的變換,寫(xiě)出=1+2ln x的經(jīng)驗(yàn)回歸方程.跟蹤訓(xùn)練2 生物學(xué)家認(rèn)為,睡眠中的恒溫動(dòng)物依然會(huì)消耗體內(nèi)能量,主要是為了保持體溫.脈搏率f是單位時(shí)間心跳的次數(shù),醫(yī)學(xué)研究發(fā)現(xiàn),動(dòng)物的體重W(單位:g)與脈搏f存在著一定的關(guān)系.如表給出一些動(dòng)物體重與脈搏率對(duì)應(yīng)的數(shù)據(jù),圖1畫(huà)出了體重W與脈搏率f的散點(diǎn)圖,圖2畫(huà)出了lg W與lg f的散點(diǎn)圖.動(dòng)物名 鼠 大鼠 豚鼠 兔 小狗 大狗 羊體重 25 200 300 2 000 5 000 30 000 50 000脈搏率 670 420 300 200 120 85 70圖1圖2為了較好地描述體重和脈搏率的關(guān)系,現(xiàn)有以下兩種模型供選擇:①f=kW+b;②lg f=klg W+b.(1)選出你認(rèn)為最符合實(shí)際的函數(shù)模型,并說(shuō)明理由;(2)不妨取表中豚鼠和兔的體重脈搏率數(shù)據(jù)代入所選函數(shù)模型,求出f關(guān)于W的函數(shù)解析式.參考數(shù)據(jù):lg 2≈0.3,lg 3≈0.5.三、殘差平方和與決定系數(shù)R2問(wèn)題3 例2中給出了兩個(gè)模型,那么如何比較這兩個(gè)模型的擬合效果?知識(shí)梳理1.殘差平方和法殘差平方和(yi-i)2越______,模型的擬合效果越______.2.決定系數(shù)R2可以用R2=1-來(lái)比較兩個(gè)模型的擬合效果,R2越______,模型的擬合效果越______,R2越______,模型的擬合效果越______.例3 假定小麥基本苗數(shù)x與成熟期有效穗y之間存在相關(guān)關(guān)系,今測(cè)得5組數(shù)據(jù)如下表:x 15.0 25.8 30.0 36.6 44.4y 39.4 42.9 42.9 43.1 49.2并由最小二乘法計(jì)算得經(jīng)驗(yàn)回歸方程為=0.29x+34.7.(1)計(jì)算各組殘差,并計(jì)算殘差平方和;(2)求R2.參考數(shù)據(jù):(yi-)2=50.18.反思感悟 刻畫(huà)回歸效果的三種方法(1)殘差圖法:殘差點(diǎn)比較均勻地落在水平帶狀區(qū)域內(nèi)說(shuō)明選用的模型比較合適.(2)殘差平方和法:殘差平方和(yi-i)2越小,模型的擬合效果越好.(3)決定系數(shù)R2法:R2=1-越接近1,表明模型的擬合效果越好.跟蹤訓(xùn)練3 已知某種商品的價(jià)格x(單位:元)與需求量y(單位:件)之間的關(guān)系有如下一組數(shù)據(jù):x 14 16 18 20 22y 12 10 7 5 3求y關(guān)于x的經(jīng)驗(yàn)回歸方程,并借助殘差平方和及R2說(shuō)明回歸模型擬合效果的好壞.參考公式及數(shù)據(jù):=,=-,=1 660,iyi=620.1.知識(shí)清單:(1)殘差的概念.(2)對(duì)模型刻畫(huà)數(shù)據(jù)效果的分析:殘差圖法、殘差平方和法和R2法.2.方法歸納:數(shù)形結(jié)合、轉(zhuǎn)化化歸.3.常見(jiàn)誤區(qū): 混淆殘差圖法、殘差平方和法和R2法的概念,導(dǎo)致刻畫(huà)回歸效果出錯(cuò).1.在回歸分析中,決定系數(shù)R2 的值越小,說(shuō)明殘差平方和( )A.越小 B.越大C.可能大也可能小 D.以上都不對(duì)2.甲、乙、丙、丁四位同學(xué)各自對(duì)A,B兩變量的線性相關(guān)性做試驗(yàn),并用回歸分析方法分別求得R2與殘差平方和m如下表:甲 乙 丙 丁R2 0.82 0.78 0.69 0.85m 106 115 124 103則試驗(yàn)結(jié)果體現(xiàn)A,B兩變量有更強(qiáng)的線性相關(guān)性的同學(xué)是( )A.甲 B.乙 C.丙 D.丁3.(多選)關(guān)于殘差圖的描述正確的是( )A.殘差圖的橫坐標(biāo)可以是樣本編號(hào)B.殘差圖的橫坐標(biāo)也可以是解釋變量或響應(yīng)變量C.殘差點(diǎn)分布的帶狀區(qū)域的寬度越窄,R2越小D.殘差點(diǎn)分布的帶狀區(qū)域的寬度越窄,殘差平方和越小4.下表是某飲料專賣店一天賣出奶茶的杯數(shù)y與當(dāng)天氣溫x(單位:°C)的對(duì)比表,已知表中數(shù)據(jù)計(jì)算得到y(tǒng)關(guān)于x的經(jīng)驗(yàn)回歸方程為=x+27,則相應(yīng)于點(diǎn)(10,20)的殘差為_(kāi)_______.氣溫x/°C 5 10 15 20 25杯數(shù)y 26 20 16 14 14參考答案與詳細(xì)解析問(wèn)題1 不一定,因?yàn)檫€有其他影響他兒子身高的因素,父親的身高不能完全決定兒子身高.問(wèn)題2 176-173.265=2.735(cm).知識(shí)梳理1.觀測(cè)值 預(yù)測(cè)值 觀測(cè)值 預(yù)測(cè)值2.殘差 殘差 殘差分析例1 (1)A [用殘差圖判斷模型的擬合效果,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說(shuō)明這樣的模型比較合適,帶狀區(qū)域的寬度越窄,說(shuō)明模型的擬合精度越高.](2)C [樣本點(diǎn)(r,1)的殘差為1-2r-a,樣本點(diǎn)(1,s)的殘差為s-a-2,依題意得1-2r-a=s-a-2,故s=-2r+3.]跟蹤訓(xùn)練1 (1)6解析 原始數(shù)據(jù)中的可疑數(shù)據(jù)往往是殘差絕對(duì)值過(guò)大的那個(gè)數(shù)據(jù),即偏離平衡位置過(guò)大.(2)A [因?yàn)閥與x的經(jīng)驗(yàn)回歸方程為=6.5x+17.5,所以當(dāng)x=5時(shí),=6.5×5+17.5=50.由表格知當(dāng)廣告支出5萬(wàn)元時(shí),銷售額為60萬(wàn)元,所以隨機(jī)誤差的殘差為60-50=10.]例2 解 (1)由Wi=lg Ii,先建立D關(guān)于W的經(jīng)驗(yàn)回歸方程,由于===10,∴=-=45.7-×10=160.7,∴D關(guān)于W的經(jīng)驗(yàn)回歸方程是=10W+160.7,即D關(guān)于I的經(jīng)驗(yàn)回歸方程是=10·lg I+160.7.(2)點(diǎn)P的聲音能量I=I1+I(xiàn)2,∵+=1010,∴I=I1+I(xiàn)2=10-10·(I1+I(xiàn)2)=10-10·≥9×10-10(當(dāng)且僅當(dāng)=,即I2=2I1時(shí)等號(hào)成立),根據(jù)(1)中的經(jīng)驗(yàn)回歸方程,點(diǎn)P的聲音強(qiáng)度D的最小預(yù)測(cè)值為=10·lg(9×10-10)+160.7=10·lg 9+60.7>60,∴點(diǎn)P會(huì)受到噪聲污染的干擾.跟蹤訓(xùn)練2 解 (1)模型②lg f=klg W+b最符合實(shí)際.根據(jù)散點(diǎn)圖的特征,圖2基本上呈直線形式,所以可選擇一次函數(shù)來(lái)刻畫(huà)lg W和lg f的關(guān)系.(2)lg 200=2+lg 2≈2.3,lg 2 000=3+lg 2≈3.3,lg 300=2+lg 3≈2.5.由題意知解得所以lg f=-lg W+,所以f關(guān)于W的函數(shù)解析式為f=.問(wèn)題3 殘差平方和、決定系數(shù).知識(shí)梳理1.小 好2.大 好 小 差例3 解 (1)由i=xi+,可以算得i=y(tǒng)i-i分別為1=0.35,2=0.718,3=-0.5,4=-2.214,5=1.624,殘差平方和為≈8.43.(2)(yi-)2=50.18,故R2≈1-≈0.832.跟蹤訓(xùn)練3 解 =×(14+16+18+20+22)=18,=×(12+10+7+5+3)=7.4,所以===-1.15,=7.4+1.15×18=28.1,所以所求經(jīng)驗(yàn)回歸方程是=-1.15x+28.1.列出殘差表為yi-i 0 0.3 -0.4 -0.1 0.2yi- 4.6 2.6 -0.4 -2.4 -4.4所以(yi-i)2=0.3,(yi-)2=53.2,R2=1-≈0.994,所以回歸模型的擬合效果很好.隨堂演練1.B [用決定系數(shù)R2的值判斷模型的擬合效果,R2越大,模型的擬合效果越好,而用殘差平方和判斷模型的擬合效果時(shí),殘差平方和越小,模型的擬合效果越好,由此可知決定系數(shù)R2的值越小,說(shuō)明殘差平方和越大.]2.D [在驗(yàn)證兩個(gè)變量之間的線性相關(guān)關(guān)系中,決定系數(shù)R2越大,相關(guān)性越強(qiáng).在四個(gè)選項(xiàng)中只有丁的決定系數(shù)最大.殘差平方和越小,相關(guān)性越強(qiáng).只有丁的殘差平方和最小.綜上可知丁的試驗(yàn)結(jié)果體現(xiàn)A,B兩變量有更強(qiáng)的線性相關(guān)性.]3.ABD [殘差點(diǎn)分布的帶狀區(qū)域的寬度越窄,說(shuō)明模型擬合精度越高,則殘差平方和越小,此時(shí),R2的值越大,故描述錯(cuò)誤的是C.]4.-1解析 ==15,==18,代入經(jīng)驗(yàn)回歸方程=x+27得18=15+27,解得=-0.6,則經(jīng)驗(yàn)回歸方程為=-0.6x+27.所以相應(yīng)于點(diǎn)(10,20)的殘差為20-(-0.6×10+27)=-1.人教A版高中數(shù)學(xué)選擇性必修三-8.2第1課時(shí)一元線性回歸模型及參數(shù)的最小二乘估計(jì)-學(xué)案學(xué)習(xí)目標(biāo) 1.結(jié)合實(shí)例,了解一元線性回歸模型的含義,了解模型參數(shù)的統(tǒng)計(jì)意義.2.了解最小二乘原理,掌握一元線性回歸模型參數(shù)的最小二乘估計(jì)方法.3.針對(duì)實(shí)際問(wèn)題,會(huì)用一元線性回歸模型進(jìn)行預(yù)測(cè).一、一元線性回歸模型生活經(jīng)驗(yàn)告訴我們,兒子的身高與父親的身高具有正相關(guān)的關(guān)系,為了進(jìn)一步研究?jī)烧咧g的關(guān)系,有人調(diào)查了14名男大學(xué)生的身高及其父親的身高,得到的數(shù)據(jù)如表所示:編號(hào) 1 2 3 4 5 6 7父親身高/cm 174 170 173 169 182 172 180兒子身高/cm 176 176 170 170 185 176 178編號(hào) 8 9 10 11 12 13 14父親身高/cm 172 168 166 182 173 164 180兒子身高/cm 174 170 168 178 172 165 182我們畫(huà)出散點(diǎn)圖(課本105頁(yè)圖8.2-1)并通過(guò)計(jì)算得到樣本相關(guān)系數(shù)r≈0.886.問(wèn)題1 由樣本相關(guān)系數(shù)可以得到什么結(jié)論?問(wèn)題2 這兩個(gè)變量之間的關(guān)系可以用函數(shù)模型來(lái)刻畫(huà)嗎?知識(shí)梳理一元線性回歸模型:我們稱為Y關(guān)于x的___________模型,其中,Y稱為_(kāi)______或________,x稱為_(kāi)_____或______;a和b為模型的未知參數(shù),a稱為_(kāi)____參數(shù),b稱為_(kāi)_______參數(shù);e是Y與bx+a之間的隨機(jī)________.例1 判斷下列變量間哪些能用函數(shù)模型刻畫(huà),哪些能用回歸模型刻畫(huà)?(1)某公司的銷售收入和廣告支出;(2)某城市寫(xiě)字樓的出租率和每平米月租金;(3)航空公司的顧客投訴次數(shù)和航班正點(diǎn)率;(4)某地區(qū)的人均消費(fèi)水平和人均國(guó)內(nèi)生產(chǎn)總值(GDP);(5)學(xué)生期末考試成績(jī)和考前用于復(fù)習(xí)的時(shí)間;(6)一輛汽車在某段路程中的行駛速度和行駛時(shí)間;(7)正方形的面積與周長(zhǎng).反思感悟 在函數(shù)關(guān)系中,變量X對(duì)應(yīng)的是變量Y的確定值,而在相關(guān)關(guān)系中,變量X對(duì)應(yīng)的是變量Y的概率分布.換句話說(shuō),相關(guān)關(guān)系是隨機(jī)變量之間或隨機(jī)變量與非隨機(jī)變量之間的一種數(shù)量依存關(guān)系,對(duì)于這種關(guān)系,通常運(yùn)用統(tǒng)計(jì)方法進(jìn)行研究.通過(guò)對(duì)相關(guān)關(guān)系的研究又可以總結(jié)規(guī)律,從而指導(dǎo)人們的生活與生活實(shí)踐.跟蹤訓(xùn)練1 若某地財(cái)政收入x與支出y滿足一元線性回歸模型y=bx+a+e(單位:億元),其中b=0.7,a=3,|e|≤0.5,如果今年該地區(qū)財(cái)政收入10億元,年支出預(yù)計(jì)不會(huì)超過(guò)( )A.9億元 B.9.5億元C.10億元 D.10.5億元二、最小二乘法和經(jīng)驗(yàn)回歸方程問(wèn)題3 在一元線性回歸模型中,表達(dá)式Y(jié)=bx+a+e刻畫(huà)了變量Y與x之間的線性相關(guān)關(guān)系,其中參數(shù)a和b未知,確定參數(shù)a和b的原則是什么?問(wèn)題4 下列確定直線的四種方法中最具有可行性的是哪一個(gè)?方法(1):先畫(huà)出一條直線,測(cè)量出各點(diǎn)到直線的距離,然后移動(dòng)直線,到達(dá)一個(gè)使距離和最小的位置,測(cè)量出此時(shí)的斜率和截距,就得到一條直線.方法(2):可以在散點(diǎn)圖中選兩點(diǎn)畫(huà)一條直線,使得直線兩側(cè)點(diǎn)的個(gè)數(shù)基本相同,把這條直線作為所求直線.方法(3):在散點(diǎn)圖中多取幾對(duì)點(diǎn),確定出幾條直線的方程,再分別求出這些直線的斜率、截距的平均數(shù),將這兩個(gè)平均數(shù)作為所求直線的斜率和截距.方法(4):我們可以考慮使各組數(shù)據(jù)的隨機(jī)誤差e的和最小來(lái)確定直線的斜率和截距.知識(shí)梳理最小二乘法:我們將=x+稱為Y關(guān)于x的________________,也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱為經(jīng)驗(yàn)回歸直線.這種求經(jīng)驗(yàn)回歸方程的方法叫做________________,求得的,叫做b,a的________________,其中==,=-.例2 某種產(chǎn)品的廣告費(fèi)支出x(單位:百萬(wàn)元)與銷售額y(單位:百萬(wàn)元)之間有如下對(duì)應(yīng)數(shù)據(jù):x 2 4 5 6 8y 30 40 60 50 70求經(jīng)驗(yàn)回歸方程.參考公式:=,=-.反思感悟 求經(jīng)驗(yàn)回歸方程的步驟(1)算:計(jì)算,,,iyi.(2)代:代入公式計(jì)算,的值.(3)寫(xiě):寫(xiě)出經(jīng)驗(yàn)回歸方程.跟蹤訓(xùn)練2 某班5名學(xué)生的數(shù)學(xué)和物理成績(jī)?nèi)绫恚?br/> 學(xué)生 學(xué)科 A B C D E數(shù)學(xué)成績(jī)(x) 88 76 73 66 63物理成績(jī)(y) 78 65 71 64 61求物理成績(jī)y對(duì)數(shù)學(xué)成績(jī)x的經(jīng)驗(yàn)回歸方程.三、利用經(jīng)驗(yàn)回歸方程進(jìn)行預(yù)測(cè)例3 偏差是指?jìng)€(gè)別測(cè)定值與測(cè)定的平均值之差,在成績(jī)統(tǒng)計(jì)中,我們把某個(gè)同學(xué)的某科考試成績(jī)與該科平均分的差叫某科偏差(實(shí)際成績(jī)-平均分=偏差).在某次考試成績(jī)統(tǒng)計(jì)中,某老師為了對(duì)學(xué)生數(shù)學(xué)偏差x(單位:分)與物理偏差y(單位:分)之間的關(guān)系進(jìn)行分析,隨機(jī)挑選了8位同學(xué),得到他們的兩科成績(jī)偏差數(shù)據(jù)如下:學(xué)生序號(hào) 1 2 3 4 5 6 7 8數(shù)學(xué)偏差x 20 15 13 3 2 -5 -10 -18物理偏差y 6.5 3.5 3.5 1.5 0.5 -0.5 -2.5 -3.5(1)若x與y之間具有線性相關(guān)關(guān)系,求y關(guān)于x的經(jīng)驗(yàn)回歸方程;(2)若該次考試數(shù)學(xué)平均分為120分,物理平均分為91.5分,試由(1)的結(jié)論預(yù)測(cè)數(shù)學(xué)成績(jī)?yōu)?28分的同學(xué)的物理成績(jī).參考數(shù)據(jù)和參考公式:iyi=324,=1 256,經(jīng)驗(yàn)回歸方程為=x+,其中反思感悟 (1)判斷兩個(gè)變量是否線性相關(guān):可以利用經(jīng)驗(yàn),也可以畫(huà)散點(diǎn)圖.(2)求經(jīng)驗(yàn)回歸方程,注意運(yùn)算的正確性.(3)根據(jù)經(jīng)驗(yàn)回歸方程進(jìn)行預(yù)測(cè)估計(jì):估計(jì)值不是實(shí)際值,兩者會(huì)有一定的誤差.跟蹤訓(xùn)練3 恩格爾系數(shù)法是國(guó)際上常用的一種測(cè)定貧困線的方法,是指居民家庭年人均食物支出占年人均消費(fèi)總支出的比重,它隨家庭收入的增加而下降,即恩格爾系數(shù)越大,生活越貧困.某調(diào)研小組通過(guò)調(diào)查得到了某地年人均消費(fèi)總支出x(萬(wàn)元)與恩格爾系數(shù)y的五組數(shù)據(jù)如下表:x 1 1.5 2 2.5 3y 0.9 0.7 0.5 0.3 0.2(1)請(qǐng)根據(jù)上表數(shù)據(jù),用最小二乘法求出y關(guān)于x的經(jīng)驗(yàn)回歸方程;(2)若該地某居民家庭年人均消費(fèi)總支出為2.6萬(wàn)元,估計(jì)該居民家庭的恩格爾系數(shù).參考公式:經(jīng)驗(yàn)回歸方程=x+中斜率和截距的最小二乘估計(jì)公式分別為==,=-.1.知識(shí)清單:(1)一元線性回歸模型.(2)最小二乘法、經(jīng)驗(yàn)回歸方程的求法.(3)利用經(jīng)驗(yàn)回歸方程進(jìn)行預(yù)測(cè).2.方法歸納:數(shù)形結(jié)合、轉(zhuǎn)化化歸.3.常見(jiàn)誤區(qū):不判斷變量間是否具有線性相關(guān)關(guān)系,盲目求解經(jīng)驗(yàn)回歸方程致誤.1.工人工資y(元)與勞動(dòng)生產(chǎn)率x(千元)的相關(guān)關(guān)系的經(jīng)驗(yàn)回歸方程為=50+80x,下列判斷正確的是( )A.勞動(dòng)生產(chǎn)率為1 000元時(shí),工人工資為130元B.勞動(dòng)生產(chǎn)率提高1 000元時(shí),工人工資平均提高80元C.勞動(dòng)生產(chǎn)率提高1 000元時(shí),工人工資平均提高130元D.當(dāng)月工資為250元時(shí),勞動(dòng)生產(chǎn)率為2 000元2.設(shè)某大學(xué)的女生體重y(單位:kg)與身高x(單位:cm)具有線性相關(guān)關(guān)系.根據(jù)成對(duì)樣本數(shù)據(jù)(xi,yi)(i=1,2,…,n),用最小二乘法建立的經(jīng)驗(yàn)回歸方程為=0.85x-85.71,則下列結(jié)論中不正確的是( )A.y與x具有正的線性相關(guān)關(guān)系B.經(jīng)驗(yàn)回歸直線過(guò)點(diǎn)(,)C.若該大學(xué)某女生身高增加1 cm,則其體重約增加0.85 kgD.若該大學(xué)某女生身高為170 cm,則可判定其體重必為58.79 kg3.(多選)為研究需要,統(tǒng)計(jì)了兩個(gè)變量x,y的數(shù)據(jù)情況如表:x x1 x2 x3 … xny y1 y2 y3 … yn其中數(shù)據(jù)x1,x2,x3,…,xn和數(shù)據(jù)y1,y2,y3,…,yn的均值分別為和,并且計(jì)算樣本相關(guān)系數(shù)r=-0.8,經(jīng)驗(yàn)回歸方程為=x+,以下結(jié)論正確的為(若|r|>0.75,則線性相關(guān)性較強(qiáng))( )A.將以上數(shù)據(jù)的每個(gè)數(shù)據(jù)都加一個(gè)相同的常數(shù)后,方差不變B.變量x,y的相關(guān)性較強(qiáng)C.當(dāng)x=x1時(shí),則必有=y(tǒng)1D.<04.某車間為了提高工作效率,需要測(cè)試加工零件所花費(fèi)的時(shí)間,為此進(jìn)行了5次試驗(yàn),這5次試驗(yàn)的數(shù)據(jù)列(個(gè)數(shù)x,加工時(shí)間y)為:(10,62),(20,a),(30,75),(40,81),(50,89).若用最小二乘法求得其經(jīng)驗(yàn)回歸方程為=0.67x+54.9,則a的值為_(kāi)_______.參考答案與詳細(xì)解析問(wèn)題1 由散點(diǎn)圖的分布趨勢(shì)表明兒子的身高與父親的身高線性相關(guān),通過(guò)樣本相關(guān)系數(shù)可知兒子的身高與父親的身高正線性相關(guān),且相關(guān)程度較高.問(wèn)題2 不能.因?yàn)檫@兩個(gè)變量之間不是函數(shù)關(guān)系,也就不能用函數(shù)模型刻畫(huà).知識(shí)梳理一元線性回歸 因變量 響應(yīng)變量 自變量 解釋變量 截距 斜率 誤差例1 解 (1)(2)(3)(4)(5)回歸模型,(6)(7)函數(shù)模型.跟蹤訓(xùn)練1 D [因?yàn)樨?cái)政收入x與支出y滿足一元線性回歸模型y=bx+a+e,其中b=0.7,a=3,所以y=0.7x+3+e.當(dāng)x=10時(shí),得y=0.7×10+3+e=10+e,又|e|≤0.5,即-0.5≤e≤0.5,所以9.5≤y≤10.5,所以年支出預(yù)計(jì)不會(huì)超過(guò)10.5億元.]問(wèn)題3 使表示成對(duì)樣本數(shù)據(jù)的各散點(diǎn)在整體上與一條適當(dāng)?shù)闹本€盡可能地接近.問(wèn)題4 方法(1),(2),(3)雖然有一定道理,但是比較難操作,方法(4)可以利用點(diǎn)到直線的距離來(lái)刻畫(huà)散點(diǎn)與該直線的接近程度,然后利用所有距離之和刻畫(huà)所有樣本觀測(cè)數(shù)據(jù)與該直線的接近程度(具體推導(dǎo)過(guò)程參考課本108~109頁(yè)).知識(shí)梳理經(jīng)驗(yàn)回歸方程 最小二乘法 最小二乘估計(jì)例2 解 ==5,==50,iyi=2×30+4×40+5×60+6×50+8×70=1 380,5=5×5×50=1 250,=22+42+52+62+82=145,52=5×52=125,==6.5,=-=50-6.5×5=17.5,所以所求經(jīng)驗(yàn)回歸方程為=6.5x+17.5.跟蹤訓(xùn)練2 解 =×(88+76+73+66+63)=73.2,=×(78+65+71+64+61)=67.8.iyi=88×78+76×65+73×71+66×64+63×61=25 054.=882+762+732+662+632=27 174.所以==≈0.625,=-≈67.8-0.625×73.2=22.05.所以所求經(jīng)驗(yàn)回歸方程是=0.625x+22.05.例3 解 (1)由題意可得,=[20+15+13+3+2+(-5)+(-10)+(-18)]×=,=[6.5+3.5+3.5+1.5+0.5+++]×=,===,所以=-=-×=,故經(jīng)驗(yàn)回歸方程為=x+.(2)由題意,設(shè)該同學(xué)的物理成績(jī)?yōu)棣兀瑒t物理偏差為ω-91.5.而數(shù)學(xué)偏差為128-120=8,所以ω-91.5=×8+,解得ω=94,所以,可以預(yù)測(cè)這位同學(xué)的物理成績(jī)?yōu)?4分.跟蹤訓(xùn)練3 解 (1)由題意可得=×(1+1.5+2+2.5+3)=2,=×(0.9+0.7+0.5+0.3+0.2)=0.52.(xi-)(yi-)=-1×0.38-0.5×0.18+0.5×(-0.22)+1×(-0.32)=-0.9,(xi-)2=1+0.25+0.25+1=2.5,則=-=-0.36,=-=1.24,故=-0.36x+1.24.(2)當(dāng)x=2.6時(shí),=-0.36×2.6+1.24=0.304,故估計(jì)該居民家庭的恩格爾系數(shù)為0.304.隨堂演練1.B [因?yàn)榻?jīng)驗(yàn)回歸直線的斜率為80,所以x每增加1,y平均增加80,即勞動(dòng)生產(chǎn)率提高1 000元時(shí),工人工資平均提高80元.]2.D [當(dāng)x=170時(shí),=0.85×170-85.71=58.79,體重的估計(jì)值為58.79 kg.]3.ABD [對(duì)于A,因?yàn)榉讲钍潜硎緮?shù)據(jù)波動(dòng)大小的量,將一組數(shù)據(jù)的每個(gè)數(shù)都加一個(gè)相同的常數(shù)后,方差不變,所以A正確;對(duì)于B,樣本相關(guān)系數(shù)r=-0.8,|r|=0.8,變量x,y的相關(guān)性較強(qiáng),所以B正確;對(duì)于C,當(dāng)x=x1時(shí),不一定有=y(tǒng)1,所以C錯(cuò)誤;對(duì)于D,因?yàn)閞=-0.8<0,是負(fù)相關(guān),所以<0,所以D正確.]4.68解析 根據(jù)題意,可得,=×=30,=×=61.4+.又經(jīng)驗(yàn)回歸直線經(jīng)過(guò)點(diǎn)(,),故可得61.4+=0.67×30+54.9,解得a=68.人教A版高中數(shù)學(xué)選擇性必修三8.2第3課時(shí)-指數(shù)函數(shù)模型與冪函數(shù)模型-導(dǎo)學(xué)案學(xué)習(xí)目標(biāo) 1.進(jìn)一步掌握一元線性回歸模型參數(shù)的統(tǒng)計(jì)意義.2.了解非線性回歸模型,掌握指數(shù)型函數(shù)模型和冪函數(shù)模型的求解過(guò)程.一、指數(shù)函數(shù)模型y=αeβx(α>0)例1 某景區(qū)的各景點(diǎn)從2010年取消門(mén)票實(shí)行免費(fèi)開(kāi)放后,旅游的人數(shù)不斷地增加,不僅帶動(dòng)了該市淡季的旅游,而且優(yōu)化了旅游產(chǎn)業(yè)的結(jié)構(gòu),促進(jìn)了該市旅游向“觀光、休閑、會(huì)展”三輪驅(qū)動(dòng)的理想結(jié)構(gòu)快速轉(zhuǎn)變.下表是從2011年至2020年,該景點(diǎn)的旅游人數(shù)y(萬(wàn)人)與年份x的數(shù)據(jù):第x年 1 2 3 4 5旅游人數(shù)y(萬(wàn)人) 300 283 321 345 372第x年 6 7 8 9 10旅游人數(shù)y(萬(wàn)人) 435 486 527 622 800該景點(diǎn)為了預(yù)測(cè)2023年的旅游人數(shù),建立了y與x的兩個(gè)回歸模型:模型①:由最小二乘法求得y與x的經(jīng)驗(yàn)回歸方程=50.8x+169.7;模型②:由散點(diǎn)圖的樣本點(diǎn)分布,可以認(rèn)為樣本點(diǎn)集中在曲線y=aebx的附近.(1)根據(jù)表中數(shù)據(jù),求模型②的經(jīng)驗(yàn)回歸方程=aebx(a精確到個(gè)位,b精確到0.01);(2)根據(jù)下列表中的數(shù)據(jù),比較兩種模型的決定系數(shù)R2,并選擇擬合精度更高、更可靠的模型,預(yù)測(cè)2023年該景區(qū)的旅游人數(shù)(單位:萬(wàn)人,精確到個(gè)位).經(jīng)驗(yàn)回歸方程 ①=50.8x+169.7 ②=aebx(yi-)2 30 407 14 607參考公式、參考數(shù)據(jù)及說(shuō)明:①對(duì)于一組數(shù)據(jù)(v1,w1),(v2,w2),…,(vn,wn),其經(jīng)驗(yàn)回歸直線=+v的斜率和截距的最小二乘估計(jì)分別為=,=-.②刻畫(huà)回歸效果的決定系數(shù)R2=1-.③參考數(shù)據(jù):e5.46≈235,e1.43≈4.2.(xi-)2 (xi-)·(yi-) (xi-)·(ui-)5.5 449 6.05 83 4 195 9.00表中ui=ln yi,=i.反思感悟 指數(shù)函數(shù)型y=ebx+a回歸問(wèn)題的處理方法(1)函數(shù)y=ebx+a的圖象,如圖所示.(2)處理方法:兩邊取對(duì)數(shù)得ln y=ln ebx+a,即ln y=bx+a.令z=ln y,把原始數(shù)據(jù)(x,y)轉(zhuǎn)化為(x,z),再根據(jù)線性回歸模型的方法求出a,b.跟蹤訓(xùn)練1 已知某種細(xì)菌的適宜生長(zhǎng)溫度為10 ℃~25 ℃,為了研究該種細(xì)菌的繁殖數(shù)量y(單位:個(gè))隨溫度x(單位:℃)變化的規(guī)律,收集數(shù)據(jù)如表:溫度x/℃ 12 14 16 18 20 22 24繁殖數(shù)量y/個(gè) 20 25 33 27 51 112 194對(duì)數(shù)據(jù)進(jìn)行初步處理后,得到了一些統(tǒng)計(jì)量的值,如表所示:(xi-)2 (ki-)2 (xi-)· (yi-) (xi-)· (ki-)18 66 3.8 112 4.3 1 428 20.5其中ki=ln yi,=i.(1)請(qǐng)繪出y關(guān)于x的散點(diǎn)圖,并根據(jù)散點(diǎn)圖判斷y=bx+a與y=cedx哪一個(gè)更適合作為該種細(xì)菌的繁殖數(shù)量y關(guān)于x的經(jīng)驗(yàn)回歸方程模型(只做出判斷,不必說(shuō)明理由);(2)根據(jù)(1)的判斷結(jié)果及表格數(shù)據(jù),建立y關(guān)于x的經(jīng)驗(yàn)回歸方程(結(jié)果精確到0.1);(3)當(dāng)溫度為25 ℃時(shí),該種細(xì)菌的繁殖數(shù)量的預(yù)測(cè)值為多少?參考公式:對(duì)于一組數(shù)據(jù)(ui,vi)(i=1,2,3,…,n),其經(jīng)驗(yàn)回歸直線=u+的斜率和截距的最小二乘估計(jì)分別為=,=-.參考數(shù)據(jù):e5.5≈245.二、冪函數(shù)模型y=αxβ(α>0)例2 某公司為確定下一年度投入某種產(chǎn)品的宣傳費(fèi),需了解年宣傳費(fèi)x(單位:千元)對(duì)年銷售量y(單位:t)和年利潤(rùn)z(單位:千元)的影響.對(duì)近8年的年宣傳費(fèi)xi和年銷售量yi(i=1,2,…,8)數(shù)據(jù)作了初步處理,得到下面的散點(diǎn)圖及一些統(tǒng)計(jì)量的值.(xi-)2 (wi-)246.6 563 6.8 289.8 1.6(xi-)·(yi-) (wi-)·(yi-)1 469 108.8表中wi=,=i.(1)根據(jù)散點(diǎn)圖判斷,y=a+bx與y=c+d哪一個(gè)適宜作為年銷售量y關(guān)于年宣傳費(fèi)x的經(jīng)驗(yàn)回歸方程模型?(給出判斷即可,不必說(shuō)明理由)(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的經(jīng)驗(yàn)回歸方程;(3)已知這種產(chǎn)品的年利潤(rùn)z與x,y的關(guān)系為z=0.2y-x.根據(jù)(2)的結(jié)果計(jì)算年宣傳費(fèi)x為何值時(shí),年利潤(rùn)的預(yù)測(cè)值最大?附:對(duì)于一組數(shù)據(jù)(u1,v1),(u2,v2),…,(un,vn),其經(jīng)驗(yàn)回歸直線=+u的斜率和截距的最小二乘估計(jì)分別為=,=-.反思感悟 y=bxn+a型處理方法設(shè)x′=xn,原方程可化為y=bx′+a,再根據(jù)線性回歸模型的方法求出a,b.跟蹤訓(xùn)練2 某企業(yè)新研發(fā)了一種產(chǎn)品,產(chǎn)品的成本由原料成本及非原料成本組成.每件產(chǎn)品的非原料成本y(元)與生產(chǎn)該產(chǎn)品的數(shù)量x(千件)有關(guān),經(jīng)統(tǒng)計(jì)得到如表數(shù)據(jù):x 1 2 3 4 5 6 7 8y 112 61 44.5 35 30.5 28 25 24根據(jù)以上數(shù)據(jù),繪制了散點(diǎn)圖.觀察散點(diǎn)圖,兩個(gè)變量不具有線性相關(guān)關(guān)系,現(xiàn)考慮用反比例函數(shù)模型y=a+和指數(shù)函數(shù)模型y=cedx分別對(duì)兩個(gè)變量的關(guān)系進(jìn)行擬合.已求得用指數(shù)函數(shù)模型擬合的經(jīng)驗(yàn)回歸方程為=96.54e-0.2x,ln y與x的樣本相關(guān)系數(shù)r1=-0.94.(1)用反比例函數(shù)模型求y關(guān)于x的非線性經(jīng)驗(yàn)回歸方程;(2)用樣本相關(guān)系數(shù)判斷上述兩個(gè)模型哪一個(gè)擬合效果更好(精確到0.01),并用其預(yù)測(cè)產(chǎn)量為10千件時(shí)每件產(chǎn)品的非原料成本.參考數(shù)據(jù):iyi 2183.4 0.34 0.115 1.53i e-2360 22 385.5 61.4 0.135參考公式:對(duì)于一組數(shù)據(jù)(u1,v1),(u2,v2),…,(un,vn),其經(jīng)驗(yàn)回歸直線=+u的斜率和截距的最小二乘估計(jì)分別為=,=-,樣本相關(guān)系數(shù)r=.1.知識(shí)清單:(1)指數(shù)函數(shù)模型.(2)冪函數(shù)模型.2.方法歸納:轉(zhuǎn)化思想.3.常見(jiàn)誤區(qū):非線性經(jīng)驗(yàn)回歸方程轉(zhuǎn)化為線性經(jīng)驗(yàn)回歸方程時(shí)的轉(zhuǎn)化方法.1.給出下列說(shuō)法:①以模型y=cekx去擬合一組數(shù)據(jù)時(shí),為了求出非線性經(jīng)驗(yàn)回歸方程,設(shè)z=ln y,經(jīng)計(jì)算得到經(jīng)驗(yàn)回歸方程=0.3x+4,則c,k的值分別是e4和0.3;②根據(jù)具有線性相關(guān)關(guān)系的兩個(gè)變量的統(tǒng)計(jì)數(shù)據(jù),得到經(jīng)驗(yàn)回歸方程=+x,若=2,=1,=3,則=1;③若變量x和y滿足關(guān)系y=-0.1x+1,且變量y與z正相關(guān),則x與z也正相關(guān).其中正確說(shuō)法的個(gè)數(shù)是( )A.0 B.1 C.2 D.32.某校數(shù)學(xué)學(xué)習(xí)興趣小組為研究某作物種子的發(fā)芽率y和溫度x(單位:°C)的關(guān)系,由試驗(yàn)數(shù)據(jù)得到如圖所示的散點(diǎn)圖. 由此散點(diǎn)圖,可以得出最適宜作為發(fā)芽率y和溫度x的經(jīng)驗(yàn)回歸方程模型的是( )A.y=a+bx B.y=a+bln xC.y=a+bex D.y=a+bx23.若一函數(shù)模型為y=ax2+bx+c(a≠0),將y轉(zhuǎn)化為t的經(jīng)驗(yàn)回歸方程,需做變換t等于( )A.x2 B.(x+a)2C.2 D.以上都不對(duì)4.在研究?jī)蓚€(gè)變量的相關(guān)關(guān)系時(shí),觀察散點(diǎn)圖發(fā)現(xiàn)樣本點(diǎn)集中于某一條指數(shù)曲線y=ebx+a的周圍.令=ln y,求得經(jīng)驗(yàn)回歸方程為=0.25x-2.58,則該模型的非線性經(jīng)驗(yàn)回歸方程為_(kāi)___________________.參考答案與詳細(xì)解析例1 解 (1)對(duì)y=aebx取對(duì)數(shù),得ln y=bx+ln a,設(shè)u=ln y,c=ln a,先建立u關(guān)于x的經(jīng)驗(yàn)回歸方程為=x+.==≈0.108,=-≈6.05-0.108×5.5=5.456≈5.46,=≈e5.46≈235,∴模型②的經(jīng)驗(yàn)回歸方程為=235e0.11x.(2)由表格中的數(shù)據(jù),有30 407>14 607,即>,即1-<1-,R說(shuō)明回歸模型②的擬合效果更好.2023年時(shí),x=13,預(yù)測(cè)旅游人數(shù)為=235e0.11×13=235e1.43≈235×4.2=987(萬(wàn)人).跟蹤訓(xùn)練1 解 (1)由題意,y關(guān)于x的散點(diǎn)圖,如圖所示.y=cedx更適合作為y關(guān)于x的經(jīng)驗(yàn)回歸方程.(2)由(1)知y=cedx,則ln y=x+ln c,令k=ln y,則=x+ln c,∴==≈0.183,ln c=-=3.8-0.183×18≈0.5,即c≈e0.5.∴y關(guān)于x的經(jīng)驗(yàn)回歸方程為=e0.2x+0.5.(3)由(2)中的經(jīng)驗(yàn)回歸方程,令x=25,求得=e5.5≈245,∴當(dāng)溫度為25 ℃時(shí),該種細(xì)菌的繁殖數(shù)量的預(yù)測(cè)值為245個(gè).例2 解 (1)由散點(diǎn)圖可以判斷,y=c+d適宜作為年銷售量y關(guān)于年宣傳費(fèi)x的經(jīng)驗(yàn)回歸方程模型.(2)令w=,=+w.先建立y關(guān)于w的經(jīng)驗(yàn)回歸方程.由于===68,=-=563-68×6.8=100.6,所以y關(guān)于w的經(jīng)驗(yàn)回歸方程為=100.6+68w,因此y關(guān)于x的非線性經(jīng)驗(yàn)回歸方程為=100.6+68.(3)根據(jù)(2)的結(jié)果知,年利潤(rùn)z的預(yù)測(cè)值=0.2(100.6+68)-x=-x+13.6+20.12.所以當(dāng)==6.8,即x=46.24時(shí),取得最大值.故年宣傳費(fèi)為46.24千元時(shí),年利潤(rùn)的預(yù)測(cè)值最大.跟蹤訓(xùn)練2 解 (1)令u=,則y=a+可轉(zhuǎn)化為y=a+bu,先建立y關(guān)于u的經(jīng)驗(yàn)回歸方程,因?yàn)椋剑?5,所以====100,則=-=45-100×0.34=11,所以=11+100u,所以y關(guān)于x的非線性經(jīng)驗(yàn)回歸方程為=11+.(2)y與的樣本相關(guān)系數(shù)為r2==≈0.99.因?yàn)閨r1|<|r2|,所以用反比例函數(shù)模型擬合效果更好,當(dāng)x=10時(shí),y=+11=21,所以當(dāng)產(chǎn)量為10千件時(shí),預(yù)測(cè)每件產(chǎn)品的非原料成本為21元.隨堂演練1.C [由非線性經(jīng)驗(yàn)回歸方程的求解過(guò)程可知①正確;易知②正確;根據(jù)y與z正相關(guān),y與x負(fù)相關(guān),可知x與z負(fù)相關(guān),③錯(cuò)誤.]2.B [由散點(diǎn)圖可知,數(shù)據(jù)分布成遞增趨勢(shì),但是呈現(xiàn)上凸效果,即增加緩慢.A中,y=a+bx是直線型,均勻增長(zhǎng),不符合要求;B中,y=a+bln x是對(duì)數(shù)型,增長(zhǎng)緩慢,符合要求;C中,y=a+bex是指數(shù)型,爆炸式增長(zhǎng),增長(zhǎng)快,不符合要求;D中,y=a+bx2是二次函數(shù)型,圖象呈現(xiàn)下凸,增長(zhǎng)也較快,不符合要求.故對(duì)數(shù)型最適宜該經(jīng)驗(yàn)回歸方程模型.]3.C [y=ax2+bx+c=a2+(a≠0),可令t=2,則y=at+為關(guān)于t的經(jīng)驗(yàn)回歸方程.]4.=e0.25x-2.58解析 因?yàn)椋?.25x-2.58,=ln y,所以=e0.25x-2.58. 展開(kāi)更多...... 收起↑ 資源列表 人教A版高中數(shù)學(xué)選擇性必修三-8.2第1課時(shí)-一元線性回歸模型及參數(shù)的最小二乘估計(jì)-導(dǎo)學(xué)案【含答案】.docx 人教A版高中數(shù)學(xué)選擇性必修三-8.2第2課時(shí)-一元線性回歸模型的綜合問(wèn)題-導(dǎo)學(xué)案【含答案】.docx 人教A版高中數(shù)學(xué)選擇性必修三-8.2第3課時(shí)-指數(shù)函數(shù)模型與冪函數(shù)模型-導(dǎo)學(xué)案【含答案】.docx 縮略圖、資源來(lái)源于二一教育資源庫(kù)