資源簡介 專題8.3 一元線性回歸模型及其應用(重難點題型精講)1.一元線性回歸模型把式子為Y關于x的一元線性回歸模型.其中,Y稱為因變量或響應變量,x稱為自變量或解釋變量;a和b為模型的未知參數,a稱為截距參數,b稱為斜率參數;e是Y與bx+a之間的隨機誤差.2.線性經驗回歸方程與最小二乘法設滿足一元線性回歸模型的兩個變量的n對樣本數據為(,),(,),,(,),由=+a+(i=1,2,,n),得|-(+a)|= ||,顯然||越小,表示樣本數據點離直線y=bx+a的豎直距離越小.通常用各散點到直線的豎直距離的平方之和Q=來刻畫各樣本觀測數據與直線y=bx+a的“整體接近程度”.當a,b的取值為時,Q達到最小.將=x+稱為Y關于x的經驗回歸方程,也稱經驗回歸函數或經驗回歸公式,其圖形稱為經驗回歸直線.這種求經驗回歸方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估計.經驗回歸直線一定過點(,).3.殘差分析對于響應變量Y,通過觀測得到的數據稱為觀測值,通過經驗回歸方程得到的稱為預測值,觀測值減去預測值稱為殘差.殘差是隨機誤差的估計結果,通過對殘差的分析可以判斷模型刻畫數據的效果,以及判斷原始數據中是否存在可疑數據等,這方面工作稱為殘差分析.4.刻畫回歸效果的方式(1)殘差圖法作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或身高數據,或體重估計值等,這樣作出的圖形稱為殘差圖.在殘差圖中,殘差點比較均勻地落在以取值為0的橫軸為對稱軸的水平帶狀區域內,說明選用的模型比較合適,這樣的帶狀區域的寬度越窄,說明模型擬合精度越高.(2)殘差平方和法殘差平方和為,殘差平方和越小,模型擬合效果越好.(3)利用刻畫擬合效果=.越大,模型的擬合效果越好,越小,模型的擬合效果越差.(1)對于變量x和變量y,設經過隨機抽樣獲得的成對樣本數據為(,),(,),,(,),利用相關系數r來衡量兩個變量之間線性關系的強弱,相關系數r的計算公式:(其中,,,和,,,的均值分別為和).①當r>0時,稱成對樣本數據正相關.這時,當其中一個數據的值變小時,另一個數據的值通常也變小;當其中一個數據的值變大時,另一個數據的值通常也變大.②當r<0時,稱成對樣本數據負相關.這時,當其中一個數據的值變小時,另一個數據的值通常會變大;當其中一個數據的值變大時,另一個數據的值通常會變小.【題型1 一元線性回歸模型】【方法點撥】根據一元線性回歸模型的定義,結合具體題目條件,進行求解即可.【例1】(2022·高二單元測試)根據如下樣本數據,得到線性回歸方程為,若樣本點的中心為,則當X每增加1個單位時,Y平均( )X 3 4 5 6 7Y 4.0 -0.5 0.5A.增加1.4個單位 B.減少1.4個單位 C.增加7.9個單位 D.減少7.9個單位【解題思路】根據已知條件解出m和n,得到線性回歸方程,即可得到答案.【解答過程】樣本點的中心為,則,故,且,解得,,則,可知當X每增加1個單位時,Y平均減少1.4個單位.故選:B.【變式1-1】(2022春·黑龍江大慶·高二期末)給出下列說法中錯誤的是( )A.回歸直線恒過樣本點的中心B.兩個變量相關性越強,則相關系數就越接近1C.某7個數的平均數為4,方差為2,現加入一個新數據4,此時這8個數的方差不變D.在回歸直線方程中,當變量x增加一個單位時,平均減少0.5個單位【解題思路】A中,根據回歸直線方程的特征,可判定是否正確;B中,根據相關系數的意義,可判定是否正確;C中,根據方差的計算公式,可判定是否正確;D中,根據回歸系數的含義,可判定是否正確.【解答過程】對于A中,回歸直線恒過樣本點的中心,所以正確;對于B中,根據相關系數的意義,可得兩個變量相關性越強,則相關系數就越接近1,所以是正確的;對于C中,根據平均數的計算公式可得,根據方差的計算公式,所以是不正確的;對于D中,根據回歸系數的含義,可得在回歸直線方程中,當解釋變量增加一個單位時,預報變量平均減少0.5個單位,所以是正確的.故選:C.【變式1-2】(2022春·河南南陽·高二期中)已知變量x和y的回歸直線方程為,變量y與z負相關.下列結論中正確的是( )A.x與y正相關,x與z正相關 B.x與y正相關,x與z負相關C.x與y負相關,x與z負相關 D.x與y負相關,x與z正相關【解題思路】根據變量x和y的回歸直線方程判斷.【解答過程】解:因為變量x和y的回歸直線方程為,且,所以變量x與y正相關,又變量y與z負相關,所以x與z負相關,故選:B.【變式1-3】(2022春·陜西渭南·高一期末)根據如下樣本數據:得到線性回歸方程為,則( )A. B. C. D.【解題思路】根據與負相關且樣本點集中在第一象限可判斷出結果.【解答過程】由樣本數據知:與負相關,;又樣本點位于第一象限,在軸截距為正,.故選:B.【題型2 殘差的計算】【方法點撥】根據題目條件,得出經驗回歸方程,再進行殘差的計算.【例2】(2022春·湖北·高二期末)某城市選用一種植物進行綠化,設其中一株幼苗從觀察之日起,第x天的高度為ycm,測得一些數據如下表所示:第x天 1 2 3 4 5 6 7高度y/cm 1 4 6 9 11 12 13由表格中數據可得y關于x的經驗回歸方程為,則第7天的殘差為( )A.1.12 B.2.12 C. D.【解題思路】依題意求出、,根據回歸直線方程必過樣本中心點求出,即可得到回歸直線方程,再根據殘差公式計算可得;【解答過程】解:通過表格計算得,,,因為經驗回歸直線過點,所以,所以關于的經驗回歸方程為.所以回歸模型第天的殘差.故選:C.【變式2-1】(2023春·河南開封·高三開學考試)某部門統計了某地區今年前7個月在線外賣的規模如下表:月份代號x 1 2 3 4 5 6 7在線外賣規模y(百萬元) 11 13 18 ★ 28 ★ 35其中4、6兩個月的在線外賣規模數據模糊,但這7個月的平均值為23.若利用回歸直線方程來擬合預測,且7月相應于點的殘差為,則( )A.1.0 B.2.0 C.3.0 D.4.0【解題思路】根據給定條件,求出,再借助回歸直線的特征及殘差列出方程組即可求解作答.【解答過程】依題意,,而,于是得,而當時,,即,聯立解得,所以.故選:B.【變式2-2】(2022春·河南許昌·高二期末)為研究變量x,y的相關關系,收集得到下面五個樣本點(x,y):x 5.5 6.5 7 7.5 8.5y 9 8 6 4 3若由最小二乘法求得y關于x的回歸直線方程為,則據此計算殘差為1.1的樣本點是( )A.(5.5,9) B.(6.5,8) C.(7,6) D.(7.5,4)【解題思路】先求出回歸方程的樣本中心點,從而可求得,再根據殘差的定義可判斷.【解答過程】由題意可知,,,所以回歸方程的樣本中心點為,因此有,所以,當時,;當時,;當時,;當時,;故選:B.【變式2-3】(2022春·江蘇宿遷·高二階段練習)在對具有線性相關的兩個變量和進行統計分析時,得到如下數據:4 8 10 121 2 3 5 6由表中數據求得關于的回歸方程為,則,,這三個樣本數據中,殘差的絕對值最小的是( )A. B. C. D.和【解題思路】根據樣本中心點一定在線性回歸方程上,求出,分別計算出三個樣本數據的殘差的絕對值,比較得到結果.【解答過程】,,因為樣本中心點一定在上,代入解得:,當時,,;當時,,,當時,,,因為,所以殘差的絕對值最小的是故選:B.【題型3 刻畫回歸效果的方式】【方法點撥】根據刻畫回歸效果的三種方式,結合具體題目條件,選取適當的方式來刻畫模型的擬合效果,即可得解.【例3】(2022秋·寧夏銀川·高三開學考試)下列說法正確的個數是( )(1)在做回歸分析時,殘差圖中殘差點分布的帶狀區域的寬度越窄表示回歸效果越差(2)某地氣象局預報:6月9日本地降水概率為90%,結果這天沒下雨,這表明天氣預報并不科學(3)回歸分析模型中,殘差平方和越小,說明模型的擬合效果越好(4)在回歸直線方程,當解釋變量每增加1個單位時,預報變量多增加0.1個單位A.2 B.3 C.4 D.1【解題思路】根據殘差分析的性質判斷(1),(3)選項,由概率的意義判斷(2)選項,根據回歸直線方程的意義判斷(4).【解答過程】解:對(1),在做回歸分析時,殘差圖中殘差點分布的帶狀區域的寬度越窄表示回歸效果越好,故錯誤;對(2),概率只說明事件發生的可能性,某次事件不一定發生,所以并不能說明天氣預報不科學,故錯誤;對(3),在回歸分析模型中,殘差平方和越小,說明模型的擬合效果越好,故正確;對(4),在回歸直線方程,當解釋變量每增加1個單位時,預報變量增加0.1個單位,故正確.故選:A.【變式3-1】(2022春·山東菏澤·高二期末)關于線性回歸的描述,下列命題錯誤的是( )A.回歸直線一定經過樣本點的中心 B.殘差平方和越小,擬合效果越好C.決定系數越接近1,擬合效果越好 D.殘差平方和越小,決定系數越小【解題思路】根據線性回歸的性質判斷即可【解答過程】對A,回歸直線一定經過樣本點的中心正確;對B,殘差平方和越小,擬合效果越好正確;對C,決定系數越接近1,擬合效果越好正確;對D,殘差平方和越小,擬合效果越好,決定系數越接近1,故D錯誤;故選:D.【變式3-2】(2022秋·廣東廣州·高三階段練習)對兩個變量和進行回歸分析,得到一組樣本數據,,…,則下列說法不正確的是( )A.若變量和之間的相關系數為,則變量和之間具有較強的線性相關關系B.殘差平方和越小的模型,擬合的效果越好C.用決定系數來刻畫回歸效果,越小說明擬合效果越好D.在殘差圖中,殘差點分布水平帶狀區域的寬度越窄,則回歸方程的預報精確度越高【解題思路】變量和之間的相關系數為越大,則變量和之間具有較強的線性相關關系可判斷A;殘差平方和越小的模型,擬合的效果越好可判斷B;用決定系數來刻畫回歸效果,越大說明擬合效果越好可判斷 C;在殘差圖中,殘差點分布水平帶狀區域的寬度越窄,則回歸方程的預報精確度越高可判斷D.【解答過程】變量和之間的相關系數為越大,則變量和之間具有較強的線性相關關系,故A正確;殘差平方和越小的模型,擬合的效果越好,故B正確;用決定系數來刻畫回歸效果,越大說明擬合效果越好,故C錯誤;在殘差圖中,殘差點分布水平帶狀區域的寬度越窄,則回歸方程的預報精確度越高,故D正確.故選:C.【變式3-3】(2022春·甘肅天水·高二階段練習)關于線性回歸的描述,有下列命題:①回歸直線一定經過樣本中心點;②相關系數的絕對值越大,擬合效果越好;③相關指數越接近1擬合效果越好;④殘差平方和越小,擬合效果越好.其中正確的命題個數為( )A.1 B.2 C.3 D.4【解題思路】根據回歸直線方程的性質,相關系數、相關系數及殘差平方和的意義判斷各項的正誤即可.【解答過程】對于①,回歸直線一定經過樣本中心點,故正確;對于②,相關系數的絕對值越接近于1,相關性越強,故錯誤;對于③,相關指數越接近1擬合效果越好,故正確;對于④,殘差平方和越小,擬合效果越好,故正確.故選:C.【題型4 代入法求線性經驗回歸方程】【方法點撥】經驗回歸直線一定經過樣本點的中心(,),求出樣本點的中心后代入線性回歸方程求解相應字母.【例4】(2023秋·四川廣安·高二階段練習)已知兩個變量和之間存在線性相關關系,某興趣小組收集了一組,的樣本數據如下表所示:1 2 3 4 50.5 0.6 1 1.4 1.5根據表中數據利用最小二乘法得到的回歸方程是( )A. B.C. D.【解題思路】求出,,由回歸直線必過樣本中心,將點(,)依次代入各項檢驗是否成立可得結果.【解答過程】∵,∴回歸直線必過樣本中心(3,1),而A、B、D項中的回歸直線方程不過點(3,1),C項的回歸直線方程過點(3,1),故選:C.【變式4-1】(2022秋·陜西榆林·高二期中)已知,的取值如下表所示:x 0 1 3 4y 2.2 4.3 4.8 6.7若與線性相關,且,則( )A.2.2 B.2.9 C.2.8 D.2.6【解題思路】利用平均數可得樣本的中心點為,將中心點對應的值代入題目中的等式即可求出的值.【解答過程】由表格,得,,線性回歸直線過樣本中心點,所以,所以.故選:D.【變式4-2】(2023秋·河南焦作·高二期末)某產品的廣告費用x與銷售額y的統計數據如表:廣告費用x(萬元) 3 4 5 6銷售額y(萬元) 25 30 40 45根據如表可得回歸方程中的為7.根據此模型預測廣告費用為10萬元時銷售額為( )萬元A.63.6 B.75.5 C.73.5 D.72.0【解題思路】線性回歸方程.根據回歸方程必過樣本中心點,求出回歸系數,再將代入,即可得到預報銷售額.【解答過程】解:由題意,,,由回歸方程中的為7可得,,解得,所以,回歸方程為,所以時,元.故選:C.【變式4-3】(2023秋·四川宜賓·高二期末)某小區流感大爆發,當地醫療機構使用中西醫結合的方法取得了不錯的成效,每周治愈的患者人數如表所示,由表格可得y關于x的線性經驗回歸方程為,則測此回歸模型第4周的治愈人數為( )周數(x) 1 2 3 4 5治愈人數(y) 5 15 35 ? 140A. B. C. D.【解題思路】設第4周的治愈人數為,表示出樣本中心點,代入到回歸方程中,進而可求出答案.【解答過程】根據題意,設第4周的治愈人數為,則有,,所以樣本中心點為,代入到回歸方程中,得,故選:B.【題型5 經驗回歸模型的應用】【方法點撥】(1)確定研究對象,明確哪個變量是解釋變量,哪個變量是響應變量;(2)畫出解釋變量和響應變量的散點圖,觀察它們之間的關系(如是否存在線性關系等);(3)確定經驗回歸方程的類型(如我們觀察到數據呈線性關系,則選用線性經驗回歸方程);(4)按一定規則(如最小二乘法)估計經驗回歸方程中的參數;(5)得出結果后分析殘差圖是否有異常(如個別數據對應殘差過大,殘差呈現不隨機的規律性等),若存在異常,則檢查數據是否有誤,或模型是否合適等.【例5】(2023秋·四川雅安·高二期末)某連鎖經營公司所屬5個零售店某月的銷售額和利潤額資料如表.商店名稱 A B C D E銷售額x(千萬元) 3 5 6 7 9利潤額y(千萬元) 2 3 3 4 5(1)若銷售額和利潤額具有相關關系,用最小二乘法計算利潤額y對銷售額x的回歸直線方程.(參考公式,)(2)若該公司計劃再開一個店想達到預期利潤為8百萬,請預估銷售額需要達到多少 【解題思路】(1)根據已知條件,結合最小二乘法和回歸直線方程的公式,即可求解.(2)將代入回歸直線方程中,即可求解.【解答過程】(1)由表中的數據可得,,,,,故利潤額y對銷售額x的回歸直線方程為.(2)∵該公司計劃再開一個店想達到預期利潤為8百萬,即0.8千萬,∴,解得,故預計銷售額需要達到8百萬.【變式5-1】(2023·全國·模擬預測)目前手機已經成為人們生活中的必需品,國內市場已經進入成熟期,下表是2016—2021年某市手機總體出貨量(單位:萬部)統計表.年份 2016年 2017年 2018年 2019年 2020年 2021年年份代碼 1 2 3 4 5 6手機總體出貨量/萬部 5.6 4.9 4.1 3.9 3.2 3.5(1)已知該市手機總體出貨量y與年份代碼x之間可用線性回歸模型擬合,求y關于x的線性回歸方程(系數精確到0.01);(2)預測2022年該市手機總體出貨量.附:線性回歸方程中斜率與截距的最小二乘估計公式分別為,.【解題思路】(1)根據題中所給數據,利用最小二乘法求出,即可得解;(2)將代入(1)中回歸方程,即可得解.【解答過程】(1)由題中統計表得,,所以 ,,則,,所以y關于x的線性回歸方程為;(2)由題意得2022年對應的年份代碼,代入,得,所以預測2022年該市手機總體出貨量為2.63萬部.【變式5-2】(2023秋·四川成都·高二期末)某工廠統計2022年銷售網點數量與售賣出的產品件數的數據如下表:銷售網點數x(單位:個) 17 19 20 21 23售賣出的產品件數y(單位:萬件) 21 22 25 27 30假定該工廠銷售網點的個數與售賣出的產品件數呈線性相關關系,(1)求2022年售賣出的產品件數y(單位:萬件)關于銷售網點數x(單位:個)的線性回歸方程;(2)根據(1)中求出的線性回歸方程,預測2022年該工廠建立40個銷售網點時售賣出的產品件數.參考公式:,.【解題思路】(1)由參考公式可算出銷售網點數x(單位:個)的線性回歸方程;(2)將代入由(1)算得的回歸方程可得答案.【解答過程】(1)由題,可得,,,.則,.故回歸方程為:.(2)將代入回歸方程,則.故2022年該工廠建立40個銷售網點時售賣出的產品件數約萬件.【變式5-3】(2023·山東·模擬預測)我國技術給直播行業帶來了很多發展空間,加上受疫情影響,直播這種成本較低的獲客渠道備受商家青睞,某商場統計了2022年1~5月某商品的線上月銷售量y(單位:千件)與售價x(單位:元/件)的情況如下表示.月份 1 2 3 4 5售價x(元/件) 60 56 58 57 54月銷售量y(千件) 5 9 7 10 9(1)求相關系數,并說明是否可以用線性回歸模型擬合與的關系(當時,可以認為兩個變量有很強的線性相關性;否則,沒有很強的線性相關性)(精確到0.01);(2)建立關于的線性回歸方程,并估計當售價為元/件時,該商品的線上月銷售量估計為多少千件?(3)若每件商品的購進價格為元/件,如果不考慮其他費用,由(2)中結論,當商品售價為多少時,可使得該商品的月利潤最大?(該結果保留整數)參考公式:對于一組數據,相關系數,其回歸直線的斜率和截距的最小二乘估計分別為:.參考數據:.【解題思路】(1)根據數據計算,從而分別代入計算出,,,由公式計算相關系數并判斷相關性;(2)代入公式求解,,從而寫出回歸方程,再代入,計算;(3)設每月的利潤為元,寫出關于的函數解析式,根據二次函數的性質,求解對稱軸即可.【解答過程】(1)由已知數據可得,,,,所以相關系數,因為,所以與有很強的線性相關性,可以用線性回歸模型擬合.(2)由于,,所以關于的線性回歸方程為,當時,,故當售價為元/件時,該商品的線上月銷售量估計為千件.(3)設每月的利潤為元,則,當時,Z取得最大值.即當商品售價為元/件時,可使得該商品的月利潤最大.【題型6 非線性經驗回歸方程的求法】【方法點撥】(1)作散點圖確定曲線模型:曲線所對應的函數種類繁多,這就要求我們充分想象,大膽猜測擬合函數類型,粗略估計使用哪個函數擬合.(2)非線性轉化為線性:先通過適當變換化非線性關系為線性關系,然后按照線性檢驗回歸方程的求解步驟進行求解.(3)分析模型的擬合效果,得出結論.【例6】(2023·陜西西安·統考一模)為了研究某種細菌隨天數x變化的繁殖個數y,收集數據如下:天數x 1 2 3 4 5 6繁殖個數y 3 6 13 25 45 100(1)判斷(為常數)與(為常數,且)哪一個適宜作為繁殖個數y關于天數x變化的回歸方程類型?(給出判斷即可,不必說明理由)(2)對于非線性回歸方程(為常數,且),令,可以得到繁殖個數的對數z關于天數x具有線性關系及一些統計量的值,3.50 32 2.85 17.5 307 12.12(ⅰ)證明:對于非線性回歸方程,令,可以得到繁殖個數的對數z關于天數x具有線性關系(即為常數);(ⅱ)根據(ⅰ)的判斷結果及表中數據,建立y關于x的回歸方程(系數保留2位小數).附:對于一組數據其回歸直線方程的斜率和截距的最小二乘估計分別為.【解題思路】(1)根據給定數據作出散點圖,再借助散點圖即可判斷作答.(2)(ⅰ)由(1)選定的回歸方程類型,取對數即可得關于x的直線方程作答;(ⅱ)由(ⅰ)的結果,利用最小二乘法求解作答.【解答過程】(1)作出繁殖個數y關于天數x變化的散點圖,如圖,觀察散點圖知,樣本點分布在一條指數型曲線周圍,所以更適宜作為繁殖個數y關于天數x變化的回歸方程類型.(2)(ⅰ)由(1)知,(為常數,且),又,因此,令,即有為常數,所以繁殖個數的對數z關于天數x具有線性關系.(ⅱ),,由(ⅰ)知,,,因此,所以y關于x的回歸方程為.【變式6-1】(2023·云南·高三階段練習)近年來,云南省保山市龍陵縣緊緊圍繞打造“中國石斛之鄉”的發展定位,大力發展石斛產業,該產業帶動龍陵縣近四分之一人口脫貧致富.2022年8月,龍陵紫皮石斛獲國家地理標志運用促進工程重點項目,并被評為優秀等次.在政府的大力扶持下,龍陵紫皮石斛產量逐年增長,2017年底到2022年底龍陵縣石斛產量統計如下及散點圖如圖.年份 2017 2018 2019 2020 2021 2022年份代碼x 1 2 3 4 5 6紫皮石斛產量y(噸) 3200 3400 3600 4200 7500 9000(1)根據散點圖判斷,與(a,b,c,d均為常數)哪一個更適合作為龍陵縣紫皮石斛產量y關于年份代碼x的回歸方程類型?(給出判斷即可,不必說明理由)(2)經計算得下表中數據,根據(1)中結果,求出y關于x的回歸方程;3.5 5150 8.46 17.5 20950 3.85其中.(3)龍陵縣計劃到2025年底實現紫皮石斛年產量達1.5萬噸,根據(2)所求得的回歸方程,預測該目標是否能完成?(參考數據:)附:,.【解題思路】(1)根據判斷即可;(2)根據表中數據和參考數據,利用公式求解即可;(3)根據(2)中所得的回歸方程即可預測到2025年底該目標值,從而即可判斷.【解答過程】(1)由散點圖可知,更適合作為龍陵縣紫皮石斛產量y關于年份代碼x的回歸方程類型.(2)對兩邊取自然對數,得.令,所以.因為,所以.所以,所以.所以龍陵縣紫皮石斛產量y關于年份代碼x的回歸方程為.(3)當時,,故預測該目標可以完成.【變式6-2】(2023·江西撫州·高三開學考試)數據顯示中國車載音樂已步入快速發展期,隨著車載音樂的商業化模式進一步完善,市場將持續擴大,下表為2018—2022年中國車載音樂市場規模(單位:十億元),其中年份2018—2022對應的代碼分別為1—5.年份代碼x 1 2 3 4 5車載音樂市場規模y 2.8 3.9 7.3 12.0 17.0(1)由上表數據知,可用指數函數模型擬合y與x的關系,請建立y關于x的回歸方程(a,b的值精確到0.1);(2)綜合考慮2023年及2024年的經濟環境及疫情等因素,某預測公司根據上述數據求得y關于x的回歸方程后,通過修正,把作為2023年與2024年這兩年的年平均增長率,請根據2022年中國車載音樂市場規模及修正后的年平均增長率預測2024年的中國車載音樂市場規模.參考數據:1.94 33.82 1.7 1.6其中,.參考公式:對于一組數據,,…,,其回歸直線的斜率和截距的最小二乘估計公式分別為,.【解題思路】(1)由得,由回歸直線的斜率和截距的最小二乘估計公式求得,從而求得y關于x的回歸方程.(2)兩年的年平均增長率為0.3,故2024年的中國車載音樂市場規模為【解答過程】(1)因為,所以兩邊同時取常用對數,得,設,所以,設,因為,所以,所以所以所以(2)由題意知2023年與2024年這兩年的年平均增長率,2022年中國車載音樂市場規模為1.7,故預測2024年的中國車載音樂市場規模(十億元).【變式6-3】(2023·全國·高三專題練習)某企業為改進生產,現 某產品及成本相關數據進行統計.現收集了該產品的成本費y(單位:萬元/噸)及同批次產品生產數量x(單位:噸)的20組數據.現分別用兩種模型①,②進行擬合,據收集到的數據,計算得到如下值:14.5 0.08 665 0.04 -450 4表中,.若用刻畫回歸效果,得到模型①、②的值分別為,.(1)利用和比較模型①、②的擬合效果,應選擇哪個模型?并說明理由;(2)根據(1)中所選擇的模型,求y關于x的回歸方程;并求同批次產品生產數量為25(噸)時y的預報值.附:對于一組數據,,…,,其回歸直線的斜率和截距的最小二乘法估計分別為,.【解題思路】(1)根據已知,根據的意義,即可得出模型②的擬合效果好,選擇模型②;(2)與可用線性回歸來擬合,有,求出系數,得到回歸方程,即可得到成本費與同批次產品生產數量的回歸方程為,代入,即可求出結果.【解答過程】(1)應該選擇模型②.由題意可知,,則模型②中樣本數據的殘差平方和比模型①中樣本數據的殘差平方和小,即模型②擬合效果好.(2)由已知,成本費與可用線性回歸來擬合,有.由已知可得,,所以,則關于的線性回歸方程為.成本費與同批次產品生產數量的回歸方程為,當(噸)時,(萬元/噸).所以,同批次產品生產數量為25(噸)時y的預報值為6萬元/噸.專題8.3 一元線性回歸模型及其應用(重難點題型精講)1.一元線性回歸模型把式子為Y關于x的一元線性回歸模型.其中,Y稱為因變量或響應變量,x稱為自變量或解釋變量;a和b為模型的未知參數,a稱為截距參數,b稱為斜率參數;e是Y與bx+a之間的隨機誤差.2.線性經驗回歸方程與最小二乘法設滿足一元線性回歸模型的兩個變量的n對樣本數據為(,),(,),,(,),由=+a+(i=1,2,,n),得|-(+a)|= ||,顯然||越小,表示樣本數據點離直線y=bx+a的豎直距離越小.通常用各散點到直線的豎直距離的平方之和Q=來刻畫各樣本觀測數據與直線y=bx+a的“整體接近程度”.當a,b的取值為時,Q達到最小.將=x+稱為Y關于x的經驗回歸方程,也稱經驗回歸函數或經驗回歸公式,其圖形稱為經驗回歸直線.這種求經驗回歸方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估計.經驗回歸直線一定過點(,).3.殘差分析對于響應變量Y,通過觀測得到的數據稱為觀測值,通過經驗回歸方程得到的稱為預測值,觀測值減去預測值稱為殘差.殘差是隨機誤差的估計結果,通過對殘差的分析可以判斷模型刻畫數據的效果,以及判斷原始數據中是否存在可疑數據等,這方面工作稱為殘差分析.4.刻畫回歸效果的方式(1)殘差圖法作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或身高數據,或體重估計值等,這樣作出的圖形稱為殘差圖.在殘差圖中,殘差點比較均勻地落在以取值為0的橫軸為對稱軸的水平帶狀區域內,說明選用的模型比較合適,這樣的帶狀區域的寬度越窄,說明模型擬合精度越高.(2)殘差平方和法殘差平方和為,殘差平方和越小,模型擬合效果越好.(3)利用刻畫擬合效果=.越大,模型的擬合效果越好,越小,模型的擬合效果越差.(1)對于變量x和變量y,設經過隨機抽樣獲得的成對樣本數據為(,),(,),,(,),利用相關系數r來衡量兩個變量之間線性關系的強弱,相關系數r的計算公式:(其中,,,和,,,的均值分別為和).①當r>0時,稱成對樣本數據正相關.這時,當其中一個數據的值變小時,另一個數據的值通常也變小;當其中一個數據的值變大時,另一個數據的值通常也變大.②當r<0時,稱成對樣本數據負相關.這時,當其中一個數據的值變小時,另一個數據的值通常會變大;當其中一個數據的值變大時,另一個數據的值通常會變小.【題型1 一元線性回歸模型】【方法點撥】根據一元線性回歸模型的定義,結合具體題目條件,進行求解即可.【例1】(2022·高二單元測試)根據如下樣本數據,得到線性回歸方程為,若樣本點的中心為,則當X每增加1個單位時,Y平均( )X 3 4 5 6 7Y 4.0 -0.5 0.5A.增加1.4個單位 B.減少1.4個單位 C.增加7.9個單位 D.減少7.9個單位【變式1-1】(2022春·黑龍江大慶·高二期末)給出下列說法中錯誤的是( )A.回歸直線恒過樣本點的中心B.兩個變量相關性越強,則相關系數就越接近1C.某7個數的平均數為4,方差為2,現加入一個新數據4,此時這8個數的方差不變D.在回歸直線方程中,當變量x增加一個單位時,平均減少0.5個單位【變式1-2】(2022春·河南南陽·高二期中)已知變量x和y的回歸直線方程為,變量y與z負相關.下列結論中正確的是( )A.x與y正相關,x與z正相關 B.x與y正相關,x與z負相關C.x與y負相關,x與z負相關 D.x與y負相關,x與z正相關【變式1-3】(2022春·陜西渭南·高一期末)根據如下樣本數據:得到線性回歸方程為,則( )A. B. C. D.【題型2 殘差的計算】【方法點撥】根據題目條件,得出經驗回歸方程,再進行殘差的計算.【例2】(2022春·湖北·高二期末)某城市選用一種植物進行綠化,設其中一株幼苗從觀察之日起,第x天的高度為ycm,測得一些數據如下表所示:第x天 1 2 3 4 5 6 7高度y/cm 1 4 6 9 11 12 13由表格中數據可得y關于x的經驗回歸方程為,則第7天的殘差為( )A.1.12 B.2.12 C. D.【變式2-1】(2023春·河南開封·高三開學考試)某部門統計了某地區今年前7個月在線外賣的規模如下表:月份代號x 1 2 3 4 5 6 7在線外賣規模y(百萬元) 11 13 18 ★ 28 ★ 35其中4、6兩個月的在線外賣規模數據模糊,但這7個月的平均值為23.若利用回歸直線方程來擬合預測,且7月相應于點的殘差為,則( )A.1.0 B.2.0 C.3.0 D.4.0【變式2-2】(2022春·河南許昌·高二期末)為研究變量x,y的相關關系,收集得到下面五個樣本點(x,y):x 5.5 6.5 7 7.5 8.5y 9 8 6 4 3若由最小二乘法求得y關于x的回歸直線方程為,則據此計算殘差為1.1的樣本點是( )A.(5.5,9) B.(6.5,8) C.(7,6) D.(7.5,4)【變式2-3】(2022春·江蘇宿遷·高二階段練習)在對具有線性相關的兩個變量和進行統計分析時,得到如下數據:4 8 10 121 2 3 5 6由表中數據求得關于的回歸方程為,則,,這三個樣本數據中,殘差的絕對值最小的是( )A. B. C. D.和【題型3 刻畫回歸效果的方式】【方法點撥】根據刻畫回歸效果的三種方式,結合具體題目條件,選取適當的方式來刻畫模型的擬合效果,即可得解.【例3】(2022秋·寧夏銀川·高三開學考試)下列說法正確的個數是( )(1)在做回歸分析時,殘差圖中殘差點分布的帶狀區域的寬度越窄表示回歸效果越差(2)某地氣象局預報:6月9日本地降水概率為90%,結果這天沒下雨,這表明天氣預報并不科學(3)回歸分析模型中,殘差平方和越小,說明模型的擬合效果越好(4)在回歸直線方程,當解釋變量每增加1個單位時,預報變量多增加0.1個單位A.2 B.3 C.4 D.1【變式3-1】(2022春·山東菏澤·高二期末)關于線性回歸的描述,下列命題錯誤的是( )A.回歸直線一定經過樣本點的中心 B.殘差平方和越小,擬合效果越好C.決定系數越接近1,擬合效果越好 D.殘差平方和越小,決定系數越小【變式3-2】(2022秋·廣東廣州·高三階段練習)對兩個變量和進行回歸分析,得到一組樣本數據,,…,則下列說法不正確的是( )A.若變量和之間的相關系數為,則變量和之間具有較強的線性相關關系B.殘差平方和越小的模型,擬合的效果越好C.用決定系數來刻畫回歸效果,越小說明擬合效果越好D.在殘差圖中,殘差點分布水平帶狀區域的寬度越窄,則回歸方程的預報精確度越高【變式3-3】(2022春·甘肅天水·高二階段練習)關于線性回歸的描述,有下列命題:①回歸直線一定經過樣本中心點;②相關系數的絕對值越大,擬合效果越好;③相關指數越接近1擬合效果越好;④殘差平方和越小,擬合效果越好.其中正確的命題個數為( )A.1 B.2 C.3 D.4【題型4 代入法求線性經驗回歸方程】【方法點撥】經驗回歸直線一定經過樣本點的中心(,),求出樣本點的中心后代入線性回歸方程求解相應字母.【例4】(2023秋·四川廣安·高二階段練習)已知兩個變量和之間存在線性相關關系,某興趣小組收集了一組,的樣本數據如下表所示:1 2 3 4 50.5 0.6 1 1.4 1.5根據表中數據利用最小二乘法得到的回歸方程是( )A. B.C. D.【變式4-1】(2022秋·陜西榆林·高二期中)已知,的取值如下表所示:x 0 1 3 4y 2.2 4.3 4.8 6.7若與線性相關,且,則( )A.2.2 B.2.9 C.2.8 D.2.6【變式4-2】(2023秋·河南焦作·高二期末)某產品的廣告費用x與銷售額y的統計數據如表:廣告費用x(萬元) 3 4 5 6銷售額y(萬元) 25 30 40 45根據如表可得回歸方程中的為7.根據此模型預測廣告費用為10萬元時銷售額為( )萬元A.63.6 B.75.5 C.73.5 D.72.0【變式4-3】(2023秋·四川宜賓·高二期末)某小區流感大爆發,當地醫療機構使用中西醫結合的方法取得了不錯的成效,每周治愈的患者人數如表所示,由表格可得y關于x的線性經驗回歸方程為,則測此回歸模型第4周的治愈人數為( )周數(x) 1 2 3 4 5治愈人數(y) 5 15 35 ? 140A. B. C. D.【題型5 經驗回歸模型的應用】【方法點撥】(1)確定研究對象,明確哪個變量是解釋變量,哪個變量是響應變量;(2)畫出解釋變量和響應變量的散點圖,觀察它們之間的關系(如是否存在線性關系等);(3)確定經驗回歸方程的類型(如我們觀察到數據呈線性關系,則選用線性經驗回歸方程);(4)按一定規則(如最小二乘法)估計經驗回歸方程中的參數;(5)得出結果后分析殘差圖是否有異常(如個別數據對應殘差過大,殘差呈現不隨機的規律性等),若存在異常,則檢查數據是否有誤,或模型是否合適等.【例5】(2023秋·四川雅安·高二期末)某連鎖經營公司所屬5個零售店某月的銷售額和利潤額資料如表.商店名稱 A B C D E銷售額x(千萬元) 3 5 6 7 9利潤額y(千萬元) 2 3 3 4 5(1)若銷售額和利潤額具有相關關系,用最小二乘法計算利潤額y對銷售額x的回歸直線方程.(參考公式,)(2)若該公司計劃再開一個店想達到預期利潤為8百萬,請預估銷售額需要達到多少 【變式5-1】(2023·全國·模擬預測)目前手機已經成為人們生活中的必需品,國內市場已經進入成熟期,下表是2016—2021年某市手機總體出貨量(單位:萬部)統計表.年份 2016年 2017年 2018年 2019年 2020年 2021年年份代碼 1 2 3 4 5 6手機總體出貨量/萬部 5.6 4.9 4.1 3.9 3.2 3.5(1)已知該市手機總體出貨量y與年份代碼x之間可用線性回歸模型擬合,求y關于x的線性回歸方程(系數精確到0.01);(2)預測2022年該市手機總體出貨量.附:線性回歸方程中斜率與截距的最小二乘估計公式分別為,.【變式5-2】(2023秋·四川成都·高二期末)某工廠統計2022年銷售網點數量與售賣出的產品件數的數據如下表:銷售網點數x(單位:個) 17 19 20 21 23售賣出的產品件數y(單位:萬件) 21 22 25 27 30假定該工廠銷售網點的個數與售賣出的產品件數呈線性相關關系,(1)求2022年售賣出的產品件數y(單位:萬件)關于銷售網點數x(單位:個)的線性回歸方程;(2)根據(1)中求出的線性回歸方程,預測2022年該工廠建立40個銷售網點時售賣出的產品件數.參考公式:,.【變式5-3】(2023·山東·模擬預測)我國技術給直播行業帶來了很多發展空間,加上受疫情影響,直播這種成本較低的獲客渠道備受商家青睞,某商場統計了2022年1~5月某商品的線上月銷售量y(單位:千件)與售價x(單位:元/件)的情況如下表示.月份 1 2 3 4 5售價x(元/件) 60 56 58 57 54月銷售量y(千件) 5 9 7 10 9(1)求相關系數,并說明是否可以用線性回歸模型擬合與的關系(當時,可以認為兩個變量有很強的線性相關性;否則,沒有很強的線性相關性)(精確到0.01);(2)建立關于的線性回歸方程,并估計當售價為元/件時,該商品的線上月銷售量估計為多少千件?(3)若每件商品的購進價格為元/件,如果不考慮其他費用,由(2)中結論,當商品售價為多少時,可使得該商品的月利潤最大?(該結果保留整數)參考公式:對于一組數據,相關系數,其回歸直線的斜率和截距的最小二乘估計分別為:.參考數據:.【題型6 非線性經驗回歸方程的求法】【方法點撥】(1)作散點圖確定曲線模型:曲線所對應的函數種類繁多,這就要求我們充分想象,大膽猜測擬合函數類型,粗略估計使用哪個函數擬合.(2)非線性轉化為線性:先通過適當變換化非線性關系為線性關系,然后按照線性檢驗回歸方程的求解步驟進行求解.(3)分析模型的擬合效果,得出結論.【例6】(2023·陜西西安·統考一模)為了研究某種細菌隨天數x變化的繁殖個數y,收集數據如下:天數x 1 2 3 4 5 6繁殖個數y 3 6 13 25 45 100(1)判斷(為常數)與(為常數,且)哪一個適宜作為繁殖個數y關于天數x變化的回歸方程類型?(給出判斷即可,不必說明理由)(2)對于非線性回歸方程(為常數,且),令,可以得到繁殖個數的對數z關于天數x具有線性關系及一些統計量的值,3.50 32 2.85 17.5 307 12.12(ⅰ)證明:對于非線性回歸方程,令,可以得到繁殖個數的對數z關于天數x具有線性關系(即為常數);(ⅱ)根據(ⅰ)的判斷結果及表中數據,建立y關于x的回歸方程(系數保留2位小數).附:對于一組數據其回歸直線方程的斜率和截距的最小二乘估計分別為.【變式6-1】(2023·云南·高三階段練習)近年來,云南省保山市龍陵縣緊緊圍繞打造“中國石斛之鄉”的發展定位,大力發展石斛產業,該產業帶動龍陵縣近四分之一人口脫貧致富.2022年8月,龍陵紫皮石斛獲國家地理標志運用促進工程重點項目,并被評為優秀等次.在政府的大力扶持下,龍陵紫皮石斛產量逐年增長,2017年底到2022年底龍陵縣石斛產量統計如下及散點圖如圖.年份 2017 2018 2019 2020 2021 2022年份代碼x 1 2 3 4 5 6紫皮石斛產量y(噸) 3200 3400 3600 4200 7500 9000(1)根據散點圖判斷,與(a,b,c,d均為常數)哪一個更適合作為龍陵縣紫皮石斛產量y關于年份代碼x的回歸方程類型?(給出判斷即可,不必說明理由)(2)經計算得下表中數據,根據(1)中結果,求出y關于x的回歸方程;3.5 5150 8.46 17.5 20950 3.85其中.(3)龍陵縣計劃到2025年底實現紫皮石斛年產量達1.5萬噸,根據(2)所求得的回歸方程,預測該目標是否能完成?(參考數據:)附:,.【變式6-2】(2023·江西撫州·高三開學考試)數據顯示中國車載音樂已步入快速發展期,隨著車載音樂的商業化模式進一步完善,市場將持續擴大,下表為2018—2022年中國車載音樂市場規模(單位:十億元),其中年份2018—2022對應的代碼分別為1—5.年份代碼x 1 2 3 4 5車載音樂市場規模y 2.8 3.9 7.3 12.0 17.0(1)由上表數據知,可用指數函數模型擬合y與x的關系,請建立y關于x的回歸方程(a,b的值精確到0.1);(2)綜合考慮2023年及2024年的經濟環境及疫情等因素,某預測公司根據上述數據求得y關于x的回歸方程后,通過修正,把作為2023年與2024年這兩年的年平均增長率,請根據2022年中國車載音樂市場規模及修正后的年平均增長率預測2024年的中國車載音樂市場規模.參考數據:1.94 33.82 1.7 1.6其中,.參考公式:對于一組數據,,…,,其回歸直線的斜率和截距的最小二乘估計公式分別為,.【變式6-3】(2023·全國·高三專題練習)某企業為改進生產,現 某產品及成本相關數據進行統計.現收集了該產品的成本費y(單位:萬元/噸)及同批次產品生產數量x(單位:噸)的20組數據.現分別用兩種模型①,②進行擬合,據收集到的數據,計算得到如下值:14.5 0.08 665 0.04 -450 4表中,.若用刻畫回歸效果,得到模型①、②的值分別為,.(1)利用和比較模型①、②的擬合效果,應選擇哪個模型?并說明理由;(2)根據(1)中所選擇的模型,求y關于x的回歸方程;并求同批次產品生產數量為25(噸)時y的預報值.附:對于一組數據,,…,,其回歸直線的斜率和截距的最小二乘法估計分別為,. 展開更多...... 收起↑ 資源列表 高中數學培優講義練習(人教A版2019選擇性必修三)專題8.3 一元線性回歸模型及其應用(重難點題型精講) Word版含解析.docx 高中數學培優講義練習(人教A版2019選擇性必修三)專題8.3 一元線性回歸模型及其應用(重難點題型精講)(學生版).docx 縮略圖、資源來源于二一教育資源庫