中文字幕精品无码一区二区,成全视频在线播放观看方法,大伊人青草狠狠久久,亚洲一区影音先锋色资源

(人教A版2019選擇性必修三)專題8-3 一元線性回歸模型及其應用 學案(重難點題型精講)(原卷+解析卷)

資源下載
  1. 二一教育資源

(人教A版2019選擇性必修三)專題8-3 一元線性回歸模型及其應用 學案(重難點題型精講)(原卷+解析卷)

資源簡介

專題8.3 一元線性回歸模型及其應用(重難點題型精講)
1.一元線性回歸模型
把式子為Y關于x的一元線性回歸模型.其中,Y稱為因變量或響應變量,x稱
為自變量或解釋變量;a和b為模型的未知參數,a稱為截距參數,b稱為斜率參數;e是Y與bx+a之間的隨機誤差.
2.線性經驗回歸方程與最小二乘法
設滿足一元線性回歸模型的兩個變量的n對樣本數據為(,),(,),,(,),由=+a+
(i=1,2,,n),得|-(+a)|= ||,顯然||越小,表示樣本數據點離直線y=bx+a的豎直距離越小.
通常用各散點到直線的豎直距離的平方之和Q=來刻畫各樣本觀測數據與直線
y=bx+a的“整體接近程度”.
當a,b的取值為時,Q達到最小.將=x+稱為Y關于x的經驗回歸方
程,也稱經驗回歸函數或經驗回歸公式,其圖形稱為經驗回歸直線.這種求經驗回歸方程的方法叫做最小二
乘法,求得的,叫做b,a的最小二乘估計.
經驗回歸直線一定過點(,).
3.殘差分析
對于響應變量Y,通過觀測得到的數據稱為觀測值,通過經驗回歸方程得到的稱為預測值,觀測值減
去預測值稱為殘差.殘差是隨機誤差的估計結果,通過對殘差的分析可以判斷模型刻畫數據的效果,以及判斷原始數據中是否存在可疑數據等,這方面工作稱為殘差分析.
4.刻畫回歸效果的方式
(1)殘差圖法
作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或身高數據,或體重估計值等,這樣作出的圖形稱
為殘差圖.在殘差圖中,殘差點比較均勻地落在以取值為0的橫軸為對稱軸的水平帶狀區域內,說明選用的模型比較合適,這樣的帶狀區域的寬度越窄,說明模型擬合精度越高.
(2)殘差平方和法
殘差平方和為,殘差平方和越小,模型擬合效果越好.
(3)利用刻畫擬合效果
=.
越大,模型的擬合效果越好,越小,模型的擬合效果越差.
(1)對于變量x和變量y,設經過隨機抽樣獲得的成對樣本數據為(,),(,),,(,),利用
相關系數r來衡量兩個變量之間線性關系的強弱,相關系數r的計算公式:
(其中,,,和,,,的均值分別為和).
①當r>0時,稱成對樣本數據正相關.這時,當其中一個數據的值變小時,另一個數據的值通常也變小;
當其中一個數據的值變大時,另一個數據的值通常也變大.
②當r<0時,稱成對樣本數據負相關.這時,當其中一個數據的值變小時,另一個數據的值通常會變大;
當其中一個數據的值變大時,另一個數據的值通常會變小.
【題型1 一元線性回歸模型】
【方法點撥】
根據一元線性回歸模型的定義,結合具體題目條件,進行求解即可.
【例1】(2022·高二單元測試)根據如下樣本數據,得到線性回歸方程為,若樣本點的中心為,則當X每增加1個單位時,Y平均( )
X 3 4 5 6 7
Y 4.0 -0.5 0.5
A.增加1.4個單位 B.減少1.4個單位 C.增加7.9個單位 D.減少7.9個單位
【解題思路】根據已知條件解出m和n,得到線性回歸方程,即可得到答案.
【解答過程】樣本點的中心為,則,故,且,
解得,,則,可知當X每增加1個單位時,
Y平均減少1.4個單位.
故選:B.
【變式1-1】(2022春·黑龍江大慶·高二期末)給出下列說法中錯誤的是( )
A.回歸直線恒過樣本點的中心
B.兩個變量相關性越強,則相關系數就越接近1
C.某7個數的平均數為4,方差為2,現加入一個新數據4,此時這8個數的方差不變
D.在回歸直線方程中,當變量x增加一個單位時,平均減少0.5個單位
【解題思路】A中,根據回歸直線方程的特征,可判定是否正確;B中,根據相關系數的意義,可判定是否正確;C中,根據方差的計算公式,可判定是否正確;D中,根據回歸系數的含義,可判定是否正確.
【解答過程】對于A中,回歸直線恒過樣本點的中心,所以正確;
對于B中,根據相關系數的意義,可得兩個變量相關性越強,
則相關系數就越接近1,所以是正確的;
對于C中,根據平均數的計算公式可得,
根據方差的計算公式,所以是不正確的;
對于D中,根據回歸系數的含義,可得在回歸直線方程中,
當解釋變量增加一個單位時,
預報變量平均減少0.5個單位,所以是正確的.
故選:C.
【變式1-2】(2022春·河南南陽·高二期中)已知變量x和y的回歸直線方程為,變量y與z負相關.下列結論中正確的是( )
A.x與y正相關,x與z正相關 B.x與y正相關,x與z負相關
C.x與y負相關,x與z負相關 D.x與y負相關,x與z正相關
【解題思路】根據變量x和y的回歸直線方程判斷.
【解答過程】解:因為變量x和y的回歸直線方程為,且,
所以變量x與y正相關,
又變量y與z負相關,
所以x與z負相關,
故選:B.
【變式1-3】(2022春·陜西渭南·高一期末)根據如下樣本數據:
得到線性回歸方程為,則( )
A. B. C. D.
【解題思路】根據與負相關且樣本點集中在第一象限可判斷出結果.
【解答過程】由樣本數據知:與負相關,;
又樣本點位于第一象限,在軸截距為正,.
故選:B.
【題型2 殘差的計算】
【方法點撥】
根據題目條件,得出經驗回歸方程,再進行殘差的計算.
【例2】(2022春·湖北·高二期末)某城市選用一種植物進行綠化,設其中一株幼苗從觀察之日起,第x天的高度為ycm,測得一些數據如下表所示:
第x天 1 2 3 4 5 6 7
高度y/cm 1 4 6 9 11 12 13
由表格中數據可得y關于x的經驗回歸方程為,則第7天的殘差為( )
A.1.12 B.2.12 C. D.
【解題思路】依題意求出、,根據回歸直線方程必過樣本中心點求出,即可得到回歸直線方程,再根據殘差公式計算可得;
【解答過程】解:通過表格計算得,,,
因為經驗回歸直線過點,所以,
所以關于的經驗回歸方程為.
所以回歸模型第天的殘差.
故選:C.
【變式2-1】(2023春·河南開封·高三開學考試)某部門統計了某地區今年前7個月在線外賣的規模如下表:
月份代號x 1 2 3 4 5 6 7
在線外賣規模y(百萬元) 11 13 18 ★ 28 ★ 35
其中4、6兩個月的在線外賣規模數據模糊,但這7個月的平均值為23.若利用回歸直線方程來擬合預測,且7月相應于點的殘差為,則( )
A.1.0 B.2.0 C.3.0 D.4.0
【解題思路】根據給定條件,求出,再借助回歸直線的特征及殘差列出方程組即可求解作答.
【解答過程】依題意,,而,于是得,
而當時,,即,聯立解得,
所以.
故選:B.
【變式2-2】(2022春·河南許昌·高二期末)為研究變量x,y的相關關系,收集得到下面五個樣本點(x,y):
x 5.5 6.5 7 7.5 8.5
y 9 8 6 4 3
若由最小二乘法求得y關于x的回歸直線方程為,則據此計算殘差為1.1的樣本點是( )A.(5.5,9) B.(6.5,8) C.(7,6) D.(7.5,4)
【解題思路】先求出回歸方程的樣本中心點,從而可求得,再根據殘差的定義可判斷.
【解答過程】由題意可知,,,
所以回歸方程的樣本中心點為,
因此有,
所以,
當時,;
當時,;
當時,;
當時,;
故選:B.
【變式2-3】(2022春·江蘇宿遷·高二階段練習)在對具有線性相關的兩個變量和進行統計分析時,得到如下數據:
4 8 10 12
1 2 3 5 6
由表中數據求得關于的回歸方程為,則,,這三個樣本數據中,殘差的絕對值最小的是( )
A. B. C. D.和
【解題思路】根據樣本中心點一定在線性回歸方程上,求出,分別計算出三個樣本數據的殘差的絕對值,比較得到結果.
【解答過程】,,
因為樣本中心點一定在上,代入解得:

當時,,;
當時,,,
當時,,,
因為,
所以殘差的絕對值最小的是
故選:B.
【題型3 刻畫回歸效果的方式】
【方法點撥】
根據刻畫回歸效果的三種方式,結合具體題目條件,選取適當的方式來刻畫模型的擬合效果,即可得解.
【例3】(2022秋·寧夏銀川·高三開學考試)下列說法正確的個數是( )
(1)在做回歸分析時,殘差圖中殘差點分布的帶狀區域的寬度越窄表示回歸效果越差
(2)某地氣象局預報:6月9日本地降水概率為90%,結果這天沒下雨,這表明天氣預報并不科學
(3)回歸分析模型中,殘差平方和越小,說明模型的擬合效果越好
(4)在回歸直線方程,當解釋變量每增加1個單位時,預報變量多增加0.1個單位
A.2 B.3 C.4 D.1
【解題思路】根據殘差分析的性質判斷(1),(3)選項,由概率的意義判斷(2)選項,根據回歸直線方程的意義判斷(4).
【解答過程】解:對(1),在做回歸分析時,殘差圖中殘差點分布的帶狀區域的寬度越窄表示回歸效果越好,故錯誤;
對(2),概率只說明事件發生的可能性,某次事件不一定發生,所以并不能說明天氣預報不科學,故錯誤;
對(3),在回歸分析模型中,殘差平方和越小,說明模型的擬合效果越好,故正確;
對(4),在回歸直線方程,當解釋變量每增加1個單位時,預報變量增加0.1個單位,故正確.
故選:A.
【變式3-1】(2022春·山東菏澤·高二期末)關于線性回歸的描述,下列命題錯誤的是( )
A.回歸直線一定經過樣本點的中心 B.殘差平方和越小,擬合效果越好
C.決定系數越接近1,擬合效果越好 D.殘差平方和越小,決定系數越小
【解題思路】根據線性回歸的性質判斷即可
【解答過程】對A,回歸直線一定經過樣本點的中心正確;
對B,殘差平方和越小,擬合效果越好正確;
對C,決定系數越接近1,擬合效果越好正確;
對D,殘差平方和越小,擬合效果越好,決定系數越接近1,故D錯誤;
故選:D.
【變式3-2】(2022秋·廣東廣州·高三階段練習)對兩個變量和進行回歸分析,得到一組樣本數據,,…,則下列說法不正確的是( )
A.若變量和之間的相關系數為,則變量和之間具有較強的線性相關關系
B.殘差平方和越小的模型,擬合的效果越好
C.用決定系數來刻畫回歸效果,越小說明擬合效果越好
D.在殘差圖中,殘差點分布水平帶狀區域的寬度越窄,則回歸方程的預報精確度越高
【解題思路】變量和之間的相關系數為越大,則變量和之間具有較強的線性相關關系可判斷A;
殘差平方和越小的模型,擬合的效果越好可判斷B;用決定系數來刻畫回歸效果,越大說明擬合效果越好可判斷 C;在殘差圖中,殘差點分布水平帶狀區域的寬度越窄,則回歸方程的預報精確度越高可判斷D.
【解答過程】變量和之間的相關系數為越大,則變量和之間具有較強的線性相關關系,故A正確;
殘差平方和越小的模型,擬合的效果越好,故B正確;
用決定系數來刻畫回歸效果,越大說明擬合效果越好,故C錯誤;
在殘差圖中,殘差點分布水平帶狀區域的寬度越窄,則回歸方程的預報精確度越高,故D正確.
故選:C.
【變式3-3】(2022春·甘肅天水·高二階段練習)關于線性回歸的描述,有下列命題:
①回歸直線一定經過樣本中心點;
②相關系數的絕對值越大,擬合效果越好;
③相關指數越接近1擬合效果越好;
④殘差平方和越小,擬合效果越好.
其中正確的命題個數為( )
A.1 B.2 C.3 D.4
【解題思路】根據回歸直線方程的性質,相關系數、相關系數及殘差平方和的意義判斷各項的正誤即可.
【解答過程】對于①,回歸直線一定經過樣本中心點,故正確;
對于②,相關系數的絕對值越接近于1,相關性越強,故錯誤;
對于③,相關指數越接近1擬合效果越好,故正確;
對于④,殘差平方和越小,擬合效果越好,故正確.
故選:C.
【題型4 代入法求線性經驗回歸方程】
【方法點撥】
經驗回歸直線一定經過樣本點的中心(,),求出樣本點的中心后代入線性回歸方程求解相應字母.
【例4】(2023秋·四川廣安·高二階段練習)已知兩個變量和之間存在線性相關關系,某興趣小組收集了一組,的樣本數據如下表所示:
1 2 3 4 5
0.5 0.6 1 1.4 1.5
根據表中數據利用最小二乘法得到的回歸方程是( )
A. B.
C. D.
【解題思路】求出,,由回歸直線必過樣本中心,將點(,)依次代入各項檢驗是否成立可得結果.
【解答過程】∵,
∴回歸直線必過樣本中心(3,1),
而A、B、D項中的回歸直線方程不過點(3,1),C項的回歸直線方程過點(3,1),
故選:C.
【變式4-1】(2022秋·陜西榆林·高二期中)已知,的取值如下表所示:
x 0 1 3 4
y 2.2 4.3 4.8 6.7
若與線性相關,且,則( )
A.2.2 B.2.9 C.2.8 D.2.6
【解題思路】利用平均數可得樣本的中心點為,將中心點對應的值代入題目中的等式即可求出的值.
【解答過程】由表格,得,

線性回歸直線過樣本中心點,
所以,所以.
故選:D.
【變式4-2】(2023秋·河南焦作·高二期末)某產品的廣告費用x與銷售額y的統計數據如表:
廣告費用x(萬元) 3 4 5 6
銷售額y(萬元) 25 30 40 45
根據如表可得回歸方程中的為7.根據此模型預測廣告費用為10萬元時銷售額為( )萬元A.63.6 B.75.5 C.73.5 D.72.0
【解題思路】線性回歸方程.根據回歸方程必過樣本中心點,求出回歸系數,再將代入,即可得到預報銷售額.
【解答過程】解:由題意,,,
由回歸方程中的為7可得,,解得,
所以,回歸方程為,
所以時,元.
故選:C.
【變式4-3】(2023秋·四川宜賓·高二期末)某小區流感大爆發,當地醫療機構使用中西醫結合的方法取得了不錯的成效,每周治愈的患者人數如表所示,由表格可得y關于x的線性經驗回歸方程為,則測此回歸模型第4周的治愈人數為( )
周數(x) 1 2 3 4 5
治愈人數(y) 5 15 35 ? 140
A. B. C. D.
【解題思路】設第4周的治愈人數為,表示出樣本中心點,代入到回歸方程中,進而可求出答案.
【解答過程】根據題意,設第4周的治愈人數為,
則有,,
所以樣本中心點為,代入到回歸方程中,
得,
故選:B.
【題型5 經驗回歸模型的應用】
【方法點撥】
(1)確定研究對象,明確哪個變量是解釋變量,哪個變量是響應變量;
(2)畫出解釋變量和響應變量的散點圖,觀察它們之間的關系(如是否存在線性關系等);
(3)確定經驗回歸方程的類型(如我們觀察到數據呈線性關系,則選用線性經驗回歸方程);
(4)按一定規則(如最小二乘法)估計經驗回歸方程中的參數;
(5)得出結果后分析殘差圖是否有異常(如個別數據對應殘差過大,殘差呈現不隨機的規律性等),若存在異
常,則檢查數據是否有誤,或模型是否合適等.
【例5】(2023秋·四川雅安·高二期末)某連鎖經營公司所屬5個零售店某月的銷售額和利潤額資料如表.
商店名稱 A B C D E
銷售額x(千萬元) 3 5 6 7 9
利潤額y(千萬元) 2 3 3 4 5
(1)若銷售額和利潤額具有相關關系,用最小二乘法計算利潤額y對銷售額x的回歸直線方程.
(參考公式,)
(2)若該公司計劃再開一個店想達到預期利潤為8百萬,請預估銷售額需要達到多少
【解題思路】(1)根據已知條件,結合最小二乘法和回歸直線方程的公式,即可求解.
(2)將代入回歸直線方程中,即可求解.
【解答過程】(1)由表中的數據可得,,,
,,
故利潤額y對銷售額x的回歸直線方程為.
(2)∵該公司計劃再開一個店想達到預期利潤為8百萬,即0.8千萬,
∴,解得,故預計銷售額需要達到8百萬.
【變式5-1】(2023·全國·模擬預測)目前手機已經成為人們生活中的必需品,國內市場已經進入成熟期,下表是2016—2021年某市手機總體出貨量(單位:萬部)統計表.
年份 2016年 2017年 2018年 2019年 2020年 2021年
年份代碼 1 2 3 4 5 6
手機總體出貨量/萬部 5.6 4.9 4.1 3.9 3.2 3.5
(1)已知該市手機總體出貨量y與年份代碼x之間可用線性回歸模型擬合,求y關于x的線性回歸方程(系數精確到0.01);
(2)預測2022年該市手機總體出貨量.
附:線性回歸方程中斜率與截距的最小二乘估計公式分別為,.
【解題思路】(1)根據題中所給數據,利用最小二乘法求出,即可得解;
(2)將代入(1)中回歸方程,即可得解.
【解答過程】(1)由題中統計表得,

所以 ,

則,

所以y關于x的線性回歸方程為;
(2)由題意得2022年對應的年份代碼,
代入,得,
所以預測2022年該市手機總體出貨量為2.63萬部.
【變式5-2】(2023秋·四川成都·高二期末)某工廠統計2022年銷售網點數量與售賣出的產品件數的數據如下表:
銷售網點數x(單位:個) 17 19 20 21 23
售賣出的產品件數y(單位:萬件) 21 22 25 27 30
假定該工廠銷售網點的個數與售賣出的產品件數呈線性相關關系,
(1)求2022年售賣出的產品件數y(單位:萬件)關于銷售網點數x(單位:個)的線性回歸方程;
(2)根據(1)中求出的線性回歸方程,預測2022年該工廠建立40個銷售網點時售賣出的產品件數.
參考公式:,.
【解題思路】(1)由參考公式可算出銷售網點數x(單位:個)的線性回歸方程;
(2)將代入由(1)算得的回歸方程可得答案.
【解答過程】(1)由題,可得,


.
則,.
故回歸方程為:.
(2)將代入回歸方程,則.
故2022年該工廠建立40個銷售網點時售賣出的產品件數約萬件.
【變式5-3】(2023·山東·模擬預測)我國技術給直播行業帶來了很多發展空間,加上受疫情影響,直播這種成本較低的獲客渠道備受商家青睞,某商場統計了2022年1~5月某商品的線上月銷售量y(單位:千件)與售價x(單位:元/件)的情況如下表示.
月份 1 2 3 4 5
售價x(元/件) 60 56 58 57 54
月銷售量y(千件) 5 9 7 10 9
(1)求相關系數,并說明是否可以用線性回歸模型擬合與的關系(當時,可以認為兩個變量有很強的線性相關性;否則,沒有很強的線性相關性)(精確到0.01);
(2)建立關于的線性回歸方程,并估計當售價為元/件時,該商品的線上月銷售量估計為多少千件?
(3)若每件商品的購進價格為元/件,如果不考慮其他費用,由(2)中結論,當商品售價為多少時,可使得該商品的月利潤最大?(該結果保留整數)
參考公式:對于一組數據,相關系數,其回歸直線的斜率和截距的最小二乘估計分別為:.參考數據:.
【解題思路】(1)根據數據計算,從而分別代入計算出,,,由公式計算相關系數并判斷相關性;
(2)代入公式求解,,從而寫出回歸方程,再代入,計算;
(3)設每月的利潤為元,寫出關于的函數解析式,根據二次函數的性質,求解對稱軸即可.
【解答過程】(1)由已知數據可得,



所以相關系數,
因為,所以與有很強的線性相關性,可以用線性回歸模型擬合.
(2)由于,

所以關于的線性回歸方程為,
當時,,
故當售價為元/件時,該商品的線上月銷售量估計為千件.
(3)設每月的利潤為元,則,
當時,Z取得最大值.
即當商品售價為元/件時,可使得該商品的月利潤最大.
【題型6 非線性經驗回歸方程的求法】
【方法點撥】
(1)作散點圖確定曲線模型:曲線所對應的函數種類繁多,這就要求我們充分想象,大膽猜測擬合函數類型,
粗略估計使用哪個函數擬合.
(2)非線性轉化為線性:先通過適當變換化非線性關系為線性關系,然后按照線性檢驗回歸方程的求解步驟
進行求解.
(3)分析模型的擬合效果,得出結論.
【例6】(2023·陜西西安·統考一模)為了研究某種細菌隨天數x變化的繁殖個數y,收集數據如下:
天數x 1 2 3 4 5 6
繁殖個數y 3 6 13 25 45 100
(1)判斷(為常數)與(為常數,且)哪一個適宜作為繁殖個數y關于天數x變化的回歸方程類型?(給出判斷即可,不必說明理由)
(2)對于非線性回歸方程(為常數,且),令,可以得到繁殖個數的對數z關于天數x具有線性關系及一些統計量的值,
3.50 32 2.85 17.5 307 12.12
(ⅰ)證明:對于非線性回歸方程,令,可以得到繁殖個數的對數z關于天數x具有線性關系(即為常數);
(ⅱ)根據(ⅰ)的判斷結果及表中數據,建立y關于x的回歸方程(系數保留2位小數).
附:對于一組數據其回歸直線方程的斜率和截距的最小二乘估計分別為.
【解題思路】(1)根據給定數據作出散點圖,再借助散點圖即可判斷作答.
(2)(ⅰ)由(1)選定的回歸方程類型,取對數即可得關于x的直線方程作答;(ⅱ)由(ⅰ)的結果,利用最小二乘法求解作答.
【解答過程】(1)作出繁殖個數y關于天數x變化的散點圖,如圖,
觀察散點圖知,樣本點分布在一條指數型曲線周圍,
所以更適宜作為繁殖個數y關于天數x變化的回歸方程類型.
(2)(ⅰ)由(1)知,(為常數,且),又,
因此,令,即有為常數,
所以繁殖個數的對數z關于天數x具有線性關系.
(ⅱ),,由(ⅰ)知,

,因此,
所以y關于x的回歸方程為.
【變式6-1】(2023·云南·高三階段練習)近年來,云南省保山市龍陵縣緊緊圍繞打造“中國石斛之鄉”的發展定位,大力發展石斛產業,該產業帶動龍陵縣近四分之一人口脫貧致富.2022年8月,龍陵紫皮石斛獲國家地理標志運用促進工程重點項目,并被評為優秀等次.在政府的大力扶持下,龍陵紫皮石斛產量逐年增長,2017年底到2022年底龍陵縣石斛產量統計如下及散點圖如圖.
年份 2017 2018 2019 2020 2021 2022
年份代碼x 1 2 3 4 5 6
紫皮石斛產量y(噸) 3200 3400 3600 4200 7500 9000
(1)根據散點圖判斷,與(a,b,c,d均為常數)哪一個更適合作為龍陵縣紫皮石斛產量y關于年份代碼x的回歸方程類型?(給出判斷即可,不必說明理由)
(2)經計算得下表中數據,根據(1)中結果,求出y關于x的回歸方程;
3.5 5150 8.46 17.5 20950 3.85
其中.
(3)龍陵縣計劃到2025年底實現紫皮石斛年產量達1.5萬噸,根據(2)所求得的回歸方程,預測該目標是否能完成?(參考數據:)
附:,.
【解題思路】(1)根據判斷即可;
(2)根據表中數據和參考數據,利用公式求解即可;
(3)根據(2)中所得的回歸方程即可預測到2025年底該目標值,從而即可判斷.
【解答過程】(1)由散點圖可知,更適合作為龍陵縣紫皮石斛產量y關于年份代碼x的回歸方程類型.
(2)對兩邊取自然對數,得.
令,所以.
因為,
所以.
所以,
所以.
所以龍陵縣紫皮石斛產量y關于年份代碼x的回歸方程為.
(3)當時,,
故預測該目標可以完成.
【變式6-2】(2023·江西撫州·高三開學考試)數據顯示中國車載音樂已步入快速發展期,隨著車載音樂的商業化模式進一步完善,市場將持續擴大,下表為2018—2022年中國車載音樂市場規模(單位:十億元),其中年份2018—2022對應的代碼分別為1—5.
年份代碼x 1 2 3 4 5
車載音樂市場規模y 2.8 3.9 7.3 12.0 17.0
(1)由上表數據知,可用指數函數模型擬合y與x的關系,請建立y關于x的回歸方程(a,b的值精確到0.1);
(2)綜合考慮2023年及2024年的經濟環境及疫情等因素,某預測公司根據上述數據求得y關于x的回歸方程后,通過修正,把作為2023年與2024年這兩年的年平均增長率,請根據2022年中國車載音樂市場規模及修正后的年平均增長率預測2024年的中國車載音樂市場規模.
參考數據:
1.94 33.82 1.7 1.6
其中,.
參考公式:對于一組數據,,…,,其回歸直線的斜率和截距的最小二乘估計公式分別為,.
【解題思路】(1)由得,由回歸直線的斜率和截距的最小二乘估計公式求得,從而求得y關于x的回歸方程.
(2)兩年的年平均增長率為0.3,故2024年的中國車載音樂市場規模為
【解答過程】(1)因為,所以兩邊同時取常用對數,得,設,所以,設,
因為,所以

所以
所以
所以
(2)由題意知2023年與2024年這兩年的年平均增長率,
2022年中國車載音樂市場規模為1.7,
故預測2024年的中國車載音樂市場規模(十億元).
【變式6-3】(2023·全國·高三專題練習)某企業為改進生產,現 某產品及成本相關數據進行統計.現收集了該產品的成本費y(單位:萬元/噸)及同批次產品生產數量x(單位:噸)的20組數據.現分別用兩種模型①,②進行擬合,據收集到的數據,計算得到如下值:
14.5 0.08 665 0.04 -450 4
表中,.
若用刻畫回歸效果,得到模型①、②的值分別為,.
(1)利用和比較模型①、②的擬合效果,應選擇哪個模型?并說明理由;
(2)根據(1)中所選擇的模型,求y關于x的回歸方程;并求同批次產品生產數量為25(噸)時y的預報值.
附:對于一組數據,,…,,其回歸直線的斜率和截距的最小二乘法估計分別為,.
【解題思路】(1)根據已知,根據的意義,即可得出模型②的擬合效果好,選擇模型②;
(2)與可用線性回歸來擬合,有,求出系數,得到回歸方程,即可得到成本費與同批次產品生產數量的回歸方程為,代入,即可求出結果.
【解答過程】(1)應該選擇模型②.
由題意可知,,則模型②中樣本數據的殘差平方和比模型①中樣本數據的殘差平方和小,即模型②擬合效果好.
(2)由已知,成本費與可用線性回歸來擬合,有.
由已知可得,,
所以,
則關于的線性回歸方程為.
成本費與同批次產品生產數量的回歸方程為,
當(噸)時,(萬元/噸).
所以,同批次產品生產數量為25(噸)時y的預報值為6萬元/噸.專題8.3 一元線性回歸模型及其應用(重難點題型精講)
1.一元線性回歸模型
把式子為Y關于x的一元線性回歸模型.其中,Y稱為因變量或響應變量,x稱
為自變量或解釋變量;a和b為模型的未知參數,a稱為截距參數,b稱為斜率參數;e是Y與bx+a之間的隨機誤差.
2.線性經驗回歸方程與最小二乘法
設滿足一元線性回歸模型的兩個變量的n對樣本數據為(,),(,),,(,),由=+a+
(i=1,2,,n),得|-(+a)|= ||,顯然||越小,表示樣本數據點離直線y=bx+a的豎直距離越小.
通常用各散點到直線的豎直距離的平方之和Q=來刻畫各樣本觀測數據與直線
y=bx+a的“整體接近程度”.
當a,b的取值為時,Q達到最小.將=x+稱為Y關于x的經驗回歸方
程,也稱經驗回歸函數或經驗回歸公式,其圖形稱為經驗回歸直線.這種求經驗回歸方程的方法叫做最小二
乘法,求得的,叫做b,a的最小二乘估計.
經驗回歸直線一定過點(,).
3.殘差分析
對于響應變量Y,通過觀測得到的數據稱為觀測值,通過經驗回歸方程得到的稱為預測值,觀測值減
去預測值稱為殘差.殘差是隨機誤差的估計結果,通過對殘差的分析可以判斷模型刻畫數據的效果,以及判斷原始數據中是否存在可疑數據等,這方面工作稱為殘差分析.
4.刻畫回歸效果的方式
(1)殘差圖法
作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或身高數據,或體重估計值等,這樣作出的圖形稱
為殘差圖.在殘差圖中,殘差點比較均勻地落在以取值為0的橫軸為對稱軸的水平帶狀區域內,說明選用的模型比較合適,這樣的帶狀區域的寬度越窄,說明模型擬合精度越高.
(2)殘差平方和法
殘差平方和為,殘差平方和越小,模型擬合效果越好.
(3)利用刻畫擬合效果
=.
越大,模型的擬合效果越好,越小,模型的擬合效果越差.
(1)對于變量x和變量y,設經過隨機抽樣獲得的成對樣本數據為(,),(,),,(,),利用
相關系數r來衡量兩個變量之間線性關系的強弱,相關系數r的計算公式:
(其中,,,和,,,的均值分別為和).
①當r>0時,稱成對樣本數據正相關.這時,當其中一個數據的值變小時,另一個數據的值通常也變小;
當其中一個數據的值變大時,另一個數據的值通常也變大.
②當r<0時,稱成對樣本數據負相關.這時,當其中一個數據的值變小時,另一個數據的值通常會變大;
當其中一個數據的值變大時,另一個數據的值通常會變小.
【題型1 一元線性回歸模型】
【方法點撥】
根據一元線性回歸模型的定義,結合具體題目條件,進行求解即可.
【例1】(2022·高二單元測試)根據如下樣本數據,得到線性回歸方程為,若樣本點的中心為,則當X每增加1個單位時,Y平均( )
X 3 4 5 6 7
Y 4.0 -0.5 0.5
A.增加1.4個單位 B.減少1.4個單位 C.增加7.9個單位 D.減少7.9個單位
【變式1-1】(2022春·黑龍江大慶·高二期末)給出下列說法中錯誤的是( )
A.回歸直線恒過樣本點的中心
B.兩個變量相關性越強,則相關系數就越接近1
C.某7個數的平均數為4,方差為2,現加入一個新數據4,此時這8個數的方差不變
D.在回歸直線方程中,當變量x增加一個單位時,平均減少0.5個單位
【變式1-2】(2022春·河南南陽·高二期中)已知變量x和y的回歸直線方程為,變量y與z負相關.下列結論中正確的是( )
A.x與y正相關,x與z正相關 B.x與y正相關,x與z負相關
C.x與y負相關,x與z負相關 D.x與y負相關,x與z正相關
【變式1-3】(2022春·陜西渭南·高一期末)根據如下樣本數據:
得到線性回歸方程為,則( )
A. B. C. D.
【題型2 殘差的計算】
【方法點撥】
根據題目條件,得出經驗回歸方程,再進行殘差的計算.
【例2】(2022春·湖北·高二期末)某城市選用一種植物進行綠化,設其中一株幼苗從觀察之日起,第x天的高度為ycm,測得一些數據如下表所示:
第x天 1 2 3 4 5 6 7
高度y/cm 1 4 6 9 11 12 13
由表格中數據可得y關于x的經驗回歸方程為,則第7天的殘差為( )
A.1.12 B.2.12 C. D.
【變式2-1】(2023春·河南開封·高三開學考試)某部門統計了某地區今年前7個月在線外賣的規模如下表:
月份代號x 1 2 3 4 5 6 7
在線外賣規模y(百萬元) 11 13 18 ★ 28 ★ 35
其中4、6兩個月的在線外賣規模數據模糊,但這7個月的平均值為23.若利用回歸直線方程來擬合預測,且7月相應于點的殘差為,則( )
A.1.0 B.2.0 C.3.0 D.4.0
【變式2-2】(2022春·河南許昌·高二期末)為研究變量x,y的相關關系,收集得到下面五個樣本點(x,y):
x 5.5 6.5 7 7.5 8.5
y 9 8 6 4 3
若由最小二乘法求得y關于x的回歸直線方程為,則據此計算殘差為1.1的樣本點是( )A.(5.5,9) B.(6.5,8) C.(7,6) D.(7.5,4)
【變式2-3】(2022春·江蘇宿遷·高二階段練習)在對具有線性相關的兩個變量和進行統計分析時,得到如下數據:
4 8 10 12
1 2 3 5 6
由表中數據求得關于的回歸方程為,則,,這三個樣本數據中,殘差的絕對值最小的是( )
A. B. C. D.和
【題型3 刻畫回歸效果的方式】
【方法點撥】
根據刻畫回歸效果的三種方式,結合具體題目條件,選取適當的方式來刻畫模型的擬合效果,即可得解.
【例3】(2022秋·寧夏銀川·高三開學考試)下列說法正確的個數是( )
(1)在做回歸分析時,殘差圖中殘差點分布的帶狀區域的寬度越窄表示回歸效果越差
(2)某地氣象局預報:6月9日本地降水概率為90%,結果這天沒下雨,這表明天氣預報并不科學
(3)回歸分析模型中,殘差平方和越小,說明模型的擬合效果越好
(4)在回歸直線方程,當解釋變量每增加1個單位時,預報變量多增加0.1個單位
A.2 B.3 C.4 D.1
【變式3-1】(2022春·山東菏澤·高二期末)關于線性回歸的描述,下列命題錯誤的是( )
A.回歸直線一定經過樣本點的中心 B.殘差平方和越小,擬合效果越好
C.決定系數越接近1,擬合效果越好 D.殘差平方和越小,決定系數越小
【變式3-2】(2022秋·廣東廣州·高三階段練習)對兩個變量和進行回歸分析,得到一組樣本數據,,…,則下列說法不正確的是( )
A.若變量和之間的相關系數為,則變量和之間具有較強的線性相關關系
B.殘差平方和越小的模型,擬合的效果越好
C.用決定系數來刻畫回歸效果,越小說明擬合效果越好
D.在殘差圖中,殘差點分布水平帶狀區域的寬度越窄,則回歸方程的預報精確度越高
【變式3-3】(2022春·甘肅天水·高二階段練習)關于線性回歸的描述,有下列命題:
①回歸直線一定經過樣本中心點;
②相關系數的絕對值越大,擬合效果越好;
③相關指數越接近1擬合效果越好;
④殘差平方和越小,擬合效果越好.
其中正確的命題個數為( )
A.1 B.2 C.3 D.4
【題型4 代入法求線性經驗回歸方程】
【方法點撥】
經驗回歸直線一定經過樣本點的中心(,),求出樣本點的中心后代入線性回歸方程求解相應字母.
【例4】(2023秋·四川廣安·高二階段練習)已知兩個變量和之間存在線性相關關系,某興趣小組收集了一組,的樣本數據如下表所示:
1 2 3 4 5
0.5 0.6 1 1.4 1.5
根據表中數據利用最小二乘法得到的回歸方程是( )
A. B.
C. D.
【變式4-1】(2022秋·陜西榆林·高二期中)已知,的取值如下表所示:
x 0 1 3 4
y 2.2 4.3 4.8 6.7
若與線性相關,且,則( )
A.2.2 B.2.9 C.2.8 D.2.6
【變式4-2】(2023秋·河南焦作·高二期末)某產品的廣告費用x與銷售額y的統計數據如表:
廣告費用x(萬元) 3 4 5 6
銷售額y(萬元) 25 30 40 45
根據如表可得回歸方程中的為7.根據此模型預測廣告費用為10萬元時銷售額為( )萬元A.63.6 B.75.5 C.73.5 D.72.0
【變式4-3】(2023秋·四川宜賓·高二期末)某小區流感大爆發,當地醫療機構使用中西醫結合的方法取得了不錯的成效,每周治愈的患者人數如表所示,由表格可得y關于x的線性經驗回歸方程為,則測此回歸模型第4周的治愈人數為( )
周數(x) 1 2 3 4 5
治愈人數(y) 5 15 35 ? 140
A. B. C. D.
【題型5 經驗回歸模型的應用】
【方法點撥】
(1)確定研究對象,明確哪個變量是解釋變量,哪個變量是響應變量;
(2)畫出解釋變量和響應變量的散點圖,觀察它們之間的關系(如是否存在線性關系等);
(3)確定經驗回歸方程的類型(如我們觀察到數據呈線性關系,則選用線性經驗回歸方程);
(4)按一定規則(如最小二乘法)估計經驗回歸方程中的參數;
(5)得出結果后分析殘差圖是否有異常(如個別數據對應殘差過大,殘差呈現不隨機的規律性等),若存在異
常,則檢查數據是否有誤,或模型是否合適等.
【例5】(2023秋·四川雅安·高二期末)某連鎖經營公司所屬5個零售店某月的銷售額和利潤額資料如表.
商店名稱 A B C D E
銷售額x(千萬元) 3 5 6 7 9
利潤額y(千萬元) 2 3 3 4 5
(1)若銷售額和利潤額具有相關關系,用最小二乘法計算利潤額y對銷售額x的回歸直線方程.
(參考公式,)
(2)若該公司計劃再開一個店想達到預期利潤為8百萬,請預估銷售額需要達到多少
【變式5-1】(2023·全國·模擬預測)目前手機已經成為人們生活中的必需品,國內市場已經進入成熟期,下表是2016—2021年某市手機總體出貨量(單位:萬部)統計表.
年份 2016年 2017年 2018年 2019年 2020年 2021年
年份代碼 1 2 3 4 5 6
手機總體出貨量/萬部 5.6 4.9 4.1 3.9 3.2 3.5
(1)已知該市手機總體出貨量y與年份代碼x之間可用線性回歸模型擬合,求y關于x的線性回歸方程(系數精確到0.01);
(2)預測2022年該市手機總體出貨量.
附:線性回歸方程中斜率與截距的最小二乘估計公式分別為,.
【變式5-2】(2023秋·四川成都·高二期末)某工廠統計2022年銷售網點數量與售賣出的產品件數的數據如下表:
銷售網點數x(單位:個) 17 19 20 21 23
售賣出的產品件數y(單位:萬件) 21 22 25 27 30
假定該工廠銷售網點的個數與售賣出的產品件數呈線性相關關系,
(1)求2022年售賣出的產品件數y(單位:萬件)關于銷售網點數x(單位:個)的線性回歸方程;
(2)根據(1)中求出的線性回歸方程,預測2022年該工廠建立40個銷售網點時售賣出的產品件數.
參考公式:,.
【變式5-3】(2023·山東·模擬預測)我國技術給直播行業帶來了很多發展空間,加上受疫情影響,直播這種成本較低的獲客渠道備受商家青睞,某商場統計了2022年1~5月某商品的線上月銷售量y(單位:千件)與售價x(單位:元/件)的情況如下表示.
月份 1 2 3 4 5
售價x(元/件) 60 56 58 57 54
月銷售量y(千件) 5 9 7 10 9
(1)求相關系數,并說明是否可以用線性回歸模型擬合與的關系(當時,可以認為兩個變量有很強的線性相關性;否則,沒有很強的線性相關性)(精確到0.01);
(2)建立關于的線性回歸方程,并估計當售價為元/件時,該商品的線上月銷售量估計為多少千件?
(3)若每件商品的購進價格為元/件,如果不考慮其他費用,由(2)中結論,當商品售價為多少時,可使得該商品的月利潤最大?(該結果保留整數)
參考公式:對于一組數據,相關系數,其回歸直線的斜率和截距的最小二乘估計分別為:.參考數據:.
【題型6 非線性經驗回歸方程的求法】
【方法點撥】
(1)作散點圖確定曲線模型:曲線所對應的函數種類繁多,這就要求我們充分想象,大膽猜測擬合函數類型,
粗略估計使用哪個函數擬合.
(2)非線性轉化為線性:先通過適當變換化非線性關系為線性關系,然后按照線性檢驗回歸方程的求解步驟
進行求解.
(3)分析模型的擬合效果,得出結論.
【例6】(2023·陜西西安·統考一模)為了研究某種細菌隨天數x變化的繁殖個數y,收集數據如下:
天數x 1 2 3 4 5 6
繁殖個數y 3 6 13 25 45 100
(1)判斷(為常數)與(為常數,且)哪一個適宜作為繁殖個數y關于天數x變化的回歸方程類型?(給出判斷即可,不必說明理由)
(2)對于非線性回歸方程(為常數,且),令,可以得到繁殖個數的對數z關于天數x具有線性關系及一些統計量的值,
3.50 32 2.85 17.5 307 12.12
(ⅰ)證明:對于非線性回歸方程,令,可以得到繁殖個數的對數z關于天數x具有線性關系(即為常數);
(ⅱ)根據(ⅰ)的判斷結果及表中數據,建立y關于x的回歸方程(系數保留2位小數).
附:對于一組數據其回歸直線方程的斜率和截距的最小二乘估計分別為.
【變式6-1】(2023·云南·高三階段練習)近年來,云南省保山市龍陵縣緊緊圍繞打造“中國石斛之鄉”的發展定位,大力發展石斛產業,該產業帶動龍陵縣近四分之一人口脫貧致富.2022年8月,龍陵紫皮石斛獲國家地理標志運用促進工程重點項目,并被評為優秀等次.在政府的大力扶持下,龍陵紫皮石斛產量逐年增長,2017年底到2022年底龍陵縣石斛產量統計如下及散點圖如圖.
年份 2017 2018 2019 2020 2021 2022
年份代碼x 1 2 3 4 5 6
紫皮石斛產量y(噸) 3200 3400 3600 4200 7500 9000
(1)根據散點圖判斷,與(a,b,c,d均為常數)哪一個更適合作為龍陵縣紫皮石斛產量y關于年份代碼x的回歸方程類型?(給出判斷即可,不必說明理由)
(2)經計算得下表中數據,根據(1)中結果,求出y關于x的回歸方程;
3.5 5150 8.46 17.5 20950 3.85
其中.
(3)龍陵縣計劃到2025年底實現紫皮石斛年產量達1.5萬噸,根據(2)所求得的回歸方程,預測該目標是否能完成?(參考數據:)
附:,.
【變式6-2】(2023·江西撫州·高三開學考試)數據顯示中國車載音樂已步入快速發展期,隨著車載音樂的商業化模式進一步完善,市場將持續擴大,下表為2018—2022年中國車載音樂市場規模(單位:十億元),其中年份2018—2022對應的代碼分別為1—5.
年份代碼x 1 2 3 4 5
車載音樂市場規模y 2.8 3.9 7.3 12.0 17.0
(1)由上表數據知,可用指數函數模型擬合y與x的關系,請建立y關于x的回歸方程(a,b的值精確到0.1);
(2)綜合考慮2023年及2024年的經濟環境及疫情等因素,某預測公司根據上述數據求得y關于x的回歸方程后,通過修正,把作為2023年與2024年這兩年的年平均增長率,請根據2022年中國車載音樂市場規模及修正后的年平均增長率預測2024年的中國車載音樂市場規模.
參考數據:
1.94 33.82 1.7 1.6
其中,.
參考公式:對于一組數據,,…,,其回歸直線的斜率和截距的最小二乘估計公式分別為,.
【變式6-3】(2023·全國·高三專題練習)某企業為改進生產,現 某產品及成本相關數據進行統計.現收集了該產品的成本費y(單位:萬元/噸)及同批次產品生產數量x(單位:噸)的20組數據.現分別用兩種模型①,②進行擬合,據收集到的數據,計算得到如下值:
14.5 0.08 665 0.04 -450 4
表中,.
若用刻畫回歸效果,得到模型①、②的值分別為,.
(1)利用和比較模型①、②的擬合效果,應選擇哪個模型?并說明理由;
(2)根據(1)中所選擇的模型,求y關于x的回歸方程;并求同批次產品生產數量為25(噸)時y的預報值.
附:對于一組數據,,…,,其回歸直線的斜率和截距的最小二乘法估計分別為,.

展開更多......

收起↑

資源列表

    <track id="r4fhd"></track>

    <pre id="r4fhd"><abbr id="r4fhd"><code id="r4fhd"></code></abbr></pre>
      <ul id="r4fhd"></ul>

        <menu id="r4fhd"></menu>
        1. 主站蜘蛛池模板: 泾阳县| 当阳市| 江达县| 南阳市| 临泉县| 长治市| 高陵县| 安国市| 闸北区| 温州市| 喀喇沁旗| 日照市| 巩义市| 高州市| 新化县| 收藏| 会理县| 凤凰县| 巨鹿县| 太谷县| 莒南县| 邵东县| 西畴县| 武穴市| 偃师市| 利津县| 扶沟县| 潜山县| 祁门县| 昌图县| 靖江市| 丘北县| 岳阳市| 农安县| 平泉县| 平湖市| 邵武市| 兴山县| 祁东县| 保山市| 留坝县|