資源簡介 8.2.1一元線性回歸模型+8.2.2一元線性回歸模型第三練 能力提升拔高【試題來源】來自各地期中期末的聯(lián)考試題,進行整理和改編;【試題難度】本次訓練試題難度較大,適合學完第三課后,起到提升解題能力和素養(yǎng)的目的.【目標分析】1.會求解非線性回歸模型有關的實際問題,鍛煉數(shù)學建模能力,運算求解能力,如第1題.2.會求解與一元回歸模型有關的綜合問題,鍛煉數(shù)學建模能力,運算求解能力,如第13題.一.單選題(23-24高二下·河南南陽·階段練習)1.某中學課外活動小組為了研究經(jīng)濟走勢,根據(jù)該市1999-2021年的GDP(國內(nèi)生產(chǎn)總值)數(shù)據(jù)繪制出下面的散點圖,該小組選擇了如下2個模型來擬合GDP值隨年份的變化情況,模型一:;模型二:,下列說法正確的是( )A.變量與負相關B.根據(jù)散點圖的特征,模型一能更好地擬合GDP值隨年份的變化情況C.變量與有較強的線性相關性D.若選擇模型二,的圖象不一定經(jīng)過點(23-24高二下·吉林長春·階段練習)2.用模型擬合一組數(shù),若,,設,得變換后的線性回歸方程為,則( )A.20240 B. C. D.2024(23-24高二下·河南南陽·階段練習)3.某學習小組對一組數(shù)據(jù)進行回歸分析,甲同學首先求出回歸直線方程,樣本點的中心為.乙同學對甲的計算過程進行檢查,發(fā)現(xiàn)甲將數(shù)據(jù)誤輸成,將這兩個數(shù)據(jù)修正后得到回歸直線方程,則實數(shù)( )A. B. C. D.(23-24高三上·內(nèi)蒙古呼和浩特·期末)4.用模型擬合一組數(shù)據(jù)組,其中,設,得變換后的線性回歸方程為,則( )A. B. C.35 D.21(23-24高二下·河南南陽·階段練習)5.某中學課外活動小組為了研究經(jīng)濟走勢,根據(jù)該市1999-2021年的GDP(國內(nèi)生產(chǎn)總值)數(shù)據(jù)繪制出下面的散點圖,該小組選擇了如下2個模型來擬合GDP值隨年份的變化情況,模型一:;模型二:,下列說法正確的是( )A.變量與負相關B.根據(jù)散點圖的特征,模型一能更好地擬合GDP值隨年份的變化情況C.變量與有較強的線性相關性D.若選擇模型二,的圖象不一定經(jīng)過點(2023·四川廣安·模擬預測)6.下列說法中,正確的命題的是( )A.一臺晩會有個節(jié)目,其中有個小品,如果個小品不連續(xù)演出,共有不同的演出順序種B.已知隨機變量服從正態(tài)分布,,則C.以模型去擬合一組數(shù)據(jù)時,為了求出回歸方程,設,求得線性回歸方程為,則、的值分別是和D.若樣本數(shù)據(jù)、、、的方差為,則數(shù)據(jù)、、、的方差為二、多選題(21-22高三上·湖南株洲·期末)7.某地為響應“扶貧必扶智,扶智就是扶知識、扶技術、扶方法”的號召,建立農(nóng)業(yè)科技圖書館,供農(nóng)民免費借閱,收集了近5年借閱數(shù)據(jù)如下表:年份代碼x 1 2 3 4 5年借閱量y(萬冊) 4.9 5.1 5.5 5.7 5.8根據(jù)上表,可得y關于x的經(jīng)驗回歸方程為,下列結論正確的有( )A.B.借閱量4.9,5.1,5.5,5.7,5.8的75%分位數(shù)為5.7C.y與x的線性相關系數(shù)D.第六年的借閱量一定不少于6.12萬冊(2024·河北滄州·一模)8.下表是某地從2019年至2023年能源消費總量近似值(單位:千萬噸標準煤)的數(shù)據(jù)表:年份 2019 2020 2021 2022 2023年份代號 1 2 3 4 5能源消費總量近似值(單位:千萬噸標準煤) 44.2 44.6 46.2 47.8 50.8以為解釋變量,為響應變量,若以為回歸方程,則決定系數(shù)0.9298,若以為回歸方程,則,則下面結論中正確的有( )A.變量和變量的樣本相關系數(shù)為正數(shù)B.比的擬合效果好C.由回歸方程可準確預測2024年的能源消費總量D.(2024·湖南·一模)9.下列說法中,正確的是( )A.設有一個經(jīng)驗回歸方程為,變量增加1個單位時,平均增加2個單位B.已知隨機變量,若,則C.兩組樣本數(shù)據(jù)和.若已知且,則D.已知一系列樣本點的經(jīng)驗回歸方程為,若樣本點與的殘差相等,則三、填空題(2023·全國·模擬預測)10.為研究變量x,y的相關關系,收集得到如下數(shù)據(jù):x 1 2 3 4 5y 60若由最小二乘法求得y關于x的線性回歸方程為,并據(jù)此計算在樣本點處的殘差為0,則 .(2023·江西贛州·二模)11.用模型擬合一組數(shù)據(jù),若,,設,得變換后的線性回歸方程為,則ak= .四、解答題(22-23高三上·廣東深圳·期中)12.紅蜘蛛是柚子的主要害蟲之一,能對柚子樹造成嚴重傷害,每只紅蜘蛛的平均產(chǎn)卵數(shù)y(個)和平均溫度x(℃)有關,現(xiàn)收集了以往某地的7組數(shù)據(jù),得到下面的散點圖及一些統(tǒng)計量的值. (1)根據(jù)散點圖判斷,與(其中…為自然對數(shù)的底數(shù))哪一個更適合作為平均產(chǎn)卵數(shù)y(個)關于平均溫度x(℃)的回歸方程類型?(給出判斷即可,不必說明理由)(2)由(1)的判斷結果及表中數(shù)據(jù),求出y關于x的回歸方程.(計算結果精確到0.1)附:回歸方程中,,參考數(shù)據(jù)()5215 17713 714 27 81.3 3.6(3)根據(jù)以往每年平均氣溫以及對果園年產(chǎn)值的統(tǒng)計,得到以下數(shù)據(jù):平均氣溫在22℃以下的年數(shù)占60%,對柚子產(chǎn)量影響不大,不需要采取防蟲措施;平均氣溫在22℃至28℃的年數(shù)占30%,柚子產(chǎn)量會下降20%;平均氣溫在28℃以上的年數(shù)占10%,柚子產(chǎn)量會下降50%.為了更好的防治紅蜘蛛蟲害,農(nóng)科所研發(fā)出各種防害措施供果農(nóng)選擇.在每年價格不變,無蟲害的情況下,某果園年產(chǎn)值為200萬元,根據(jù)以上數(shù)據(jù),以得到最高收益(收益=產(chǎn)值-防害費用)為目標,請為果農(nóng)從以下幾個方案中推薦最佳防害方案,并說明理由.方案1:選擇防害措施A,可以防止各種氣溫的紅蜘蛛蟲害不減產(chǎn),費用是18萬;方案2:選擇防害措施B,可以防治22℃至28℃的蜘蛛蟲害,但無法防治28℃以上的紅蜘蛛蟲害,費用是10萬;方案3:不采取防蟲害措施.(2024·遼寧·模擬預測)13.土壤食物網(wǎng)對有機質的分解有兩條途徑,即真菌途徑和細菌途徑.在不同的土壤生態(tài)系統(tǒng)中,由于提供能源的有機物其分解的難易程度不同,這兩條途徑所起的作用也不同.以細菌分解途徑為主導的土壤,有機質降解快,氮礦化率高,有利于養(yǎng)分供應,以真菌途徑為主的土壤,氮和能量轉化比較緩慢,有利于有機質存財和氮的固持.某生物實驗小組從一種土壤數(shù)據(jù)中隨機抽查并統(tǒng)計了8組數(shù)據(jù),如下表所示:編號 1 2 3 4 5 6 7 8細菌百萬個 70 80 90 100 110 120 130 140真菌百萬個 8.0 10.0 12.5 15.0 17.5 21.0 27.0 39.0其散點圖如下,散點大致分布在指數(shù)型函數(shù)的圖象附近.(1)求關于的經(jīng)驗回歸方程(系數(shù)精確到0.01);(2)在做土壤相關的生態(tài)環(huán)境研究時,細菌與真菌的比值能夠反映土壤的碳氮循環(huán).以樣本的頻率估計總體分布的概率,若該實驗小組隨機抽查8組數(shù)據(jù),再從中任選4組,記真菌(單位:百萬個)與細菌(單位:百萬個)的數(shù)值之比位于區(qū)間內(nèi)的組數(shù)為,求的分布列與數(shù)學期望.附:經(jīng)驗回歸方程的斜率和截距的最小二乘估計公式分別為,【易錯題目】第題、第題【復盤要點】非線性回歸分析問題(2024·云南曲靖·一模)【典例】已知變量關于的回歸方程為,若對兩邊取自然對數(shù),可以發(fā)現(xiàn)與線性相關.現(xiàn)有一組數(shù)據(jù)如下表所示:1 2 3 4 5則當時,預測的值為( )A. B. C. D.【答案】C【分析】令,可得出,求出、的值,將、的值代入,求出的值,可得出變量關于的回歸方程,然后令,可得出的值.【詳解】令,由可得,如下表所示:由表格中的數(shù)據(jù)可得,,則有,解得,故,當時,.故選:C.【易錯警示】有些非線性回歸分析問題并不給出經(jīng)驗公式,這時我們可以畫出已知數(shù)據(jù)的散點圖,把它與學過的各種函數(shù)(冪函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)等)的圖象進行比較,挑選一種跟這些散點擬合得最好的函數(shù),用適當?shù)淖兞窟M行變換,如通過換元或取對數(shù)等方法,把問題化為線性回歸分析問題,使之得到解決.【復盤訓練】(23-24高二下·吉林長春·階段練習)14.用模型擬合一組數(shù),若,,設,得變換后的線性回歸方程為,則( )A.20240 B. C. D.2024(23-24高三下·山東·開學考試)15.為研究某池塘中水生植物的覆蓋水塘面積(單位:)與水生植物的株數(shù)(單位:株)之間的相關關系,收集了4組數(shù)據(jù),用模型去擬合與的關系,設與的數(shù)據(jù)如表格所示:得到與的線性回歸方程,則( )3 4 6 72 2.5 4.5 7A.-2 B.-1 C. D.(2023·高三下·廣東惠州·階段練習)16.一只紅鈴蟲產(chǎn)卵數(shù)和溫度有關,現(xiàn)測得一組數(shù)據(jù),可用模型擬合,設,其變換后的線性回歸方程為,若,,為自然常數(shù),則 .(2023高三·全國·專題練習)17.x和y的散點圖如圖所示,則下列說法中①x,y是負相關關系;②在該相關關系中,若用擬合時的相關指數(shù)為,用擬合時的相關指數(shù)為則;③x,y之間不能建立線性回歸方程;所有正確命題的序號為 .(23-24高三上·廣東廣州·階段練習)18.中國茶文化博大精深,飲茶深受大眾喜愛,茶水的口感與茶葉類型和水的溫度有關,某數(shù)學建模小組為了獲得茶水溫度y(單位:)關于時間x(單位:min)的回歸方程模型,通過實驗收集在室溫,用同一溫度的水沖泡的條件下,茶水溫度隨時間變化的7組數(shù)據(jù),并對數(shù)據(jù)做初步處理得到如圖所示散點圖以及如表所示數(shù)據(jù). 73.5 3.85表中:,(1)根據(jù)散點圖判斷,①與②哪一個更適宜作為該茶水溫度y關于時間x的回歸方程類型?(給出判斷即可,不必說明理由)請根據(jù)你的判斷結果及表中數(shù)據(jù)建立該茶水溫度y關于時間x的回歸方程;(2)已知該茶水溫度降至口感最佳,根據(jù)(1)中的回歸方程,求在相同條件下沖泡的茶水,大約需要放置多長時間才能達到最佳飲用口感?附:(1)對于一組數(shù)據(jù),…,,其回歸直線的斜率和截距的最小二乘估計分別為,(2)參考數(shù)據(jù):,,,,試卷第1頁,共3頁試卷第1頁,共3頁參考答案:1.D【分析】對于ABC,由散點圖的變化趨勢分析判斷;對于D,由線性回歸方程的性判斷.【詳解】對于 A,由散點圖可知 隨年份 的增大而增大,所以變量 與 正相關,所以 A 錯誤;對于 BC,由散點圖可知變量 與 的變化趨向于一條曲線,所以模型二能更好地 擬合 GDP 值隨年份的變化情況,所以 B 錯誤,C錯誤;對于 D,若選擇模型二:,令,則的圖像一定過點,不一定過點,故D正確.故選:D.2.C【分析】先計算,代入線性回歸方程求得,再計算即可.【詳解】由條件可知,代入,則,故C正確.故選:C3.D【分析】根據(jù)題意,甲輸入的為,即可求得以及,然后將正確數(shù)據(jù)代入,即可求得樣本中心點,代入回歸直線即可得到結果.【詳解】由題意可得,假設甲輸入的為,則,則,且,則,則改為正確數(shù)據(jù)時,,即,,即,所以樣本中心點為,將點代入回歸直線方程,得.故選:D4.B【分析】求出,即,得到答案.【詳解】由題意得,故,即,故,解得.故選:B5.D【分析】對于ABC,由散點圖的變化趨勢分析判斷;對于D,由線性回歸方程的性判斷.【詳解】對于 A,由散點圖可知 隨年份 的增大而增大,所以變量 與 正相關,所以 A 錯誤;對于 BC,由散點圖可知變量 與 的變化趨向于一條曲線,所以模型二能更好地 擬合 GDP 值隨年份的變化情況,所以 B 錯誤,C錯誤;對于 D,若選擇模型二:,令,則的圖像一定過點,不一定過點,故D正確.故選:D.6.C【分析】利用插空法可判斷A選項;利用正態(tài)密度曲線的對稱性可判斷B選項;利用對數(shù)的運算可判斷C選項;利用方差的性質可判斷D選項.【詳解】對于A選項,一臺晩會有個節(jié)目,其中有個小品,如果個小品不連續(xù)演出,只需先將其余個節(jié)目全排,然后將個小品插入另外個節(jié)目形成的個空位中的兩個即可,因此,不同的演出順序種數(shù)為,A錯;對于B選項,已知隨機變量服從正態(tài)分布,,則,B錯;對于C選項,以模型去擬合一組數(shù)據(jù)時,為了求出回歸方程,設,則,所以,,解得,C對;對于D選項,因為樣本數(shù)據(jù)、、、的方差為,則數(shù)據(jù)、、、的方差為,D錯.故選:C.7.ABC【分析】A選項,計算出樣本中心點,代入回歸方程,求出;B選項,根據(jù)百分位數(shù)的定義進行求解;C選項,y與x正相關,C正確;D選項,計算出第六年的借閱量約為6.12萬冊,D錯誤.【詳解】A選項,,,將代入得,,解得,A正確;B選項,,故從小到大選擇第4個數(shù)作為75%分位數(shù),即,故借閱量4.9,5.1,5.5,5.7,5.8的75%分位數(shù)為5.7,B正確;C選項,因為,所以y與x正相關,故y與x的線性相關系數(shù),C正確;D選項,中,令得,故第六年的借閱量約為6.12萬冊,可能比6.12萬冊多,也可能比6.12萬冊少,D錯誤.故選:ABC8.ABD【分析】隨著變量的增加,變量也在增加可判斷A選項;根據(jù)決定系數(shù)越接近1,擬合效果越好可判斷B選項;由經(jīng)驗回歸方程的定義可判斷C選項;由經(jīng)驗回歸方程必過樣本中心點可判斷D選項.【詳解】對于A選項:隨著變量的增加,變量也在增加,故變量和變量成正相關,即樣本相關系數(shù)為正數(shù),正確;對于B選項:因為,故比的擬合效果好,正確;對于C選項:回歸方程可預測2024年的能源消費總量,不可準確預測,錯誤;對于D選項:由回歸方程必過樣本中心點,可知,正確.故選:ABD.9.BC【分析】根據(jù)回歸方程可判定A,根據(jù)正態(tài)分布可判定B,根據(jù)數(shù)據(jù)的平均數(shù)可判定C,根據(jù)回歸方程及殘差的概念可判定D.【詳解】若有一個經(jīng)驗回歸方程,隨著的增大,會減小,A錯誤;曲線關于對稱,因為,所以,所以,B正確;因為,所以,故,C正確;經(jīng)驗回歸方程為,且樣本點與的殘差相等,則,所以,D錯誤.故選:BC.10.290【分析】先利用殘差的計算公式求出,再根據(jù)回歸直線過樣本點的中心求出,即可得解.【詳解】因為在樣本點處的殘差為0,所以,得,則y關于x的線性回歸方程為.因為,所以,所以.故答案為:11.【分析】先求出,因為在回歸直線上,求出,將化簡為,代入即可得出答案.【詳解】由題意得,因為在回歸直線上,所以,由得與比較得:,a.故答案為:.12.(1)更適宜(2)(3)選擇方案1最佳,理由見解析【分析】(1)根據(jù)散點圖的形狀,可判斷更適宜作為平均產(chǎn)卵數(shù)y關于平均溫度x的回歸方程類型;(2)將兩邊同時取自然對數(shù),轉化為線性回歸方程,即可得到答案;(3)求出三種方案的收益的均值,根據(jù)均值越大作為判斷標準.【詳解】(1)由散點圖可以判斷,更適宜作為平均產(chǎn)卵數(shù)y關于平均溫度x的回歸方程類型.(2)將兩邊同時取自然對數(shù),可得,由題中的數(shù)據(jù)可得,,,所以,則,所以z關于x的線性回歸方程為,故y關于x的回歸方程為;(3)用,和分別表示選擇三種方案的收益.采用第1種方案,無論氣溫如何,產(chǎn)值不受影響,收益為萬,即采用第2種方案,不發(fā)生28℃以上的紅蜘蛛蟲害,收益為萬,如果發(fā)生,則收益為萬,即,同樣,采用第3種方案,有所以,,,.顯然,最大,所以選擇方案1最佳.13.(1)(2)分布列見解析,2【分析】(1)令,將指數(shù)型回歸方程轉化為線性回歸方程,利用最小二乘法的估計系數(shù)公式,即可求得答案;(2)確定真菌與細菌的數(shù)值之比位于區(qū)間內(nèi)的組數(shù),即可確定X的取值,求出每個值對應的概率,即可得分布列,即可求得數(shù)學期望.【詳解】(1)由于,故,令,則,,則,,故,則關于的經(jīng)驗回歸方程為;(2)由已知圖表可知從第1組到第8組的真菌(單位:百萬個)與細菌(單位:百萬個)的數(shù)值之比依次為:,,故樣本中比值位于內(nèi)的組數(shù)有4組,則X的可能取值為:,則,,故X的分布列為:X 0 1 2 3 4P則.14.C【分析】先計算,代入線性回歸方程求得,再計算即可.【詳解】由條件可知,代入,則,故C正確.故選:C15.C【分析】根據(jù)已知條件,求得,進而代入回歸方程可求得,從而得出,聯(lián)立,即可求得本題答案.【詳解】由已知可得,,,所以,有,解得,所以,,由,得,所以,,則.故選:C.16.【分析】經(jīng)過變換后將非線性問題轉化為線性問題,在求樣本點的中心,回歸直線一定過該點,即可求出參數(shù).【詳解】經(jīng)過變換后,得到,根據(jù)題意,故,又,故,,故,于是回歸方程為一定經(jīng)過,故,解得,即,于是.故答案為:.17.①②【解析】根據(jù)散點圖可以判定變量負相關,指數(shù)型函數(shù)模型比直線型更恰當,相關指數(shù)更大,變量間可以建立線性回歸方程,擬合效果不大好.【詳解】在散點圖中,點散布在從左上角到右下角的區(qū)域,因此x,y是負相關關系,故①正確;由散點圖知用擬合比用擬合效果要好,則R>R,故②正確;x,y之間可以建立線性回歸方程,但擬合效果不好,故③錯誤.故答案為:①②【點睛】此題考查回歸模型建立,利用恰當?shù)哪P蛿M合變量間的相關關系,及相關指數(shù)與擬合效果之間的關系辨析.18.(1)②更適宜,;(2)7.5min.【分析】(1)根據(jù)散點圖選擇②,取對數(shù),再利用最小二乘法公式求出回歸直線方程即可.(2)利用(1)中回歸方程,列出關于的方程求解即得.【詳解】(1)由散點圖知,更適宜的回歸方程為②,即.由,得,兩邊取自然對數(shù),得,令,則,,結合表中數(shù)據(jù),得,結合參考數(shù)據(jù)可得,由,得,所以茶水溫度y關于時間x的回歸方程為.(2)依題意,室溫下,茶水溫度降至口感最佳,即,整理得,于是,解得,所以在相同條件下,剛泡好的茶水大約需要放置7.5min才能達到最佳引用口感.答案第1頁,共2頁答案第1頁,共2頁8.2.1一元線性回歸模型+8.2.2一元線性回歸模型第三課 知識擴展延伸擴展1:非線性回歸分析例3.近期,某公交公司分別推出支付寶和微信掃碼支付乘車活動,活動設置了一段時間的推廣期,由于推廣期內(nèi)優(yōu)惠力度較大,吸引越來越多的人開始使用掃碼支付,某線路公交車隊統(tǒng)計了活動剛推出一周內(nèi)每天使用掃碼支付的人次,用x表示活動推出的天數(shù),y表示每天使用掃碼支付的人次(單位:十人次),繪制了如圖所示的散點圖.(1)根據(jù)散點圖判斷在推廣期內(nèi),與(c,d為大于0的常數(shù))哪一個適宜作為每天使用掃碼支付的人次y關于活動推出天數(shù)x的經(jīng)驗回歸方程類型?(給出判斷即可,不必說明理由)(2)根據(jù)(1)的判斷結果求y關于x的回歸方程,并預測活動推出第8天使用掃碼支付的人次.參考數(shù)據(jù):4 62 1.54 2535 50.12 140 3.47其中,.附:對于一組數(shù)據(jù),,…,,其經(jīng)驗回歸直線的斜率和截距的最小二乘估計分別為,.【解】(1)根據(jù)散點圖判斷,適宜作為每天使用掃碼支付的人次y關于活動推出天數(shù)x的回歸方程類型.(2)∵,兩邊取對數(shù)得,設,∴.∵,,,∴,則,則,即,∴y關于x的經(jīng)驗回歸方程為.把代入上式得,故活動推出第8天使用掃碼支付的人次約為3470.【方法總結】對于非線性回歸問題,可以畫出已知數(shù)據(jù)的散點圖,把它與學過的各種函數(shù)(冪函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)等)的圖象作比較,挑選一種跟這些散點擬合得最好的函數(shù),然后采用適當?shù)淖兞孔儞Q,把問題化為線性回歸問題,使之得到解決,其一般步驟為:【舉一反三1-1】1.給出下列說法:①以模型去擬合一組數(shù)據(jù)時,為了求出線性回歸方程,設,將其變換后得到線性回歸方程,則,的值分別是和0.3;②根據(jù)具有線性相關關系的兩個變量的統(tǒng)計數(shù)據(jù)所得的線性回歸方程中,,,,則;③通過線性回歸方程,可以精確反映變量的取值和變化趨勢.其中錯誤的個數(shù)是( )A.1 B.2 C.3 D.0【舉一反三1-2】[江西景德鎮(zhèn)一中2021高二期末]2.某大型現(xiàn)代化農(nóng)場在種植某種大棚有機無公害的蔬菜時,為創(chuàng)造更大價值,提高畝產(chǎn)量,積極開展技術創(chuàng)新活動.該農(nóng)場采用了延長光照時間的方案,該農(nóng)場選取了20間大棚(每間一畝)進行試點,得到各間大棚產(chǎn)量數(shù)據(jù)繪制成散點圖.光照時長為(單位:小時),大棚蔬菜產(chǎn)量為(單位:千斤每畝),記.(1)根據(jù)散點圖判斷,與,哪一個適宜作為大棚蔬菜產(chǎn)量關于光照時長的回歸方程類型(給出判斷即可,不必說明理由);(2)根據(jù)(1)的判斷結果及表中數(shù)據(jù),建立關于的回歸方程;(結果保留小數(shù)點后兩位)(3)根據(jù)實際種植情況,發(fā)現(xiàn)上述回歸方程在光照時長位于6~14小時內(nèi)擬合程度良好,利用(2)中所求方程估計當光照時長為小時(自然對數(shù)的底),大棚蔬菜畝產(chǎn)約為多少.參數(shù)數(shù)據(jù):290 102.4 52 4870 540.28 137 1578.2 272.1參考公式:關于的線性回歸方程中,,擴展2:一元回歸模型的綜合應用例2.(2024·全國·模擬預測)自媒體職業(yè)就是通過自媒體平臺發(fā)布文章或者視頻,賺取收益的職業(yè).某自媒體從業(yè)人員從業(yè)10個月以來的月收益(單位:元)統(tǒng)計如下:第個月 1 2 3 4 5 6 7 8 9 10月收益(單位:元) 400 1600 1800 2400 2000 2600 3000 3200 3400 3600(1)若該自媒體從業(yè)人員的月收益與自媒體從業(yè)時間成正相關關系,試估計該自媒體從業(yè)人員從業(yè)第幾個月開始月收益超過5000元;(2)從這10個月的月收益不低于2400元的月份里隨機抽取3個月進行話題分析,記這3個月中月收益不低于3000元的有個月,求的分布列和期望.附:經(jīng)驗回歸方程中,,其中為樣本均值.【答案】(1)第14個月(2)分布列見解析,【分析】(1)根據(jù)最小二乘法即可求解回歸方程,進而可由不等式求解,(2)根據(jù)超幾何的概率公式求解分布列,即可由期望公式求解期望.【詳解】(1),,,,經(jīng)驗回歸方程為.令,解得,估計該自媒體從業(yè)人員從業(yè)第14個月開始月收益超過5000元.(2)在這10個月中,月收益不低于2400元的有6個月,月收益不低于3000元的有4個月,的所有可能取值為,,的分布列為1 2 3.【方法總結】線性回歸分析問題的解題策略(1)利用公式,求出回歸系數(shù);(2)利用經(jīng)驗回歸直線過樣本點的中心求系數(shù);(3)利用經(jīng)驗回歸方程進行預測,把回歸方程看作一次函數(shù),將解釋變量x的值代入,得到預測變量的值.【舉一反三2-1】(2024·全國·模擬預測)3.20世紀80年代初,隨著我國的改革開放,經(jīng)濟體制和經(jīng)營體制逐漸靈活,市場上的商品日益豐富,城市和農(nóng)村出現(xiàn)小賣部.小賣部主營生活日用商品,有著經(jīng)營成本小、規(guī)模小、商品種類少分布廣等特點.近幾年,人們的生活水平達到了新的高度,實體小賣部逐漸被應運而生的大小超市所取代.為適應市場,某小賣部經(jīng)營者欲將經(jīng)營規(guī)模擴大,將小賣部發(fā)展成生鮮綜合超市,現(xiàn)將2013~2022年的年利潤(單位:萬元)統(tǒng)計如下:年限 1 2 3 4 5 6 7 8 9 10年利潤(萬元) 2 8 9 12 10 13 15 16 17 18其中,年限1表示2013年,2表示2014年,3表示2015年,……,以此類推,10表示2022年.(1)若年利潤(單位:萬元)與小賣部營業(yè)年限成正相關關系,在不改變經(jīng)營狀態(tài)的情況下,預測該小賣部2023年的年利潤;(2)以年利潤是否低于12萬元為評價標準,按照分層抽樣從2013~2022年的年利潤中隨機抽取5個,再從這5個數(shù)據(jù)中隨機抽取2個,求抽取的2個數(shù)據(jù)至少有1個低于12萬元的概率.附:線性回歸方程中,,其中為樣本均值.【舉一反三2-2】4.樹木根部半徑與樹木的高度呈正相關,即樹木根部越粗,樹木的高度也就越高.某塊山地上種植了樹木,某農(nóng)科所為了研究樹木的根部半徑與樹木的高度之間的關系,從這些地塊中用簡單隨機抽樣的方法抽取6棵樹木,調(diào)查得到樹木根部半徑(單位:米)與樹木高度(單位:米)的相關數(shù)據(jù)如表所示:0.1 0.2 0.3 0.4 0.5 0.61.1 1.3 1.6 1.5 2.0 2.1(1)求關于的線性回歸方程;(2)對(1)中得到的回歸方程進行殘差分析,若某樹木的殘差為零則認為該樹木“長勢標準”,在此片樹木中隨機抽取1棵樹木,估計這棵樹木“長勢標準”的概率.參考公式:回歸直線方程為,其中,.(2023·天津·高考真題)5.鳶是鷹科的一種鳥,《詩經(jīng)·大雅·旱麓》曰:“鳶飛戾天,魚躍余淵”. 鳶尾花因花瓣形如鳶尾而得名,寓意鵬程萬里、前途無量.通過隨機抽樣,收集了若干朵某品種鳶尾花的花萼長度和花瓣長度(單位:cm),繪制散點圖如圖所示,計算得樣本相關系數(shù)為,利用最小二乘法求得相應的經(jīng)驗回歸方程為,根據(jù)以上信息,如下判斷正確的為( )A.花瓣長度和花萼長度不存在相關關系B.花瓣長度和花萼長度負相關C.花萼長度為7cm的該品種鳶尾花的花瓣長度的平均值為D.若從樣本中抽取一部分,則這部分的相關系數(shù)一定是(2024·四川廣安·二模)6.某公司收集了某商品銷售收入(萬元)與相應的廣告支出(萬元)共10組數(shù)據(jù)(),繪制出如下散點圖,并利用線性回歸模型進行擬合.若將圖中10個點中去掉點后再重新進行線性回歸分析,則下列說法正確的是( )A.決定系數(shù)變小 B.殘差平方和變小C.相關系數(shù)的值變小 D.解釋變量與預報變量相關性變?nèi)?br/>(廣東·高考真題)7.某數(shù)學老師身高,他爺爺、父親和兒子的身高分別是、和.因兒子的身高與父親的身高有關,該老師用線性回歸分析的方法預測他孫子的身高為(2024·江蘇·一模)8.已知變量的統(tǒng)計數(shù)據(jù)如下表,對表中數(shù)據(jù)作分析,發(fā)現(xiàn)與之間具有線性相關關系,利用最小二乘法,計算得到經(jīng)驗回歸直線方程為,據(jù)此模型預測當時的值為 .5 6 7 8 93.5 4 5 6 6.5(安徽·高考真題)9.某地最近十年糧食需求量逐年上升,下表是部分統(tǒng)計數(shù)據(jù):年份 2002 2004 2006 2008 2010需求量(萬噸) 236 246 257 276 286(1)利用所給數(shù)據(jù)求年需求量與年份之間的回歸直線方程;(2)利用(1)中所求的直線方程預測該地2012年的糧食需求量.(廣東·高考真題)10.下表提供了某廠節(jié)能降耗技術改造后生產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)量x(噸)與相應的生產(chǎn)能耗y(噸標準煤)的幾組對照數(shù)據(jù)x 3 4 5 6y 2.5 3 4 4.5(1) 請畫出上表數(shù)據(jù)的散點圖;(2) 請根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關于x的線性回歸方程;(3) 已知該廠技術改造前100噸甲產(chǎn)品能耗為90噸標準煤.試根據(jù)(2)求出的線性回歸方程,預測生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗比技術改造前降低多少噸標準煤?(參考數(shù)據(jù): 3×2.5+4×3+5×4+6×4.5=66.5)(2022·全國·高考真題)11.某地經(jīng)過多年的環(huán)境治理,已將荒山改造成了綠水青山.為估計一林區(qū)某種樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:)和材積量(單位:),得到如下數(shù)據(jù):樣本號i 1 2 3 4 5 6 7 8 9 10 總和根部橫截面積 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6材積量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9并計算得.(1)估計該林區(qū)這種樹木平均一棵的根部橫截面積與平均一棵的材積量;(2)求該林區(qū)這種樹木的根部橫截面積與材積量的樣本相關系數(shù)(精確到0.01);(3)現(xiàn)測量了該林區(qū)所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和為.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數(shù)據(jù)給出該林區(qū)這種樹木的總材積量的估計值.附:相關系數(shù).(全國·高考真題)12.下圖是某地區(qū)2000年至2016年環(huán)境基礎設施投資額(單位:億元)的折線圖. 為了預測該地區(qū)2018年的環(huán)境基礎設施投資額,建立了與時間變量的兩個線性回歸模型.根據(jù)2000年至2016年的數(shù)據(jù)(時間變量的值依次為)建立模型①:;根據(jù)2010年至2016年的數(shù)據(jù)(時間變量的值依次為)建立模型②:. (1)分別利用這兩個模型,求該地區(qū)2018年的環(huán)境基礎設施投資額的預測值; (2)你認為用哪個模型得到的預測值更可靠?并說明理由.試卷第1頁,共3頁試卷第1頁,共3頁參考答案:1.A【分析】根據(jù)線性回歸方程的知識判斷出正確選項.【詳解】①,,依題意,對比系數(shù)得,①正確.②,回歸直線方程過樣本中心點,所以,②正確.③,通過線性回歸方程,無法精確反映變量的取值,③錯誤.所以錯誤的個數(shù)是個.故選:A2.(1)更適宜作為回歸方程類型;(2);(3)千斤每畝.【解析】(1)根據(jù)散點圖中點的位置判斷;(2)記.則為,由已知數(shù)據(jù)計算方程中的系數(shù),即可得;(3)在(2)的方程中令代入計算可得.【詳解】(1)根據(jù)散點圖,開始的點在某條直線旁,但后面的點會越來越偏離這條直線,因此更適宜作為回歸方程類型;(2)記.則為,,,,,所以,即.(3)時,.【點睛】關鍵點點睛:本題考查線性回歸直線方程,解題關鍵是根據(jù)已知數(shù)據(jù)計算出回歸直線方程中系數(shù).考查了運算求解能力.求解時,注意題目提供的數(shù)據(jù),公式,特別是計算公式不能把數(shù)據(jù)弄混,否則會得出錯誤結果.3.(1)20.47萬元(2)【分析】(1)根據(jù)圖表利用最小二乘法計算線性回歸方程并預測即可;(2)根據(jù)圖表利用分層抽樣及古典概型計算即可.【詳解】(1),,,,線性回歸方程為.當時,,在不改變經(jīng)營狀態(tài)的情況下,預測該小賣部2023年的年利潤為20.47萬元.(2)2013~2022年的年利潤中低于12萬元的有4個,不低于12萬元的有6個,按照分層抽樣從2013~2022年的年利潤中隨機抽取5個,則年利潤低于12萬元的有2個,記為,不低于12萬元的有3個,記為.從這5個數(shù)據(jù)中隨機抽取2個,所有等可能結果有,,共10種,其中,抽取的2個數(shù)據(jù)至少有1個低于12萬元的結果有,共7種,故所求概率為.4.(1);(2)【分析】(1)由最小二乘法先求樣本點中心,再代入公式求,即可得到答案;(2)先計算6棵A樹木中殘差為零的有3棵,占比為,即可得到答案;【詳解】(1)由,,,,有,,故關于的回歸方程為:.(2)當時,,殘差為,當時,,殘差為,當時,,殘差為,當時,,殘差為,當時,,殘差為,當時,,殘差為,由這6棵A樹木中殘差為零的有3棵,占比為,這棵樹木“長勢標準”的概率為.5.C【分析】根據(jù)散點圖的特點及經(jīng)驗回歸方程可判斷ABC選項,根據(jù)相關系數(shù)的定義可以判斷D選項.【詳解】根據(jù)散點的集中程度可知,花瓣長度和花萼長度有相關性,A選項錯誤散點的分布是從左下到右上,從而花瓣長度和花萼長度呈現(xiàn)正相關性,B選項錯誤,把代入可得,C選項正確;由于是全部數(shù)據(jù)的相關系數(shù),取出來一部分數(shù)據(jù),相關性可能變強,可能變?nèi)?,即取出的?shù)據(jù)的相關系數(shù)不一定是,D選項錯誤故選:C6.B【分析】從圖中分析得到去掉點后,回歸效果更好,再由決定系數(shù),殘差平方和,相關系數(shù)和相關性的概念和性質作出判斷.【詳解】從圖中可以看出點較其他點,偏離直線遠,故去掉點后,回歸效果更好,故決定系數(shù)會變大,更接近于1,殘差平方和變小,相關系數(shù)的絕對值,即會更接近于1,由圖可得與正相關,故會更接近于1,即相關系數(shù)的值變大,解釋變量與預報變量相關性變強,故A、C、D錯誤,B正確.故選:B.7.【分析】設出解釋變量和預報變量;代入線性回歸方程公式,求出線性回歸方程,將方程中的用182代替,求出他孫子的身高.【詳解】解:設表示父親的身高,表示兒子的身高,則隨的變化情況如下:173 170 176 182170 176 182 ?,,,,線性回歸方程當時,.故答案為:8.7.4【分析】經(jīng)驗回歸直線方程過樣本點的中心,所以把代入求得的值,再代入求解即可.【詳解】由已知得,即樣本點中心,因為經(jīng)驗回歸直線方程過樣本點的中心,所以,解得.所以,當時,.故答案為:.9.(1);(2)該地2012年的糧食需求量約為萬噸.【分析】(1)根據(jù)給定數(shù)據(jù)求出,再利用最小二乘法公式計算b即可計算作答.(2)利用(1)的結論求出時的即可作答.【詳解】(1)依題意,,,因此,,,年需求量與年份之間的回歸直線方程是:;(2)由(1)知,當x=2012時,(萬噸),所以預測該地2012年的糧食需求量約為萬噸.10.(1)見解析;(2)線性回歸方程為y=0.7x+0.35(3)19.65(噸)【詳解】(1)所求散點圖如圖所示: (2) 3×2.5+4×3+5×4+6×4.5=66.5,,,,故所求線性回歸方程為=0.7x+0.35.(3)根據(jù)回歸方程的預測,現(xiàn)在生產(chǎn)100噸產(chǎn)品消耗的標準煤的數(shù)量為0.7×100+0.35=70.35,故耗能降低了90-70.35=19.65噸標準煤.11.(1);(2)(3)【分析】(1)計算出樣本的一棵根部橫截面積的平均值及一棵材積量平均值,即可估計該林區(qū)這種樹木平均一棵的根部橫截面積與平均一棵的材積量;(2)代入題給相關系數(shù)公式去計算即可求得樣本的相關系數(shù)值;(3)依據(jù)樹木的材積量與其根部橫截面積近似成正比,列方程即可求得該林區(qū)這種樹木的總材積量的估計值.【詳解】(1)樣本中10棵這種樹木的根部橫截面積的平均值樣本中10棵這種樹木的材積量的平均值據(jù)此可估計該林區(qū)這種樹木平均一棵的根部橫截面積為,平均一棵的材積量為(2)則(3)設該林區(qū)這種樹木的總材積量的估計值為,又已知樹木的材積量與其根部橫截面積近似成正比,可得,解之得.則該林區(qū)這種樹木的總材積量估計為12.(1)利用模型①預測值為226.1,利用模型②預測值為256.5,(2)利用模型②得到的預測值更可靠.【詳解】分析:(1)兩個回歸直線方程中無參數(shù),所以分別求自變量為2018時所對應的函數(shù)值,就得結果;(2)根據(jù)折線圖知2000到2009,與2010到2016是兩個有明顯區(qū)別的直線,且2010到2016的增幅明顯高于2000到2009,也高于模型1的增幅,因此所以用模型2更能較好得到2018的預測.詳解:(1)利用模型①,該地區(qū)2018年的環(huán)境基礎設施投資額的預測值為=–30.4+13.5×19=226.1(億元).利用模型②,該地區(qū)2018年的環(huán)境基礎設施投資額的預測值為=99+17.5×9=256.5(億元).(2)利用模型②得到的預測值更可靠.理由如下:(i)從折線圖可以看出,2000年至2016年的數(shù)據(jù)對應的點沒有隨機散布在直線y=–30.4+13.5t上下,這說明利用2000年至2016年的數(shù)據(jù)建立的線性模型①不能很好地描述環(huán)境基礎設施投資額的變化趨勢.2010年相對2009年的環(huán)境基礎設施投資額有明顯增加,2010年至2016年的數(shù)據(jù)對應的點位于一條直線的附近,這說明從2010年開始環(huán)境基礎設施投資額的變化規(guī)律呈線性增長趨勢,利用2010年至2016年的數(shù)據(jù)建立的線性模型=99+17.5t可以較好地描述2010年以后的環(huán)境基礎設施投資額的變化趨勢,因此利用模型②得到的預測值更可靠.(ii)從計算結果看,相對于2016年的環(huán)境基礎設施投資額220億元,由模型①得到的預測值226.1億元的增幅明顯偏低,而利用模型②得到的預測值的增幅比較合理,說明利用模型②得到的預測值更可靠.點睛:若已知回歸直線方程,則可以直接將數(shù)值代入求得特定要求下的預測值;若回歸直線方程有待定參數(shù),則根據(jù)回歸直線方程恒過點求參數(shù).答案第1頁,共2頁答案第1頁,共2頁 展開更多...... 收起↑ 資源列表 8.2.1一元線性回歸模型8.2.2一元線性回歸模型第三練能力提升拔高.docx 8.2.1一元線性回歸模型8.2.2一元線性回歸模型第三課知識擴展延伸.docx 縮略圖、資源來源于二一教育資源庫