資源簡介 第八章 成對數據的統計分析第二練 數學思想訓練【試題來源】來自名校、重點市區的月考、期中、期末的優質試題.【試題難度】難度中等,配合第二課的題型訓練,加強考點的理解和擴展.【目標分析】1.會利用函數思想、方程思想解題,培養數學抽象,如第2題.2.會利用數形結合思想解題,鍛煉數學建模能力,如第1,3題.(2024·四川成都·二模)1.對變量有觀測數據,得散點圖1;對變量有觀測數據,得散點圖2.表示變量之間的線性相關系數,表示變量之間的線性相關系數,則下列說法正確的是( )A.變量與呈現正相關,且 B.變量與呈現負相關,且C.變量與呈現正相關,且 D.變量與呈現負相關,且2.已知變量與的一組數據如下表所示,根據數據得到關于的回歸方程為.1 2 3 4若,則( )A.6 B.7 C.8 D.(2024·四川廣安·二模)3.某公司收集了某商品銷售收入(萬元)與相應的廣告支出(萬元)共10組數據(),繪制出如下散點圖,并利用線性回歸模型進行擬合.若將圖中10個點中去掉點后再重新進行線性回歸分析,則下列說法正確的是( )A.決定系數變小 B.殘差平方和變小C.相關系數的值變小 D.解釋變量與預報變量相關性變弱(23-24高三下·上海浦東新·期中)4.通過隨機抽樣,我們繪制了如圖所示的某種商品每千克價格(單位:百元)與該商品消費者年需求量(單位:千克)的散點圖.若去掉圖中右下方的點后,下列說法正確的是( )A.“每千克價格”與“年需求量”這兩個變量由負相關變為正相關B.“每千克價格”與“年需求量”這兩個變量的線性相關程度不變C.“每千克價格”與“年需求量”這兩個變量的線性相關系數變大D.“每千克價格”與“年需求量”這兩個變量的線性相關系數變小(23-24高二下·江西贛州·期中)5.給定兩個隨機變量的5組成對數據:,,,,.通過計算,得到關于的線性回歸方程為,則( )A.1 B.1.1 C.0.9 D.1.156.已知在最小二乘法原理下,具有相關關系的變量x,y之間的線性回歸方程為,且變量x,y之間的相關數據如表所示,則下列說法正確的是( )x 6 8 10 12y 6 m 3 2A.變量x,y之間呈現正相關關系 B.可以預測,當時,C.可求得表中 D.由表格數據知,該回歸直線必過點(2023·武漢調研)7.某班級學生開展課外數學探究活動,將一杯冷水從冰箱中取出后靜置,在的室溫下測量水溫單位隨時間(單位:)的變化關系,在測量了15個數據后,根據這些實驗數據得到如下的散點圖:現需要選擇合適的回歸方程進行回歸分析,則根據散點圖,合適的回歸方程類型有( )A. B.C. D.(2024·湖北·一模)8.某校為了解高一新生對數學是否感興趣,從400名女生和600名男生中通過分層抽樣的方式隨機抽取100名學生進行問卷調查,將調查的結果得到如下等高堆積條形圖和列聯表,則( )性別 數學興趣 合計感興趣 不感興趣女生男生合計 100參考數據:本題中0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828A.表中B.可以估計該校高一新生中對數學不感興趣的女生人數比男生多C.根據小概率值的獨立性檢驗,可以認為性別與對數學的興趣有差異D.根據小概率值的獨立性檢驗,可以認為性別與對數學的興趣沒有差異9.已知x和y的散點圖如圖所示,在相關關系中,若用擬合時的決定系數為,用擬合時的決定系數為,則,中較大的是 .10.2019年7月15日,某市物價部門對本市的5家商場的某商品的一天銷售量及其價格進行調查,5家商場的售價元和銷售量件之間的一組數據如下表所示:價格 9 9.5 10.5 11銷售量 11 8 6 5可知,銷售量與價格之間有較強的線性相關關系,其線性回歸方程是,且,則其中的 .(2023高三上·全國·專題練習)11.如圖是我國2014年至2020年年生活垃圾無害化處理量(單位:億噸)的折線圖.注:年份代碼1~7分別對應年份2014~2020.由折線圖看出,可用線性回歸模型擬合y與t的關系,請用相關系數加以說明.參考數據:=9.32,=40.17,=0.55,≈2.646.參考公式:相關系數(2024·寧夏吳忠·模擬預測)12.配速是馬拉松運動中常使用的一個概念,是速度的一種,是指每公里所需要的時間,相比配速,把心率控制在一個合理水平是安全理性跑馬拉松的一個重要策略.圖1是一名馬拉松跑者的心率(單位:次/分鐘)和配速(單位:分鐘/公里)的散點圖,圖2是一次馬拉松比賽(全程約42公里)前3000名跑者成績(單位:分鐘)的頻率分布直方圖.(1)由散點圖看出,可用線性回歸模型擬合與的關系,求與的線性回歸方程;(2)該跑者如果參加本次比賽,將心率控制在160次/分鐘左右跑完全程,估計他跑完全程花費的時間,并估計他能獲得的名次,參考公式:線性回歸方程中,,.13.在國家積極推動美麗鄉村建設的政策背景下,各地根據當地生態資源打造了眾多特色紛呈的鄉村旅游勝地.某人意圖將自己位于鄉村旅游勝地的房子改造成民宿用于出租,在旅游淡季隨機選取100天,對當地已有的六間不同價位的民宿進行跟蹤,統計其出租率,設民宿租金為(單位:元/日),得到如圖的數據散點圖.(1)若用“出租率”近似估計旅游淡季民宿每天租出去的概率,求租金為388元的那間民宿在淡季內的3天中至少有2天閑置的概率.(2)(i)根據散點圖判斷,與哪個更適合此模型(給出判斷即可,不必說明理由)?根據判斷結果求經驗回歸方程.(ii)若該地一年中旅游淡季約為280天,在此期間無論民宿是否出租,每天都要付出的固定成本,若民宿出租,則每天需要再付出的日常支出成本.試用(i)中模型進行分析,旅游淡季民宿租金定為多少元時,該民宿在這280天的收益達到最大.附:記,,,,,,,,,,.【易錯題目】第題【復盤要點】非線性回歸方程問題【典例】為了更好地指導青少年健康飲食,某機構調查了本地區不同身高的未成年男性,得到他們的體重的平均值,并對數據作了初步處理,得到下面的散點圖及一些統計量的值.13531.63.440001.62413.580注:表中.(1)根據散點圖判斷,可采用作為這個地區未成年男性體重y(千克)與身高x(厘米)的回歸方程.利用表中數據建立y關于x的回歸方程.(2)若體重超過相同身高男性體重平均值的1.2倍為偏胖,低于0.8倍為偏瘦,那么該地區一名身高為175厘米,體重為78千克的在校男生的體重是否正常?參考數據:,,.參考公式:對于一組數據,,…,,其經驗回歸直線的斜率和截距的最小二乘估計分別為,.【解】(1)由,得.設,則由表格中數據,得,,則,,,,所以y關于x的回歸方程為.(2)當時,,因為,所以該名在校男生的體重偏胖.【解題策略】本題考查了非線性回歸模型,對兩邊取對數得,再利用換元法轉化為求方程,把非線性回歸模型轉化為一元線性回歸模型,利用最小二乘法可求解.【易錯警示】回歸分析問題的類型及解題方法(1)求經驗回歸方程(i)當兩個系數均未知時,可利用公式法求解;(ii)當兩個系數已知一個求另一個時,可利用經驗回歸直線過樣本點的中心求解.(2)利用經驗回歸方程進行預測,把經驗回歸方程看作一次函數,求函數值.(3)經驗回歸方程的擬合效果可以利用相關系數判斷,當|r|越趨近于1時,兩變量的線性相關性越強.【復盤訓練】(23-24高二下·吉林長春·階段練習)14.用模型擬合一組數,若,,設,得變換后的線性回歸方程為,則( )A.20240 B. C. D.2024(23-24高三下·山東·開學考試)15.為研究某池塘中水生植物的覆蓋水塘面積(單位:)與水生植物的株數(單位:株)之間的相關關系,收集了4組數據,用模型去擬合與的關系,設與的數據如表格所示:得到與的線性回歸方程,則( )3 4 6 72 2.5 4.5 7A.-2 B.-1 C. D.(23-24高三上·內蒙古呼和浩特·期末)16.用模型擬合一組數據組,其中,設,得變換后的線性回歸方程為,則( )A. B. C.35 D.21(23-24高二下·河南駐馬店·階段練習)17.以曲線擬合一組數據時,經代換后的線性回歸方程為,則 , .(21-22高三上·四川成都·期末)18.為幫助鄉村脫貧,某勘探隊計劃了解當地礦脈某金屬的分布情況,測得了平均金屬含量(單位:)與樣本對原點的距離(單位:m)的數據,并作了初步處理,得到了下面的一些統計理的值.(表中,)6 97.90 0.21 60 0.14 14.12 26.13(1)利用樣本相關系數的知識,判斷與哪一個更適宜作為平均金屬含量關于樣本對原點的距離的回歸方程類型?(2)根據(1)的結果回答下列問題:①建立關于的回歸方程;②樣本對原點的距離時,金屬含量的預報值是多少?附:對于一組數據,其線性相關系數,其回歸直線的斜率和截距的最小二乘估計分別為:,.(23-24高三上·湖南衡陽·階段練習)19.為了加快實現我國高水平科技自立自強,某科技公司逐年加大高科技研發投入.下圖1是該公司2013年至2022年的年份代碼x和年研發投入y(單位:億元)的散點圖,其中年份代碼1 10分別對應年份2013 2022. 根據散點圖,分別用模型①,②作為年研發投入y(單位:億元)關于年份代碼x的經驗回歸方程模型,并進行殘差分析,得到圖2所示的殘差圖.結合數據,計算得到如下表所示的一些統計量的值:75 2.25 82.5 4.5 120 28.35表中,.(1)根據殘差圖,判斷模型①和模型②哪一個更適宜作為年研發投入y(單位:億元)關于年份代碼x的經驗回歸方程模型 并說明理由;(2)(i)根據(1)中所選模型,求出y關于x的經驗回歸方程;(ii)設該科技公司的年利潤(單位:億元)和年研發投入y(單位:億元)滿足(且),問該科技公司哪一年的年利潤最大 附:對于一組數據,,…,,其經驗回歸直線的斜率和截距的最小二乘估計分別為,.(2024·甘肅·一模)20.下表是2017年至2021年連續5年全國研究生在學人數的統計表:年份序號 1 2 3 4 5人數(萬人) 263 273 286 314 334(1)現用模型作為回歸方程對變量與的關系進行擬合,發現該模型的擬合度很高.請計算該模型所表示的回歸方程(與精確到0.01);(2)已知2021年全國碩士研究生在學人數約為267.2萬人,某地區在學碩士研究生人數占該地在學研究生的頻率值與全國的數據近似.當年該地區要在本地區在學研究生中進行一項網絡問卷調查,每位在學研究生均可進行問卷填寫.某天某時段內有4名在學研究生填寫了問卷,X表示填寫問卷的這4人中碩士研究生的人數,求X的分布列及數學期望.參考公式及數據:對于回歸方程試卷第1頁,共3頁試卷第1頁,共3頁參考答案:1.C【分析】利用散點圖,結合相關系數的知識可得答案.【詳解】由題意可知,變量的散點圖中,隨的增大而增大,所以變量與呈現正相關;再分別觀察兩個散點圖,圖比圖點更加集中,相關性更好,所以線性相關系數.故選:C.2.B【分析】令,則,因為滿足,故可求出,結合條件即可求得.【詳解】由,得,令,則,由題意因為滿足,所以,解得,所以,所以,令,解得.故選:B3.B【分析】從圖中分析得到去掉點后,回歸效果更好,再由決定系數,殘差平方和,相關系數和相關性的概念和性質作出判斷.【詳解】從圖中可以看出點較其他點,偏離直線遠,故去掉點后,回歸效果更好,故決定系數會變大,更接近于1,殘差平方和變小,相關系數的絕對值,即會更接近于1,由圖可得與正相關,故會更接近于1,即相關系數的值變大,解釋變量與預報變量相關性變強,故A、C、D錯誤,B正確.故選:B.4.D【分析】根據相關系數的概念逐一判斷.【詳解】對于A:去掉圖中右下方的點后,根據圖象,兩個變量還是負相關,A錯誤;對于BCD:去掉圖中右下方的點后,相對來說數據會集中,相關程度會更高,但因為是負相關,相關系數會更接近線性相關系數會變小,故D正確,BC錯誤.故選:D.5.A【分析】根據回歸直線必過樣本中心點求解即可.【詳解】因為,,所以,解得,故選:A6.D【分析】由x與y的線性回歸方程中x系數的正負可判斷選項A;把代入回歸直線方程算出的值可判斷選項B;先根據表格中的數據求出樣本中心點,再將其代入線性回歸方程,解之即可得m的值,從而判斷C,D.【詳解】解:由x與y的線性回歸方程可知,,變量x,y之間呈現負相關關系,即A錯誤;當時,,即B錯誤;由表中數據可知,,,根據樣本中心點必在線性回歸方程上,有,解得,即C錯誤;,,樣本中心點為,即D正確.故選:D.【點睛】本題考查結尾回歸直線方程,線性回歸直線必定數據的中心點,用回歸直線方程可對結論進行預測,要注意預測值不是確定的結果.7.AC【分析】散點圖的特點是單調遞增,增長速度越來越慢,且,根據特點對選項一一判斷即可.【詳解】散點圖的特點是單調遞增,增長速度越來越慢,且對A選項,符合散點圖的特點;對B選項,有不符合散點圖的特點;對C選項,符合散點圖的特點;對D選項,的增長速度不變,不符合散點圖的特點;故選:AC8.ACD【分析】根據分層抽樣的定義及等高條形圖的特點即可得出的列聯表中的數據,利用列聯表中的數據計算觀測值,再跟臨界值進行比較即可求解.【詳解】由題可知,抽取男生人數為人,女生抽取的人數人,由等高條形圖知,抽取男生感興趣的人數為人,抽取男生不感興趣的人數為人,抽取女生感興趣的人數為人,抽取女生不感興趣的人數為人,的列聯表如下性別 數學興趣 合計感興趣 不感興趣女生男生合計 100由此表可知,,故A正確;女生不感興趣的人數約為人,男生不感興趣的人數約為人,所以估計該校高一新生中對數學不感興趣的女生人數比男生少,故B 錯誤;零假設為:性別與對數學的興趣沒有差異依據小概率值的獨立性檢驗,有充分證據推斷不成立,因此可以認為不成立,即可以認為性別與對數學的興趣有差異;故C正確;零假設為:性別與對數學的興趣沒有差異依據小概率值的獨立性檢驗,沒有充分證據推斷不成立,因此可以認為成立,即可以認為性別與對數學的興趣沒有差異;故D正確.故選:ACD.9.【分析】根據散點圖的分布情況判斷可得.【詳解】由散點圖知,用擬合的效果比擬合的效果要好,所以,故較大者為.故答案為:10.10【分析】計算,代入回歸直線方程,與結合,求解出的值.【詳解】依題意,代入回歸直線方程得①,根據題意②,解①②組成的方程組得,故填.【點睛】本小題主要考查回歸直線方程過樣本中心點,考查方程的思想,屬于基礎題.11.答案見解析【分析】根據相關系數計算即可.【詳解】由折線圖中數據和附注中參考數據得=4,,,,.因為y與t的相關系數近似為0.99,說明y與t的線性相關程度相當高,從而可以用線性回歸模型擬合y與t的關系.12.(1)(2)210分鐘,192名【分析】(1)先計算出,代入公式求出,得到線性回歸方程;(2)代入,求出,計算出所花時間為分鐘,頻率分布直方圖分析出有的跑者成績超過該跑者,從而求出答案.【詳解】(1)由散點圖中數據和參考數據得,,,.關于的線性回歸方程為;(2)將代入,得.該跑者跑完馬拉松全程所花時間為分鐘.從馬拉松比賽的頻率分布直方圖可知成績好于210分鐘的累計頻率為:,有的跑者成績超過該跑者.則該跑者在本次比賽獲得名次大約是名.13.(1)0.896;(2)(i);(ii)181.【分析】(1)由二項分布的概率公式即可求解;(2)(i)根據所給數據直接代入公式計算出即可得回歸方程;(ii)根據題意表示出,然后求導,利用導數即可求解.【詳解】(1)因為每天的出租率為0.2,所以每天閑置的概率為,所以3天中至少有2天閑置的概率.(2)(i)根據散點圖的分布情況,各散點連線更貼近的圖象,故的擬合效果更好.依題意,,,所以,所以,所以經驗回歸方程為.(ii)設旅游淡季民宿租金為,則淡季該民宿的出租率,所以該民宿在這280天的收益為:,所以.令,得,所以,且當時,,時,,所以在上單調遞增,在上單調遞減,所以當時,取得最大值.所以旅游淡季民宿租金定為181元時,該民宿在這280天的收益達到最大.14.C【分析】先計算,代入線性回歸方程求得,再計算即可.【詳解】由條件可知,代入,則,故C正確.故選:C15.C【分析】根據已知條件,求得,進而代入回歸方程可求得,從而得出,聯立,即可求得本題答案.【詳解】由已知可得,,,所以,有,解得,所以,,由,得,所以,,則.故選:C.16.B【分析】求出,即,得到答案.【詳解】由題意得,故,即,故,解得.故選:B17. 3【分析】利用對數的運算法則結合回歸方程求解即可.【詳解】因為,所以=,令,則,又因為,所以,則.故答案為:.18.(1)更適宜;(2)①;②【分析】(1)分別求出與所對應的線性相關系數,然后比較大小即可判斷.(2)根據數據和公式即可求得關于的回歸方程,根據回歸方程代入,即可求出金屬含量的預報值.【詳解】(1)由題的線性相關系數,的線性相關系數,因為,所以,所以更適宜作為平均金屬含量關于樣本對原點的距離的回歸方程類型.(2)①由(1),令,,則,所以,,則,即.②當時,金屬含量的預報值19.(1)選擇模型②更適宜,理由見解析(2)(i);(ii)該公司2028年的年利潤最大【分析】(1)根據殘差圖確定;(2)根據最小二乘法求非線性回歸方程即可求解;【詳解】(1)根據圖2可知,模型①的殘差波動性很大,說明擬合關系較差;模型②的殘差波動性很小,基本分布在0的附近,說明擬合關系很好,所以選擇模型②更適宜.(2)(i)設,所以,所以,,所以關于的經驗回歸方程為(ii)由題設可得,當取對稱軸即,即時,年利潤L有最大值,故該公司2028年的年利潤最大.20.(1)(2)分布列見解析,3.2人.【分析】(1)令,轉化為線性回歸方程的求法,代入公式計算即可;(2)根據題意,按公式計算概率得到分布列和期望即可.【詳解】(1)可令,則與成線性回歸關系,則的對應關系如下圖:4 9 16 25 36263 273 286 314 334根據公式可得,則,,則,,所以,,則.(2)可求得該地區碩士研究生在學生數占總在學研究生人數的頻率值為,可知,因此隨機變量的分布列如下:0 1 2 3 4(人).答案第1頁,共2頁答案第1頁,共2頁第八章 成對數據的統計分析第二課 提煉本章思想題型一 數形結合思想例1下圖是某地區2000年至2016年環境基礎設施投資額y(單位:億元)的折線圖.為了預測該地區2018年的環境基礎設施投資額,建立了y與時間變量t的兩個線性回歸模型.根據2000年至2016年的數據(時間變量t的值依次為1,2,…,17)建立模型①:;根據2010年至2016年的數據(時間變量t的值依次為1,2,…,7)建立模型②:.(1)分別利用這兩個模型,求該地區2018年的環境基礎設施投資額的預測值.(2)你認為用哪個模型得到的預測值更可靠?并說明理由.【思路分析】(1)兩個線性回歸方程中無參數,所以分別求2018年所對應的函數值即得結果;(2)根據折線圖知2000年到2009年,與2010年到2016年間直線有明顯區別,且2010年到2016年的增幅明顯高于2000年到2009年的增幅,也高于模型①的增幅,因此用模型②能更好地得到2018年的預測值.【解】(1)利用模型①,該地區2018年的環境基礎設施投資額的預測值為(億元).利用模型②,該地區2018年的環境基礎設施投資額的預測值為(億元).(2)利用模型②得到的預測值更可靠.理由如下:(ⅰ)從折線圖可以看出,2000年至2016年的數據對應的點沒有隨機散布在直線上下,這說明利用2000年至2016年的數據建立的線性模型①不能很好地描述環境基礎設施投資額的變化趨勢.2010年相對2009年的環境基礎設施投資額有明顯增加,2010年至2016年的數據對應的點位于一條直線的附近,這說明從2010年開始環境基礎設施投資額的變化規律呈線性增長趨勢,利用2010年至2016年的數據建立的線性模型可以較好地描述2010年以后的環境基礎設施投資額的變化趨勢,因此利用模型②得到的預測值更可靠.(ⅱ)從計算結果看,相對于2016年的環境基礎設施投資額220億元,由模型①得到的預測值226.1億元的增幅明顯偏低,而利用模型②得到的預測值的增幅比較合理,說明利用模型②得到的預測值更可靠.(以上給出了2種理由,答出其中任意一種或其他合理理由均可)【方法總結】數形結合“以形助數”和“以數輔形”.若已知線性回歸方程,則可以直接將數值代入求得特定要求下的預測值;若線性回歸方程有待定參數,則根據線性回歸直線恒過點求參數.【變式訓練1-1】[課標全國Ⅰ文2020·5,5分]1.某校一個課外學習小組為研究某作物種子的發芽率y和溫度x(單位:°C)的關系,在20個不同的溫度條件下進行種子發芽實驗,由實驗數據得到下面的散點圖:由此散點圖,在10°C至40°C之間,下面四個回歸方程類型中最適宜作為發芽率y和溫度x的回歸方程類型的是( )A. B.C. D.【變式訓練1-2】(23-24高二下·陜西西安·階段練習)2.近年來,長安區大力發展大花卉產業,其中玫瑰既有觀賞價值也能加工成食品和高檔化妝品而得到環山路一帶農民大面種植.已知玫瑰的株高y(單位:cm)與一定范圍內的溫度x(單位:)有關,現收集了玫瑰的13組觀測數據,得到如下的散點圖:現根據散點圖利用或建立y關于x的回歸方程,令,得到如下數據:10.15 109.94 3.04 0.1613.94 11.67 0.21 21.22且與的相關系數分別為,,且.(1)用相關系數說明哪種模型建立y與x的回歸方程更合適;(2)根據(1)的結果及表中數據,建立y關于x的回歸方程;(3)已知玫瑰的利潤z與x、y的關系為,當x為何值時,z的預期最大.參考數據和公式:,,,對于一組數據,其回歸直線方程的斜率和截距的最小二乘法估計分別為,,相關系數.【變式訓練1-3】(2024·遼寧·模擬預測)3.土壤食物網對有機質的分解有兩條途徑,即真菌途徑和細菌途徑.在不同的土壤生態系統中,由于提供能源的有機物其分解的難易程度不同,這兩條途徑所起的作用也不同.以細菌分解途徑為主導的土壤,有機質降解快,氮礦化率高,有利于養分供應,以真菌途徑為主的土壤,氮和能量轉化比較緩慢,有利于有機質存財和氮的固持.某生物實驗小組從一種土壤數據中隨機抽查并統計了8組數據,如下表所示:編號 1 2 3 4 5 6 7 8細菌百萬個 70 80 90 100 110 120 130 140真菌百萬個 8.0 10.0 12.5 15.0 17.5 21.0 27.0 39.0其散點圖如下,散點大致分布在指數型函數的圖象附近.(1)求關于的經驗回歸方程(系數精確到0.01);(2)在做土壤相關的生態環境研究時,細菌與真菌的比值能夠反映土壤的碳氮循環.以樣本的頻率估計總體分布的概率,若該實驗小組隨機抽查8組數據,再從中任選4組,記真菌(單位:百萬個)與細菌(單位:百萬個)的數值之比位于區間內的組數為,求的分布列與數學期望.附:經驗回歸方程的斜率和截距的最小二乘估計公式分別為,題型二 函數方程思想例2(23-24高三下·四川綿陽·階段練習)某車間加工零件的數量與加工時間的統計數據如表:零件數(個) 18 20 22加工時間(分) 27 33現已求得上表數據的回歸方程中的值為0.9,則據此回歸模型可以預測,加工100個零件所需要的加工時間約為102分鐘,則的值為( )A.28 B.29 C.30 D.32【答案】C【分析】根據題意求得,再結合線性回歸方程過樣本中心點運算求解.【詳解】由題意可知:,且當時,,解得,可知,又因為,可知點在上,即,解得.故選:C.【方法總結】1.方程的思想,就是分析數學問題中變量間的等量關系,建立方程或方程組,或者構造方程,通過解方程或方程組,或者運用方程的性質去分析、轉化問題,使問題獲得解決.2.函數的思想,是用運動和變化的觀點,分析和研究數學中的數量關系,是對函數概念的本質認識,建立函數關系或構造函數,運用函數的圖象和性質去分析問題、轉化問題,從而使問題獲得解決.經常利用的性質是單調性、奇偶性、周期性、最大值和最小值、圖象變換等.【變式訓練2-1】(2024·陜西西安·一模)4.已知變量,之間的一組相關數據如下表所示:6 8 10 126 3 2據此得到變量,之間的線性回歸方程為,則下列說法不正確的是( )A.變量,之間成負相關關系 B.可以預測,當時,C. D.該回歸直線必過點【變式訓練2-2】(23-24高三下·重慶·開學考試)5.當前,人工智能技術以前所未有的速度迅猛發展,并逐步影響我們的方方面面,人工智能被認為是推動未來社會發展和解決人類面臨的全球性問題的重要手段.某公司在這個領域逐年加大投入,以下是近年來該公司對產品研發年投入額(單位:百萬元)與其年銷售量y(單位:千件)的數據統計表.1 2 3 4 5 61 1.5 3 6 12(1)公司擬分別用①和②兩種方案作為年銷售量關于年投入額的回歸分析模型,請根據已知數據,確定方案①和②的經驗回歸方程;(計算過程保留到小數點后兩位,最后結果保留到小數點后一位)(2)根據下表數據,用決定系數(只需比較出大小)比較兩種模型的擬合效果哪種更好,并選擇擬合精度更高的模型,預測年投入額為百萬元時,產品的銷售量是多少 經驗回歸方程殘差平方和參考公式及數據:,,,,,,,, .試卷第1頁,共3頁試卷第1頁,共3頁參考答案:1.D【分析】根據散點圖的分布可選擇合適的函數模型.【詳解】由散點圖分布可知,散點圖分布在一個對數函數的圖象附近,因此,最適合作為發芽率和溫度的回歸方程類型的是.故選:D.【點睛】本題考查函數模型的選擇,主要觀察散點圖的分布,屬于基礎題.2.(1)模型更合適(2)(3)當溫度為時,z的預期最大【分析】(1)求出,比較的大小即可判斷哪個模型更合適;(2)直接根據回歸方程的公式求解即可;(3)先寫出利潤函數,再利用基本不等式求最值以及最值的成立條件.【詳解】(1)由已知,則,所以利用模型建立y關于x的回歸方程更合適;(2)由(1)得,,則y關于x的回歸方程為;(3)由已知,利潤函數,由基本不等式,當且僅當,即時等號成立,所以當溫度為時,z的預期最大.3.(1)(2)分布列見解析,2【分析】(1)令,將指數型回歸方程轉化為線性回歸方程,利用最小二乘法的估計系數公式,即可求得答案;(2)確定真菌與細菌的數值之比位于區間內的組數,即可確定X的取值,求出每個值對應的概率,即可得分布列,即可求得數學期望.【詳解】(1)由于,故,令,則,,則,,故,則關于的經驗回歸方程為;(2)由已知圖表可知從第1組到第8組的真菌(單位:百萬個)與細菌(單位:百萬個)的數值之比依次為:,,故樣本中比值位于內的組數有4組,則X的可能取值為:,則,,故X的分布列為:X 0 1 2 3 4P則.4.C【分析】由,可判斷A正確;當時,得到的預測值,可判定B正確;由表格中的數據,求得樣本中心,代入求得的值,可判定C不正確;由,求得,可判定D正確.【詳解】對于A中,由,可得變量之間呈現負相關關系,所以A正確;對于B中,當,可得,所以B正確;對于C中,由表格中的數據,可得,則,解得,所以C不正確;對于D中,由,可得,所以該回歸直線必經過點,所以D正確.故選:C.5.(1),(2)②的擬合效果好,預測銷售量是千件【分析】(1)根據經驗回歸方程的求法求得正確答案.(2)通過計算決定系數確定擬合效果較好的方案,并由此進行預測.【詳解】(1),所以,所以.由,兩邊取以為底的對數得,即,,所以,所以.(2),對于,;對于,,所以②的擬合效果好,當時,預測值千件.答案第1頁,共2頁答案第1頁,共2頁 展開更多...... 收起↑ 資源列表 第八章成對數據的統計分析總結第二練數學思想訓練.docx 第八章成對數據的統計分析總結第二課提煉本章思想.docx 縮略圖、資源來源于二一教育資源庫