資源簡介 第八章 成對數據的統計分析第三練 方法提升應用【試題來源】來自各地期中期末的聯考試題,進行整理和改編;【試題難度】本次訓練試題難度較大,適合學完第三課后,起到提升解題能力和素養的目的.【目標分析】1.利用一元回歸模型對實際問題進行決策,培養數據分析、數學建模、數學運算,如第3題.2.利用獨立性檢驗對實際問題進行決策,鍛煉數學建模能力,運算求解能力,如第1題.一、解答題(23-24高三下·湖南湘潭·階段練習)1.2023年8月8日是我國第15個“全民健身日”,設立全民健身日(FitnessDay)是適應人民群眾體育的需求,促進全民健身運動開展的需要.某學校為了提高學生的身體素質,舉行了跑步競賽活動,活動分為長跑 短跑兩類項目,且該班級所有同學均參加活動,每位同學選擇一項活動參加.長跑 短跑男同學 30 10女同學 10若采用分層抽樣按性別從該班級中抽取6名同學,其中有男同學4名,女同學2名.(1)求的值以及該班同學選擇長跑的概率;(2)依據小概率值的獨立性檢驗,能否推斷選擇跑步項目的類別與其性別有關?附:,其中.0.05 0.01 0.0013.841 6.635 10.828(2024·全國·模擬預測)2.按照男女生比例,某學校隨機抽取了70名男生,50名女生,檢測他們的視力情況,得到下面列聯表:性別 視力情況近視 不近視男生 30女生 40(1)根據上表,分別估計這所學校男生、女生近視的概率;(2)能否有的把握認為近視與性別有關?附:,其中.0.10 0.05 0.010 0.005 0.0012.706 3.841 6.635 7.879 10.828(22-23高二上·四川攀枝花·期末)3.攀枝花屬于亞熱帶季風氣候區,水果種類豐富.其中,“紅格臍橙”已經“中華人民共和國農業部2010年第1364號公告”予以登記,根據其種植規模與以往的種植經驗,產自該果園的單個“紅格臍橙”的果徑(最大橫切面直徑,單位:)在正常環境下服從正態分布.(1)一顧客購買了10個該果園的“紅格臍橙”,求會買到果徑小于的概率;(2)為了提高利潤,該果園每年投入一定的資金,對種植、采摘、包裝、宣傳等環節進行改進.如圖是2013年至2022年(單位:萬元)與年利潤增量y(單位:萬元)的散點圖: 該果園為了預測2023年投資金額為20萬元時的年利潤增量,建立了關于的兩個回歸模型;模型①:由最小二乘公式可求得與的線性回歸方程:;模型②:由圖中樣本點的分布,可以認為樣本點集中在曲線:的附近.對投資金額做交換,令,且有,,,.(ⅰ)根據所給的統計量,求模型②中關于的回歸方程;(ⅱ)根據下列表格中的數據,比較兩種模型的相關指數R2,并選擇擬合精度更高、更可靠的模型,預測投資金額為20萬元時的年利潤增量(結果保留兩位小數).回歸模型 模型① 模型②回歸方程102.28 36.19附:若隨機變量,則,;樣本()的最小二乘估計公式為,;相關指數.參考數據:,,,.(2024·上海·一模)4.為幫助鄉村脫貧,某勘探隊計劃了解當地礦脈某金屬的分布情況,測得了平均金屬含量(單位:克每立方米)與樣本對原點的距離(單位:米)的數據,并作了初步處理,得到了下面的一些統計量的值.(表中).6 97.90 0.21 240 0.14 14.12 26.13(1)利用相關系數的知識,判斷與哪一個更適宜作為平均金屬含量關于樣本對原點的距離的回歸方程類型;(2)根據(1)的結果建立關于的回歸方程,并估計樣本對原點的距離米時,平均金屬含量是多少?(23-24高二上·江西南昌·期末)5.新冠肺炎疫情發生以來,中醫藥全面參與疫情防控救治,做出了重要貢獻.某中醫藥企業根據市場調研與模擬,得到研發投入(億元)與產品收益(億元)的數據統計如下:研發投入x(億元) 1 2 3 4 5產品收益y(億元) 3 7 9 10 11(1)計算的相關系數,并判斷是否可以認為研發投入與產品收益具有較高的線性相關程度?(若,則線性相關程度一般,若,則線性相關程度較高)(2)求出關于的線性回歸方程,并預測若想收益超過50(億元)則需研發投入至少多少億元?(結果保留一位小數)參考數據:;附:相關系數公式:;回歸直線方程的斜率.(2024·全國·模擬預測)6.將氫儲存在甲基環乙烷和甲苯等有機液體中是儲氫和運輸氫的重要方向.2023年12月俄羅斯科學院西伯利亞分院科研人員用鎳和錫取代鉑,研發出一種新型高效的脫氫催化劑,脫氫效率達,且對儲氫載體沒有破壞作用,可重復使用.近年來,我國氫能源汽車產業迅速發展,下表是某市氫能源乘用車的年銷售量與年份的統計表:年份 2018 2019 2020 2021 2022銷量(萬臺) 2 3.5 2.5 8 9(1)求氫能源乘用車的銷量關于年份的線性回歸方程,并預測2024年氫能源乘用車的銷量;(2)為了研究不同性別的學生對氫能源的了解情況,某校組織了一次有關氫能源的知識競賽活動,隨機抽取了男生和女生各60名,得到如表所示的數據:了解 不了解 合計男生 25女生 20合計(ⅰ)根據已知條件,填寫上述列聯表;(ⅱ)依據的獨立性檢驗,能否認為該校學生對氫能源的了解情況與性別有關?參考公式:1.回歸方程中斜率和截距的最小二乘法估計公式分別為;2..0.050 0.010 0.0013.841 6.635 10.828(23-24高二下·陜西西安·階段練習)7.近年來,長安區大力發展大花卉產業,其中玫瑰既有觀賞價值也能加工成食品和高檔化妝品而得到環山路一帶農民大面種植.已知玫瑰的株高y(單位:cm)與一定范圍內的溫度x(單位:)有關,現收集了玫瑰的13組觀測數據,得到如下的散點圖:現根據散點圖利用或建立y關于x的回歸方程,令,得到如下數據:10.15 109.94 3.04 0.1613.94 11.67 0.21 21.22且與的相關系數分別為,,且.(1)用相關系數說明哪種模型建立y與x的回歸方程更合適;(2)根據(1)的結果及表中數據,建立y關于x的回歸方程;(3)已知玫瑰的利潤z與x、y的關系為,當x為何值時,z的預期最大.參考數據和公式:,,,對于一組數據,其回歸直線方程的斜率和截距的最小二乘法估計分別為,,相關系數.(2024·云南紅河·二模)8.某網絡購物平臺專營店統計了某年2月15日至19日這5天在該店購物的人數(單位:人)的數據如下表:日期 2月15日 2月16日 2月17日 2月18日 2月19日日期代號 1 2 3 4 5購物人數 77 84 93 96 100(1)根據表中數據,建立關于的一元線性回歸模型,并根據該回歸模型預測當年2月21日在該店購物的人數(人數用四舍五入法取整數);(2)為了了解參加網購人群的年齡分布,該店隨機抽取了200人進行問卷調查.得到如下所示不完整的列聯表:年齡 不低于40歲 低于40歲 合計參與過網上購物 30 150未參與過網上購物 30合計 200將列聯表補充完整,并依據表中數據及小概率值的獨立性檢驗,能否認為“參與網上購物”與“年齡”有關.附:回歸直線的斜率和截距的最小二乘估計公式分別為0.10 0.05 0.010 0.005 0.0012.706 3.841 6.635 7.879 10.828(23-24高三上·江蘇蘇州·階段練習)9.某學校研究性學習小組在學習生物遺傳學的過程中,為驗證高爾頓提出的關于兒子成年后身高(單位:)與父親身高(單位:)之間的關系及存在的遺傳規律,隨機抽取了5對父子的身高數據,如下表:父親身高 160 170 175 185 190兒子身高 170 174 175 180 186參考數據及公式:,,,,,(1)根據表中數據,求出y關于x的線性回歸方程,并利用回歸直線方程分別確定兒子比父親高和兒子比父親矮的條件,由此可得到怎樣的遺傳規律?(2)記,,其中為觀測值,為預測值,為對應的殘差.求(1)中兒子身高的殘差的和、并探究這個結果是否對任意具有線性相關關系的兩個變量都成立?若成立加以證明;若不成立說明理由.(2023·山東濰坊·模擬預測)10.某地區未成年男性的身高(單位:cm)與體重平均值(單位:kg)的關系如下表1:表1 未成年男性的身高與體重平均值身高/cm 60 70 80 90 100 110 120 130 140 150 160 170體重平均值/kg直觀分析數據的變化規律,可選擇指數函數模型、二次函數模型、冪函數模型近似地描述未成年男性的身高與體重平均值之間的關系.為使函數擬合度更好,引入擬合函數和實際數據之間的誤差平方和、擬合優度判斷系數(如表2).誤差平方和越小、擬合優度判斷系數越接近1,擬合度越高.表2 擬合函數對比函數模型 函數解析式 誤差平方和指數函數二次函數冪函數(1)問哪種模型是最優模型?并說明理由;(2)若根據生物學知識,人體細胞是人體結構和生理功能的基本單位,是生長發育的基礎.假設身高與骨細胞數量成正比,比例系數為;體重與肌肉細胞數量成正比,比例系數為.記時刻的未成年時期骨細胞數量,其中和分別表示人體出生時骨細胞數量和增長率,記時刻的未成年時期肌肉細胞數量,其中和分別表示人體出生時肌肉細胞數量和增長率.求體重關于身高的函數模型;(3)在(2)的條件下,若,.當剛出生的嬰兒身高為50cm時,與(1)的模型相比較,哪種模型跟實際情況更符合,試說明理由.注:,;嬰兒體重符合實際,嬰兒體重較符合實際,嬰兒體重不符合實際.(23-24高三上·湖南衡陽·階段練習)11.為了加快實現我國高水平科技自立自強,某科技公司逐年加大高科技研發投入.下圖1是該公司2013年至2022年的年份代碼x和年研發投入y(單位:億元)的散點圖,其中年份代碼1 10分別對應年份2013 2022. 根據散點圖,分別用模型①,②作為年研發投入y(單位:億元)關于年份代碼x的經驗回歸方程模型,并進行殘差分析,得到圖2所示的殘差圖.結合數據,計算得到如下表所示的一些統計量的值:75 2.25 82.5 4.5 120 28.35表中,.(1)根據殘差圖,判斷模型①和模型②哪一個更適宜作為年研發投入y(單位:億元)關于年份代碼x的經驗回歸方程模型 并說明理由;(2)(i)根據(1)中所選模型,求出y關于x的經驗回歸方程;(ii)設該科技公司的年利潤(單位:億元)和年研發投入y(單位:億元)滿足(且),問該科技公司哪一年的年利潤最大 附:對于一組數據,,…,,其經驗回歸直線的斜率和截距的最小二乘估計分別為,.(22-23高二下·江西吉安·期末)12.某鄉鎮為了提高鄉鎮居民收入,對山區進行大面積指導農民種植黃茋、黨參、當歸等藥材,同時在種植藥材附近種植草,讓牛羊吃,發展畜牧業,第二年將種植藥材的地改種草讓牛羊吃,將牛羊吃過的草地改種藥材,這樣藥材的生長主要依靠牛羊等有機肥來供給,提高藥效,同時增加農民的經濟收入.現將該鄉鎮某農戶近7年(2016-2022年對應年份代碼1-7)的種植藥材的收入金額繪成折線圖,同時統計出相關數據:,,,,.(1)根據圖中所給出的折線圖,判斷和哪一個更適合作為回歸模型;(給出判斷即可,不必說明理由)(2)求相關系數(保留兩位小數)并求藥材種植收入關于年份代碼的回歸直線方程;(3)若在生物學上將在藥材附近同時種植草稱作間作,將藥材和草每年輪流種植稱作輪作,根據題目所給信息,分析這兩種種植方式對當地居民收入的影響.附:相關系數,回歸直線方程中斜率和截距的最小二乘估計公式分別為,.試卷第1頁,共3頁試卷第1頁,共3頁參考答案:1.(1);(2)不能【分析】(1)先由分層抽樣得到男女同學的比例,從而求得,進而利用古典概型的概率公式即可得解;(2)利用(1)中結論,完善列聯表,再求得的值,從而得解.【詳解】(1)因為采用分層抽樣按性別從該班級中抽取6名同學,其中有男同學4名,女同學2名所以男女同學的比例為,則,故,該班同學選擇長跑的概率為.(2)依題意,完善列聯表,如下,長跑 短跑 總計男同學 30 10 40女同學 10 10 20總計 40 20 60零假設選擇跑步項目類別與學生性別無關,根據小概率值的獨立性檢驗,沒有充分證據推斷出不成立,因此可以認為成立,即認為選擇跑步項目類別與學生性別無關.2.(1),;(2)有.【分析】(1)由已知及表格中數據,求出男女生近視的頻率,再估計概率.(2)完善列聯表,再求出的觀測值,與臨界值表比對作答.【詳解】(1)依題意,樣本中男生近視的頻率為,所以估計這所學校男生近視的概率為;樣本中,近視的女生有10名,女生近視的頻率為,所以估計這所學校女生近視的概率為.(2)因為抽取的男生有70人,女生有50人,列聯表如下:性別 視力情況 合計近視 不近視男生 30 40 70女生 10 40 50合計 40 80 120由列聯表中的數據得,所以有的把握認為近視與性別有關.3.(1);(2)(ⅰ);(ⅱ)模型②刻畫的擬合效果更好,當時,模型②的年利潤增量的預測值為萬元.【分析】(1)由正態分布的對稱性結合法則求解;(2)(ⅰ)由已知數據利用最小二乘法求解模型②中關于的回歸方程;(ⅱ)由已知表格中的數據,可得模型①的小于模型②,說明模型②刻畫的擬合效果更好,再由(ⅰ)中求得線性回歸方程求解.【詳解】(1)由題意,,,由正態分布曲線的對稱性可知,.設一顧客購買了10個該果園的“紅格臍橙”,其中果徑小于的有個,,故,∴一顧客購買了10個該果園的“紅格臍橙”,會買到果徑小于的概率為;(2)(ⅰ)由題中所給數據,可得,,,.∴模型②中關于的線性回歸方程為;(ⅱ)由表格中的數據,有,即,∴模型①的小于模型②,說明模型②刻畫的擬合效果更好.當時,模型②的年利潤增量的預測值為:萬元.4.(1)更適宜作為回歸方程類型;(2),.【分析】(1)根據題意,分別求得相關系數的值,結合和,結合,即可得到結論.(2)(i)根據最小二乘法,求得回歸系數,進而求得回歸方程;(ii)當時,結合回歸方程,即可求得預報值.【詳解】(1)因為的線性相關系數,的線性相關系數,因為,所以更適宜作為平均金屬含量關于樣本對原點的距離的回歸方程類型.(2)依題意,,則,于是,所以關于的回歸方程為.當時,金屬含量的預報值為.5.(1),相關程度較高(2);投入至少億元【分析】(1)直接通過計算相關系數來進行判斷;(2)先計算回歸直線方程,然后再做出預測.【詳解】(1),,,,所以,所以相關程度較高;(2)由(1)得,,所以,,所以,令,得,所以研發投入至少億元.6.(1),12.4萬臺;(2)(ⅰ)表格見解析;(ⅱ)該校學生對氫能源的了解情況與性別有關.【分析】(1)利用已知數據和公式求線性回歸方程,由方程進行數據預測;(2)(ⅰ)根據男生和女生各60名補全列聯表.(ⅱ)計算,與臨界值比較下結論.【詳解】(1)年份的平均數,銷量的平均數,所以,,所以,所以,所以氫能源乘用車的銷量關于年份的線性回歸方程為,令,得,所以預測2024年氫能源乘用車的銷量約為12.4萬臺.(2)(ⅰ)根據男生和女生各60名,補全列聯表為:了解 不了解 合計男生 35 25 60女生 20 40 60合計 55 65 120(ⅱ)零假設:該校學生對氫能源的了解情況與性別無關,根據列聯表中的數據可得,,依據的獨立性檢驗,可以推斷不成立,即該校學生對氫能源的了解情況與性別有關.7.(1)模型更合適(2)(3)當溫度為時,z的預期最大【分析】(1)求出,比較的大小即可判斷哪個模型更合適;(2)直接根據回歸方程的公式求解即可;(3)先寫出利潤函數,再利用基本不等式求最值以及最值的成立條件.【詳解】(1)由已知,則,所以利用模型建立y關于x的回歸方程更合適;(2)由(1)得,,則y關于x的回歸方程為;(3)由已知,利潤函數,由基本不等式,當且僅當,即時等號成立,所以當溫度為時,z的預期最大.8.(1),;(2)表格見解析,有關.【分析】(1)根據給定數表,求出相關量,再利用最小二乘法求出回歸方程,并作出估計即得.(2)完善列聯表,再求出的觀測值,與臨界值表比對作答.【詳解】(1)由表中數據可得,,,,則,,所以關于的一元線性回歸方程是,令,得,所以估計當年2月21日在該店購物的人數為人.(2)列聯表如下:年齡 不低于歲 低于歲 合計參與過網上購物未參與過網上購物合計 200零假設為:參加網上購物和年齡無關,根據數據,計算得到:,所以根據小概率的獨立性檢驗,我們推斷不成立,即認為參加網上購物和年齡有關,此推斷犯錯誤的概率不大于.9.(1),規律見解析(2)殘差和為0;成立,證明見解析【分析】(1)計算,,根據公式計算,,得到回歸方程,再根據不等式,,得到規律;(2)依次計算殘差得到殘差和,確定對任意具有線性相關關系的變量,再根據證明即可.【詳解】(1),,,,故回歸方程為:,取,解得,即時,兒子比父親高;取,解得,即時,兒子比父親矮;父親較高時,兒子平均身高要矮于父親,父親較矮時,兒子平均身高要高于父親,即兒子身高有一個回歸,回歸到全種群平均高度的趨勢.(2),;,;,;,;,;故殘差的和為.對任意具有線性相關關系的變量.證明如下:.10.(1)指數函數模型是最優模型;理由見解析(2)(3)(2)中冪函數模型更適合,理由見解析【分析】(1)由表中數據比較指數函數模型誤差平方和以及的大小,即得結論;(2)根據身高與骨細胞數量以及體重與肌肉細胞數量的關系,結合已知數據,即可求得答案;(3)分別計算出兩種模型函數下的嬰兒體重,比較大小,即得結論.【詳解】(1)因為,所以指數函數模型誤差平方和最小, 因為,所以指數函數模型最大, 所以指數函數模型是最優模型;(2)因為,所以,因為,所以,所以,所以體重關于身高的函數模型為;(3)把代入,得不符合實際,把,代入得,把代入,得符合實際,所以(2)中冪函數模型更適合.11.(1)選擇模型②更適宜,理由見解析(2)(i);(ii)該公司2028年的年利潤最大【分析】(1)根據殘差圖確定;(2)根據最小二乘法求非線性回歸方程即可求解;【詳解】(1)根據圖2可知,模型①的殘差波動性很大,說明擬合關系較差;模型②的殘差波動性很小,基本分布在0的附近,說明擬合關系很好,所以選擇模型②更適宜.(2)(i)設,所以,所以,,所以關于的經驗回歸方程為(ii)由題設可得,當取對稱軸即,即時,年利潤L有最大值,故該公司2028年的年利潤最大.12.(1)(2),(3)答案見解析【分析】(1)根據折線圖作出判斷即可;(2)根據相關系數公式計算可得,根據公式計算和可得回歸直線方程;(3)①間作:從土地的利用率和居民收入最大化進行分析;②輪作:從提高鄉鎮居民收入和提高土地的生態效益和經濟效益進行分析.【詳解】(1)因為折線圖更接近直線,所以更適合作為回歸模型.(2),,相關系數,根據題意,可得,,.種植藥材收入金額關于年份代碼的回歸直線方程為.(3)(答案不唯一,合理即可)①間作:藥材和草的間作一方面可以同時發展畜牧業來增加居民收入,另一方面可以實現土地的利用率,實現單位面積內經濟效益的最大化;②輪作:一方面牛羊糞等有機肥可以用來供給藥材的生長從而提高鄉鎮居民收入,另一方面可以調節土壤的肥沃能力,形成良性循環,進一步提高土地的生態效益和經濟效益.答案第1頁,共2頁答案第1頁,共2頁第八章 成對數據的統計分析第三課 匯總本章方法擴展1:利用一元回歸模型對實際問題進行決策例1.(23-24高二下·河南·階段練習)環境監測部門為調研汽車流量對空氣質量的影響,在某監測點統計每日過往的汽車流量(單位:輛)和空氣中的PM2.5的平均濃度(單位:).調研人員采集了50天的數據,制作了關于的散點圖,并用直線與將散點圖分成如圖所示的四個區域I,II,III,IV,落入對應區域的樣本點的個數依次為.(1)完成下面的列聯表,并判斷至少有多大把握認為“PM2.5平均濃度不小于”與“汽車日流量不小于1500輛”有關;汽車日流量 汽車日流量 合計PM2.5的平均濃度PM2.5的平均濃度合計(2)經計算得到回歸方程為,且這50天的汽車日流量的標準差252,PM2.5的平均濃度的標準差,求相關系數,并判斷該回歸方程是否有價值.參考公式:,其中.0.100 0.050 0.010 0.0012.706 3.841 6.635 10.828回歸方程,其中.相關系數.若,則認為與有較強的線性相關性.【答案】(1)列聯表見解析,至少有的把握(但還不能有的把握)認為“PM2.5平均濃度不小于”與“汽車日流量不小于1500輛”有關(2),該回歸方程有價值【分析】(1)列出列聯表后進行獨立性檢驗即可.(2)求出回歸方程后,再求出相關系數判斷相關性即可.【詳解】(1)列聯表如下:汽車日流量 汽車日流量 合計PM2.5的平均濃度 16 8 24PM2.5的平均濃度 6 20 26合計 22 28 50零假設:“PM2.5平均濃度不小于”與“汽車日流量不小于1500輛”無關,因為,所以至少有的把握(但還不能有的把握)認為“PM2.5平均濃度不小于”與“汽車日流量不小于1500輛”有關;(2)因為回歸方程為,所以,又因為,所以.與有較強的相關性,該回歸方程有價值.【方法總結】充分利用題目中提供的成對樣本數據(散點圖)做出判斷,確定是線性問題還是非線性問題.求解時要充分利用已知數據,合理利用變形公式,以達到快速準確運算的目的;利用經驗回歸方程進行預測,把經驗回歸方程看作一次函數,求函數值.經驗回歸方程的擬合效果可以利用相關系數判斷,當|r|越趨近于1時,兩變量的線性相關性越強.【舉一反三1-1】(2024·內蒙古包頭·二模)1.某企業擬對某產品進行科技升級,根據市場調研與模擬,得到科技升級投入(萬元)與科技升級直接收益(萬元)的數據統計如下:序號 1 2 3 4 5 6 72 3 4 6 8 10 1313 22 31 42 50 56 58根據表格中的數據,建立了與的兩個回歸模型:模型①:模型②:.(1)根據下列表格中的數據,比較模型① ②的相關指數的大小,并選擇擬合精度更高 更可靠的模型;(2)根據(1)選擇的模型,預測對該產品科技升級的投入為100萬元時的直接收益.回歸模型 模型① 模型②回歸方程182.4 79.2(附:刻畫回歸效果的相關指數越大,模型的擬合效果越好)【舉一反三1-2】(2024高三·全國·專題練習)2.現階段我國生活垃圾有填埋、焚燒、堆肥等三種處理方式,隨著我國生態文明建設的不斷深入,焚燒處理已逐漸成為主要方式.根據國家統計局公布的數據,對2013~2020年全國生活垃圾焚燒無害化處理廠的個數y(單位:座)進行統計,得到如下表格:年份 2013 2014 2015 2016 2017 2018 2019 2020年份代碼x 1 2 3 4 5 6 7 8垃圾焚燒無害化處理廠 的個數y 166 188 220 249 286 331 389 463(1)根據表格中的數據,可用一元線性回歸模型刻畫變量y與變量x之間的線性相關關系,請用相關系數加以說明(精確到0.01).(2)求出y關于x的線性回歸方程,并預測2022年全國生活垃圾焚燒無害化處理廠的個數.(3)對于2035年全國生活垃圾焚燒無害化處理廠的個數,還能用(2)所求的線性回歸方程預測嗎?請簡要說明理由.擴展2 :利用獨立性檢驗對實際問題進行決策例2.(23-24高三下·云南昆明·階段練習)近兩年來,自行車的市場占有率在不斷提升,隨著人們的健康意識不斷增強,騎自行車不僅僅是人們出行的交通方式,也漸漸成為一種新穎的運動,越來越多的人加入了騎行一族.在某地區隨機調查了100位自行車騎行者的年齡分布情況,得到如圖所示的樣本數據頻率分布直方圖.(1)數據顯示,該地區年齡在歲內的人口占比為12%,該地區自行車騎行率約為13%,從該地區任選一人,已知此人年齡在內,求此人是自行車騎行者的概率;(2)對這100位自行車騎行者進行統計,騎行頻率次/周的共有70人,其中年齡在40歲以下的占80%.請完成以下列聯表,并根據小概率值的獨立性檢驗,判斷騎行頻率與年齡是否有關聯.年齡騎行頻率 年齡 合計歲 歲次/周次/周合計附:,其中.0.050 0.010 0.0013.841 6.635 10.828【答案】(1)(2)列聯表見解析,有【分析】(1)結合頻率分布直方圖以及已知,由獨立乘法以及條件概率公式即可求解.(2)由頻率分布直方圖計算得各個分段的人數,完善列聯表,進而計算卡方,與臨界值比較大小,由此即可判斷.【詳解】(1)設A=“此人年齡在[內”,B=“此人是自行車騎行者”,則.(2)由頻率分布直方圖可得,這100位自行車騎行者中,年齡歲的共有(人),其中騎行頻率次/周的有(人),年齡歲的有26人,騎行頻率次/周的有(人),列聯表如下:騎行頻率 年齡 合計歲 歲次/周 18 12 30次/周 56 14 70合計 74 26 100零假設為:騎行頻率與年齡之間無關聯.根據列聯表中的數據,得,根據小概率值的獨立性檢驗,推斷不成立,即認為騎行頻率與年齡之間有關聯,此推斷犯錯誤的概率不大于0.05.【方法總結】獨立性檢驗與概率綜合問題的解題思路:本類題目以生活題材為背景,涉及獨立性檢驗及概率問題的綜合,解決該類問題首先收集數據列出2×2列聯表,并按照公式求得χ2的值后進行比較,其次再按照隨機變量滿足的概率模型求解.【舉一反三2-1】(2024高二下·江蘇·專題練習)3.考察小麥種子滅菌與否跟發生黑穗病的關系,經試驗觀察,得到數據如下表:種子滅菌 種子未滅菌 合計黑穗病 26 184 210無黑穗病 50 200 250合計 76 384 460試分析種子滅菌與小麥發生黑穗病是否有關?附:;P(χ2≥x0) 0.15 0.1 0.05 0.025x0 2.072 2.706 3.841 5.024【舉一反三2-2】(2023·山東青島模擬)4.為進一步保護環境,加強治理空氣污染,某市環保監測部門對市區空氣質量進行調研,隨機抽查了市區100天的空氣質量等級與當天空氣中SO2的濃度(單位:μg/m3),整理數據得到下表:SO2的濃度 空氣質量等級 [0,50] (50,150] (150,475]1(優) 28 6 22(良) 5 7 83(輕度污染) 3 8 94(中度污染) 1 12 11若某天的空氣質量等級為1或2,則稱這天“空氣質量好”;若某天的空氣質量等級為3或4,則稱這天“空氣質量不好”,根據上述數據,回答以下問題.(1)估計事件“該市一天的空氣質量好,且SO2的濃度不超過150”的概率;(2)完成下面的2×2列聯表,SO2的濃度 空氣質量 [0,150] (150,475] 總計空氣質量好空氣質量不好總計(3)根據(2)中的列聯表,能否有99%的把握認為該市一天的空氣質量與當天SO2的濃度有關?試卷第1頁,共3頁試卷第1頁,共3頁參考答案:1.(1)模型①的相關指數小于模型②的相關指數,即模型②的擬合效果精度更高 更可靠.(2)198.6【分析】(1)利用相關指數的定義判斷相關性即可.(2)將給定數值代入擬合模型中求預測值即可.【詳解】(1)由表格中的數據,,所以,模型①的相關指數小于模型②的相關指數,即模型②的擬合效果精度更高 更可靠.(2)當萬元時,科技升級直接收益的預測值為:(萬元)2.(1)答案見解析(2)=41.12x+101.46,個數為513(3)不能,理由見解析【詳解】解:(1)==,==,相關系數==≈≈0.98.因為y與x的相關系數r=0.98,接近1,所以y與x的線性相關程度很高,可用線性回歸模型擬合y與x的關系.(2) 由題知==≈41.12,≈-41.12×=101.46,所以y與x的線性回歸方程為=41.12x+101.46.又2 022年對應的年份代碼x=10,當x=10時,=41.12×10+101.46=512.66≈513,所以預測2022年全國生活垃圾焚燒無害化處理廠的個數為513.(3) 對于2035年全國生活垃圾焚燒無害化處理廠的個數,不能由(2)所求的線性回歸方程預測,理由如下(說出一點即可):①線性回歸方程具有時效性,不能預測較遠情況;②全國生活垃圾焚燒無害化處理廠的個數有可能達到上限,一段時間內不再新建;③受國家政策的影響,可能產生新的生活垃圾無害化處理方式3.有95%的把握認為種子滅菌與否與小麥發生黑穗病有關系【分析】根據獨立性檢驗的思想計算出的值,進一步分析即可.【詳解】提出假設 認為種子滅菌與否與小麥發生黑穗病無關系.由列聯表的數據可求得,而,當成立時,的概率約為0.05,所以我們有95%的把握認為種子滅菌與否與小麥發生黑穗病有關系.4.(1)0.46(2)列聯表見解析,(3)有99%的把握認為該市一天的空氣質量與當天SO2的濃度有關.【分析】(1)求出該市一天的空氣質量好,且的濃度不超過150的天數即可求出概率;(2)根據表中數據即可得出列聯表,(3)求出卡方值,和6.635比較即可判斷.【詳解】(1)由表格可知,該市一天的空氣質量好,且的濃度不超過150的天數為天,則該市一天的空氣質量好,且的濃度不超過150的概率為;(2)由表格數據可得列聯表如下, SO2的濃度 空氣質量 [0,150] (150,475] 總計空氣質量好 46 10 56空氣質量不好 24 20 44總計 70 30 100(3)由(2)知,所以有99%的把握認為該市一天的空氣質量與當天的濃度有關.答案第1頁,共2頁答案第1頁,共2頁 展開更多...... 收起↑ 資源列表 第八章成對數據的統計分析總結第三練方法提升應用.docx 第八章成對數據的統計分析總結第三課匯總本章方法.docx 縮略圖、資源來源于二一教育資源庫