資源簡介 (暑假練習08成對數據的統計分析)一、單選題.1.在吸煙與患肺病這兩個分類變量的計算中,下列說法正確的是( )A.若的觀測值為,我們有99%的把握認為吸煙與患肺病有關系,那么在100個吸煙的人中必有99人患有肺病B.若從統計量中求出有95%的把握認為吸煙與患肺病有關系,是指有5%的可能性使得推斷出現錯誤C.從獨立性檢驗可知有99%的把握認為吸煙與患肺病有關系時,我們說某人吸煙,那么他有99%的可能患有肺病D.以上三種說法都不正確2.對四組數據進行統計,獲得以下散點圖,關于其線性相關系數比較,正確的是( )A. B.C. D.3.某調查者在調查中獲知某公司近年來科研費用支出(萬元)與公司所獲得利潤(萬元)的統計資料如下表:序號 科研費用支出 利潤合計則利潤關于科研費用支出的經驗回歸方程為( )參考公式:,.A. B. C. D.4.某公司年月至月空調銷售完成情況如圖所示,其中為月份,為銷售量,下面四個回歸方程類型中,最適合作為銷售量和月份的回歸方程類型的是( )A. B. C. D.5.有兩個分類變量X,Y,其列聯表如下所示,a其中a,均為大于5的整數,若在犯錯誤的概率不超過的前提下認為X,Y有關,則a的值為( )A.8 B.9 C.8或9 D.6或86.下列有關線性回歸分析的六個命題:①在回歸直線方程中,當解釋變量x增加1個單位時,預報變量平均減少個單位②回歸直線就是散點圖中經過樣本數據點最多的那條直線③當相關性系數時,兩個變量正相關④如果兩個變量的相關性越強,則相關性系數r就越接近于1⑤殘差圖中殘差點所在的水平帶狀區域越寬,則回歸方程的預報精確度越高⑥甲、乙兩個模型的相關指數分別約為和,則模型乙的擬合效果更好其中真命題的個數為( )A.1個 B.2個 C.3個 D.4個7.已知變量y關于x的非線性經驗回歸方程為,其一組數據如下表所示:x 1 2 3 4y e若,則預測y的值可能為( )A. B. C. D.二、多選題.8.下列結論正確的是( )A.函數關系是一種確定性關系B.相關關系是一種非確定性關系C.在研究身高與年齡的關系時,散點圖中可用橫軸表示年齡,縱軸表示身高D.散點圖能準確反映變量間的關系9.設某大學的女生體重(單位:kg)與身高(單位:cm)具有線性相關關系,根據一組樣本數據,用最小二乘法建立的回歸直線方程為,則下列結論中正確的是( )A.與具有正的線性相關關系B.若該大學女生的平均身高為,則平均體重約為C.若該大學某女生身高增加,則其體重約增加D.若該大學某女生身高為,則可斷定其體重必為10.下列說法,其中正確的是( )A.對于獨立性檢驗,的值越大,說明兩事件相關程度越大B.以模型去擬合一組數據時,為了求出回歸方程,設,將其變換后得到線性方程,則c,k的值分別是和C.某中學有高一學生400人,高二學生300人,高三學生200人,學校團委欲用分層抽樣的方法抽取18名學生進行問卷調查,則高一學生被抽到的概率最大D.通過回歸直線及回歸系數可以精確反映變量的取值和變化趨勢11.為了增強學生的身體素質,提高適應自然環境、克服困難的能力,某校在課外活動中新增了一項登山活動,并對“學生喜歡登山和性別是否有關”做了一次調查,得到如圖所示的等高條形統計圖,則下列說法中正確的有( )A.被調查的學生中喜歡登山的男生人數比不喜歡登山的女生人數多B.被調查的男生中喜歡登山的人數比不喜歡登山的人數多C.是否有99%的把握認為喜歡登山和性別有關不會受到被調查的男女生人數影響D.是否有99%的把握認為喜歡登山和性別有關會受到被調查的男女生人數影響12.在檢驗A與B是否有關的過程中,根據所得數據算得的值,則下列說法不正確的是( )A.若,則認為A與B獨立,該推斷犯錯誤的概率不超過B.若,則認為A與B獨立,該推斷犯錯誤的概率不超過C.若,則認為A與B不獨立,該推斷犯錯誤的概率不超過D.若,則認為A與B不獨立,該推斷犯錯誤的概率不超過三、解答題.13.某社區對居民參加體育活動進行隨機調查,參與調查的60歲以下和60歲以上的(含60歲)人數如下表:60歲以下 60歲以上(含60歲)男性居民 30 40女性居民 50 20(1)判斷能否有的把握認為參加體育活動與性別有關;(2)用分層抽樣方法,在60歲以下的居民中抽取8人,再從這8人中隨機抽取3人,記抽到的男性居民數為隨機變量X,求X的分布列和數學期望.附:k,其中.14.近期新冠病毒奧密克戎毒株全球蔓延,傳染性更強、潛伏期更短、防控難度更大.為落實動態清零政策下的常態化防疫,某高中學校開展了每周的核酸抽檢工作:周一至周五,每天中午13:00開始,當天安排450位師生核酸檢測,五天時間全員覆蓋.(1)該校教職工有410人,高二學生有620人,高三學生有610人,①用分層抽樣的方法,求高一學生每天抽檢人數;②高一年級共15個班,該年級每天抽檢的學生有兩種安排方案,方案一:集中來自部分班級;方案二:分散來自所有班級.你認為哪種方案更合理,并給出理由.(2)學校開展核酸抽檢的第一周,周一至周五核酸抽檢用時記錄如下:第天 1 2 3 4 5用時(小時)①計算變量和的相關系數(精確到),并說明兩變量線性相關的強弱;②根據①中的計算結果,判定變量和是正相關,還是負相關,并給出可能的原因.參考數據和公式:,相關系數.15.A,B是河道分布密集、水患嚴重的西部兩鄰縣,從2015年開始,沿海C市對A縣對口整治河道,C市2015年對A縣河道整治投入40億元,以后河道整治投入逐年減少億元(a是常數,).B縣則由當地市級機關下派第一書記,單位承包到鎮(鄉)河道,實行河長負責,市民承包到河段的責任制,下表是從2015年到2019年,對B縣以年為單位的河道整治投入額:投入年份 2015 2016 2017 2018 2019年分代號t 1 2 3 4 5年河道整治投入額y(億元) 30 24 22 18 16(1)用最小二乘法求對B縣的河道整治投入額y與投入年份代號t的回歸方程;(2)①A,B兩縣人口分別為58萬和42萬,請比較對A,B兩縣從2015年至2020年這6年人均河道整治投入的大小(對B縣2020年的河道整治投入取回歸方程的估計值).②統計得出兩縣2020年河道整治是否達標與人均河道整治投入額分布列聯表(人數單位:萬人):未達標 達標 合計6年的人均河道整治投入不低于3億元/萬人 20 38 586年的人均河道整治投入低于3億元/萬人 24 18 42合計 44 56 100結合此表,是否有把握認為河道整治達標與對當地市民的河道整治投入有關?參考公式及數據:,,,.,.檢驗臨界值表:16.隨著科技進步,近年來,我國新能源汽車產業迅速發展.以下是中國汽車工業協會2022年2月公布的近六年我國新能源乘用車的年銷售量數據:年份 2016 2017 2018 2019 2020 2021年份代碼x 1 2 3 4 5 6新能源乘用車年銷售量y(萬輛) 50 78 126 121 137 352(1)根據表中數據,求出y關于x的線性回歸方程;(結果保留整數)(2)若用模型擬合y與x的關系,可得回歸方程為,經計算該模型和第(1)問中模型的(為相關指數)分別為和,請分別利用這兩個模型,求2022年我國新能源乘用車的年銷售量的預測值;(3)你認為(2)中用哪個模型得到的預測值更可靠?請說明理由.參考數據:設,其中.144 841 380 528參考公式:對于一組具有線性相關關系的數據,其回歸直線的斜率和截距的最小二乘估計公式分別為,.(答案與解析)一、單選題.1.【答案】B【解析】對于A,的觀測值時,有的把握認為吸煙與患肺病有關系,不是指“在100個吸煙的人中必有99人患有肺病”,故A錯誤;對于B,根據獨立性原理知,從統計量中求出有的把握認為吸煙與患肺病有關系,是指有的可能性使得判斷出現錯誤,B正確;對于C,從獨立性檢驗可知有的把握認為吸煙與患肺病有關系時,不能說某人吸煙,那么他有的可能性患有肺病,C錯誤,故選B.2.【答案】B【解析】由題中的散點圖可以看出,圖1和圖3是正相關,相關系數大于0,則,,圖2和圖4是負相關,相關系數小于0,則,,圖3和圖4的點相對于圖1和圖2更加集中,所以相關性較強,所以更接近于1,更接近于,由此可得,故選B.3.【答案】A【解析】由表格數據知:,,,,所求經驗回歸方程為,故選A.4.【答案】B【解析】對于A,散點顯然不符合一次函數的大致圖象,A錯誤;對于B,散點的增長幅度符合二次函數的圖象特征,B正確;對于C,以和月份為例,,,無法有一個固定的常數,使得對應的值與散點對應的值相符,即散點圖不符合指數函數模型,C錯誤;對于D,散點的增長幅度不符合對數函數的大致圖象,D錯誤,故選B.5.【答案】C【解析】因為且,,所以或7或8或9,根據公式,得,即,當時,;當時,;當時,;當時,,即當或9時滿足題意,故選C.6.【答案】B【解析】對于①,根據回歸系數的含義,可得回歸直線方程中,當解釋變量x增加1個單位時,預報變量平均減少個單位,故①正確;對于②,回歸直線就是散點圖中經過樣本數據點最多的那條直線,不正確.回歸直線也可能不過任何一個點;故②不正確;對于③,當相關性系數時,兩個變量正相關,故③正確;對于④,如果兩個變量的相關性越強,則相關性系數的絕對值就越接近于,故④不正確;對于⑤,殘差圖中殘差點所在的水平帶狀區域越寬,則回歸方程的預報精確度越低,故⑤不正確;對于⑥,甲、乙兩個模型的分別約為和,則模型甲的擬合效果更好,故⑥不正確,則正確的個數為2,故選B.7.【答案】C【解析】由題意,將兩邊同時取對數,得,設,則1 2 3 41 3 4 5,,由,得,解得,所以,所以當時,,故選C.二、多選題.8.【答案】ABC【解析】對于A:因為函數關系是確定關系,所以A正確;對于B:因為相關關系是非確定性關系,所以B正確;對于C:兩個變量轉換成數據后,一個對應點的橫坐標,一個對應點的縱坐標,所以C正確;對于D:散點圖只能大致反映變量間的關系,所以D錯誤,故選ABC.9.【答案】ABC【解析】根據與的線性回歸方程為,其中,說明與具有正的線性相關關系,A正確;回歸直線過樣本點的中心,由,B正確;由回歸方程知,若該大學某女生身高增加,則其體重約增加,故C正確;若該大學某女生身高為,則可預測其體重約為,不可斷定其體重必為,D錯誤,故選ABC.10.【答案】AB【解析】由獨立性檢驗得A說法是正確的;B中模型兩邊取對數得,由線性方程得,知c,k的值分別是,,故B說法正確;根據簡單隨機抽樣,每個個體被抽到的概率相同,故C錯誤;回歸直線及回歸系數是預測變量的取值和變化趨勢,并不是精確反映,故D錯誤,故選AB.11.【答案】BD【解析】因為不知道被調查的學生中,男生與女生的人數,所以不能確定喜歡登山的男生人數比不喜歡登山的女生人數多,因此選項A不正確;由統計圖中可以確定被調查的男生中喜歡登山的人數的百分比為,所以被調查的男生中喜歡登山的人數比不喜歡登山的人數多,因此選項B正確;因為不知道被調查的學生中,男生與女生的人數,所以不能由卡方公式進行計算判斷,所以選項C不正確,選項D正確,故選BD.12.【答案】ABC【解析】當時,我們認為A與B不獨立,該推斷犯錯誤的概率不超過,只有D說法正確,故選ABC.三、解答題.13.【答案】(1)有的把握認為;(2)分布列見解析,期望為.【解析】(1)由題意可得,故有把握認為參加體育活動與性別有關.(2)以下居民共人,其中男性人,女性人,用分層抽樣的方法從中抽人,則男性有人,女性有人,從這位男性和位女性中隨機抽取3人,抽到的男性居民數可能有,,,,故X的所有可能取值為,,,,,,,,的分布列如下:.14.【答案】(1)①人;②方案二,理由見解析;(2)①,線性相關性很強;②負相關,理由見解析.【解析】(1)解:①高一學生每天抽檢人數為(人).②方案二更合理,因為新冠病毒奧密克戎毒株傳染性更強、潛伏期更短,分散抽檢可以全面檢測年級中每班學生的狀況,更有利于防控篩查工作.(2)解:①,,所以,,,變量和的相關系數為,因為,可知兩變量線性相關性很強.②由可知變量和是負相關,可能的原因:隨著抽檢工作的開展,學校相關管理協調工作效率提高,因此用時縮短.15.【答案】(1);(2)①對A縣的人均河道整治投入大于對B縣的人均河道整治投入;②有的把握.【解析】(1)由表可知,,,∵,,∴,∴,所以,所求回歸方程為.(2)①由條件可知,對A縣的河道整治總投入(億元),∴這6年對A縣人均河道整治投入為(億元/萬人).對B縣2020年的河道整治投入為(億元),∴對B縣的河道整治總投入為(億元),∴這6年對B縣人均河道整治投入為(億元/萬人).所以,對A縣的人均河道整治投入大于對B縣的人均河道整治投入.②由列聯表知,,所以,有的把握認為河道整治達標與當地市民的河道整治投入有關.16.【答案】(1);(2)當回歸方程為時,2022年我國新能源乘用車的年銷售量的預測值是萬輛;當回歸方程為時,2022年我國新能源乘用車的年銷售量的預測值是萬輛.(3)由于相關指數越接近于,兩個變量之間的關系就強,相應的擬合程度也越好,所以模型得到的預測值更可靠.【解析】(1)由表中數據得,,,,,,,y關于x的線性回歸方程為.(2)由(1)知,y關于x的線性回歸方程為,當時,2022年我國新能源乘用車的年銷售量的預測值(萬輛);對于回歸方程,當時,2022年我國新能源乘用車的年銷售量的預測值:(萬輛).(3)依題意:模型和第(1)問中模型的(為相關指數)分別為和,由于相關指數越接近于,兩個變量之間的關系就強,相應的擬合程度也越好,所以模型得到的預測值更可靠. 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫