資源簡介 第九章 統(tǒng)計(jì)與成對數(shù)據(jù)的統(tǒng)計(jì)分析第一節(jié) 隨機(jī)抽樣、統(tǒng)計(jì)圖表1.會(huì)用簡單隨機(jī)抽樣的方法從總體中抽取樣本,了解分層隨機(jī)抽樣.2.能根據(jù)實(shí)際問題的特點(diǎn)選擇恰當(dāng)?shù)慕y(tǒng)計(jì)圖表,體會(huì)使用統(tǒng)計(jì)圖表的重要性.問題思考·夯實(shí)技能【問題1】 簡單隨機(jī)抽樣與分層隨機(jī)抽樣有什么共同特點(diǎn)和適用范圍?【問題2】 頻率分布直方圖中小長方形的高表示該組上的個(gè)體在樣本中出現(xiàn)的頻率對嗎?關(guān)鍵能力·題型剖析題型一 抽樣方法例 1 (1)(多選)下列抽樣方法是簡單隨機(jī)抽樣的是( )A.質(zhì)檢員從50個(gè)零件中逐個(gè)抽取5個(gè)做質(zhì)量檢驗(yàn)B.“隔空不隔愛,停課不停學(xué)”,網(wǎng)課上,李老師在全班45名學(xué)生中點(diǎn)名表揚(yáng)了3名發(fā)言積極的C.老師要求學(xué)生從實(shí)數(shù)集中逐個(gè)抽取10個(gè)分析奇偶性D.某運(yùn)動(dòng)員從8條跑道中隨機(jī)抽取一條跑道試跑(2)[2024·山東棗莊模擬]在北京冬奧會(huì)期間,共有1.8萬多名賽會(huì)志愿者和20余萬人次城市志愿者參與服務(wù).據(jù)統(tǒng)計(jì)某高校共有本科生1 600人,碩士生600人,博士生200人申請報(bào)名做志愿者,現(xiàn)用分層抽樣方法從中抽取博士生30人,則該高校抽取的志愿者總?cè)藬?shù)為( )A.300 B.320 C.340 D.360題后師說(1)簡單隨機(jī)抽樣需滿足:①被抽取的樣本總體的個(gè)體數(shù)有限;②逐個(gè)抽取;③等可能抽取.(2)在使用隨機(jī)數(shù)表時(shí),如遇到取兩位數(shù)或三位數(shù),可從選擇的隨機(jī)數(shù)表中的某行的數(shù)字計(jì)起,每兩個(gè)或三個(gè)作為一個(gè)單位,自左向右選取,有超過總體號碼或出現(xiàn)重復(fù)號碼的數(shù)字舍去.(3)在分層隨機(jī)抽樣中,抽樣比==.鞏固訓(xùn)練1(1)[2024·河南襄城模擬]現(xiàn)有300名老年人,500名中年人,400名青年人,從中按比例用分層隨機(jī)抽樣的方法抽取n人,若抽取的老年人與青年人共21名,則n的值為( )A.15 B.30 C.32 D.36(2)[2024·安徽六安模擬]將60個(gè)個(gè)體按照01,02,03,…,60進(jìn)行編號,然后從隨機(jī)數(shù)表的第9行第9列開始向右讀數(shù)(下表為隨機(jī)數(shù)表的第8行和第9行)63 01 63 78 59 16 95 55 67 19 98 10 50 71 7512 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 3815 51 00 13 42 99 66 02 79 54則抽取的第11個(gè)個(gè)體的編號是________.題型二 統(tǒng)計(jì)圖表角度一 扇形圖、條形圖例 2 [2024·河南開封模擬]某學(xué)校組建了演講、舞蹈、合唱、繪畫、英語協(xié)會(huì)五個(gè)社團(tuán),全校2 000名學(xué)生每人都參加且只參加其中兩個(gè)社團(tuán),校團(tuán)委從這2 000名學(xué)生中隨機(jī)選取部分學(xué)生進(jìn)行調(diào)查,并將調(diào)查結(jié)果繪制成如下不完整的兩個(gè)統(tǒng)計(jì)圖:則選取的學(xué)生中,參加繪畫社團(tuán)的學(xué)生數(shù)為( )A.20 B.30 C.40 D.45題后師說(1)通過扇形圖可以很清楚地表示出各部分?jǐn)?shù)量同總數(shù)之間的關(guān)系.(2)條形圖直觀描述不同類別或分組數(shù)據(jù)的頻數(shù).角度二 折線圖例 3 (多選)[2024·河北邯鄲模擬]如圖為2022年2月至2023年2月建筑業(yè)和服務(wù)業(yè)的商務(wù)活動(dòng)指數(shù),該指數(shù)等于50%反映該行業(yè)經(jīng)濟(jì)與上月比較無變化,大于50%反映該行業(yè)經(jīng)濟(jì)比上月總體上升,小于50%反映該行業(yè)經(jīng)濟(jì)比上月總體下降,則下列說法正確的是( )A.2022年9月至12月服務(wù)業(yè)經(jīng)濟(jì)持續(xù)下降B.2022年9月至12月建筑業(yè)經(jīng)濟(jì)持續(xù)下降C.2022年5月建筑業(yè)經(jīng)濟(jì)上升幅度最小D.2023年2月服務(wù)業(yè)經(jīng)濟(jì)上升幅度最大題后師說折線圖可以顯示隨時(shí)間(根據(jù)常用比例放置)而變化的連續(xù)數(shù)據(jù),因此非常適用于顯示在相等時(shí)間間隔下數(shù)據(jù)變化的趨勢.角度三 頻率分布直方圖例 4 某校為了解學(xué)生學(xué)習(xí)的效果,進(jìn)行了一次摸底考試,從中選取60名學(xué)生的成績,分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六組后,得到不完整的頻率分布直方圖如圖所示,觀察圖形,回答下列問題:(1)求分?jǐn)?shù)在區(qū)間[70,80)內(nèi)的頻率,并補(bǔ)全這個(gè)頻率分布直方圖;(2)根據(jù)評獎(jiǎng)規(guī)則,排名在前10%的學(xué)生可以獲獎(jiǎng),請你估計(jì)獲獎(jiǎng)的學(xué)生至少需要多少分?題后師說(1)頻率分布直方圖中縱軸上的數(shù)據(jù)是各組的頻率除以組距的結(jié)果,不要誤以為縱軸上的數(shù)據(jù)是各組的頻率,不要和條形圖混淆.(2)頻率分布直方圖中各小長方形的面積之和為1,這是解題的關(guān)鍵,常利用頻率分布直方圖估計(jì)總體分布.鞏固訓(xùn)練2(1)某市商品房調(diào)查機(jī)構(gòu)隨機(jī)抽取n名市民,針對其居住的戶型結(jié)構(gòu)和是否滿意進(jìn)行了調(diào)查,如圖1,被調(diào)查的所有市民中二居室住戶共100戶,所占比例為,四居室住戶占.如圖2,這是用分層抽樣的方法從所有被調(diào)查的市民對戶型是否滿意的問卷中,抽取20%的調(diào)查結(jié)果繪制成的統(tǒng)計(jì)圖,則下列說法錯(cuò)誤的是( )A.n=450B.被調(diào)查的所有市民中四居室住戶共有150戶C.用分層抽樣的方法抽取的二居室住戶有20戶D.用分層抽樣的方法抽取的市民中對三居室滿意的有10戶(2)[2024·遼寧葫蘆島模擬]采購經(jīng)理指數(shù)(PMI),是通過對企業(yè)采購經(jīng)理的月度調(diào)查結(jié)果統(tǒng)計(jì)匯總、編制而成的指數(shù),它涵蓋了企業(yè)采購、生產(chǎn)、流通等各個(gè)環(huán)節(jié),包括制造業(yè)和非制造業(yè)領(lǐng)域,是國際上通用的檢測宏觀經(jīng)濟(jì)走勢的先行指數(shù)之一,具有較強(qiáng)的預(yù)測、預(yù)警作用.制造業(yè)PMI高于50%時(shí),反映制造業(yè)較上月擴(kuò)張;低于50%,則反映制造業(yè)較上月收縮.下圖為我國2022年1月~2023年6月制造業(yè)采購經(jīng)理指數(shù)(PMI)統(tǒng)計(jì)圖.根據(jù)統(tǒng)計(jì)圖分析,下列結(jié)論最恰當(dāng)?shù)囊豁?xiàng)為( )A.2022年第一、二季度的各月制造業(yè)在逐月擴(kuò)張B.2022年第四季度各月制造業(yè)在逐月擴(kuò)張C.2023年1月至4月制造業(yè)逐月收縮D.2023年4月開始制造業(yè)景氣水平呈恢復(fù)性擴(kuò)張(3)某學(xué)校為了調(diào)查學(xué)生生活方面的日支出情況,抽出了一個(gè)容量為n的樣本,將數(shù)據(jù)按[20,30),[30,40),[40,50),[50,60),[60,70]分成5組,制定成如圖所示的頻率分布直方圖,則a=__________.要從日支出在[50,70]的樣本中用分層抽樣的方法抽取10人,則日支出在[60,70]中被抽取的人數(shù)為__________.1.[2024·河北秦皇島模擬]為實(shí)現(xiàn)鄉(xiāng)村生態(tài)振興,走鄉(xiāng)村綠色發(fā)展之路,鄉(xiāng)政府采用按比例分層抽樣的方式從甲村和乙村抽取部分村民參與環(huán)保調(diào)研,已知甲村和乙村人數(shù)之比是3∶1,被抽到的參與環(huán)保調(diào)研的村民中,甲村的人數(shù)比乙村多8人,則參加調(diào)研的總?cè)藬?shù)是( )A.16 B.24C.32 D.402.[2024·河南鄭州模擬]為了樹立和踐行綠水青山就是金山銀山的理念,A市某高中全體教師于2023年3月12日開展植樹活動(dòng),購買柳樹、銀杏、梧桐、樟樹四種樹苗共計(jì)600棵,比例如圖所示.青年教師、中年教師、老年教師報(bào)名參加植樹活動(dòng)的人數(shù)之比為5∶3∶2,若每種樹苗均按各年齡段報(bào)名人數(shù)的比例進(jìn)行分配,則中年教師應(yīng)分得梧桐的數(shù)量為( )A.30棵 B.50棵C.72棵 D.80棵3.要調(diào)查某地區(qū)高中學(xué)生身體素質(zhì),從高中生中抽取100人進(jìn)行跳遠(yuǎn)測試,根據(jù)測試成績制作頻率分布直方圖如圖,現(xiàn)從成績在[120,140)之間的學(xué)生中用分層抽樣的方法抽取5人,應(yīng)從[120,130)間抽取人數(shù)為b,則( )A.a(chǎn)=0.025,b=2B.a(chǎn)=0.025,b=3C.a(chǎn)=0.030,b=4D.a(chǎn)=0.030,b=34.[2024·河北唐山模擬]為了解一個(gè)魚塘中養(yǎng)殖魚的生長情況,從這個(gè)魚塘多個(gè)不同位置捕撈出100條魚,分別做上記號,再放回魚塘,幾天后,再從魚塘的多處不同位置捕撈出120條魚,發(fā)現(xiàn)其中帶有記號的魚有6條,請根據(jù)這一情況來估計(jì)魚塘中的魚大概有________條.第一節(jié) 隨機(jī)抽樣、統(tǒng)計(jì)圖表問題思考·夯實(shí)技能【問題1】 提示:兩種抽樣方法的共同特點(diǎn)和適用范圍:類別 簡單隨機(jī)抽樣 分層隨機(jī)抽樣共同點(diǎn) 抽樣過程中每個(gè)個(gè)體被抽到的可能性相等適用范圍 總體個(gè)數(shù)較少 總體由差異明顯的幾部分組成【問題2】 提示:不對.在頻率分布直方圖中,縱軸(小長方形的高)表示頻率與組距的比值,其相應(yīng)組距上的頻率等于該組距上的小長方形的面積.關(guān)鍵能力·題型剖析例1 解析:(1)選項(xiàng)A:符合不放回簡單隨機(jī)抽樣要求,故正確;選項(xiàng)B:老師表揚(yáng)的是發(fā)言積極的,對每一個(gè)個(gè)體而言,不具備“等可能性”,故錯(cuò)誤;選項(xiàng)C:因?yàn)榭傮w容量是無限的,不符合簡單隨機(jī)抽樣要求,故錯(cuò)誤;選項(xiàng)D:8條跑道,抽取1條,總體有限,每個(gè)個(gè)體被抽到的機(jī)會(huì)均等,是簡單隨機(jī)抽樣,故正確.故選AD.(2)根據(jù)題意知分層抽樣比例為 =,所以該高校抽取的志愿者總?cè)藬?shù)為(1 600+600+200)×=360.故選D.答案:(1)AD (2)D鞏固訓(xùn)練1 解析:(1)由題可知=,解得n=36.故選D.(2)找到第9行第9列數(shù)開始向右讀,符合條件的是29 56 07 52 42 44 38 15 51 13 02 54…,則抽取的第11個(gè)個(gè)體的編號是02.答案:(1)D (2)02例2 解析:選取的學(xué)生數(shù)為=200,合唱的比例為=35%,所以繪畫的比例為1-20%-20%-15%-35%=10%,所以選取的學(xué)生中,參加繪畫社團(tuán)的學(xué)生數(shù)為×10%=20.故選A.答案:A例3 解析:根據(jù)服務(wù)業(yè)商務(wù)活動(dòng)指數(shù)圖象可知,2022年9月至12月建筑業(yè)經(jīng)濟(jì)持續(xù)下降,所以A選項(xiàng)正確;根據(jù)建筑業(yè)商務(wù)活動(dòng)指數(shù)圖象可知,2022年9月至12月服務(wù)業(yè)經(jīng)濟(jì)持續(xù)上升,所以B選項(xiàng)錯(cuò)誤;根據(jù)建筑業(yè)商務(wù)活動(dòng)指數(shù)圖象可知,2022年5月建筑業(yè)經(jīng)濟(jì)上升幅度最小,所以C選項(xiàng)正確;根據(jù)服務(wù)業(yè)商務(wù)活動(dòng)指數(shù)圖象可知,2023年2月服務(wù)業(yè)經(jīng)濟(jì)上升幅度最大,所以D選項(xiàng)正確.故選ACD.答案:ACD例4 解析:(1)設(shè)分?jǐn)?shù)在[70,80)內(nèi)的頻率為x,根據(jù)頻率分布直方圖,可得(0.01+0.015+0.02+0.025+0.005)×10+x=1,解得x=0.25,所以分?jǐn)?shù)在[70,80)內(nèi)的頻率為0.25.補(bǔ)全這個(gè)頻率分布直方圖,如圖所示.(2)因?yàn)榉謹(jǐn)?shù)在區(qū)間[80,90)內(nèi)的頻率為0.25,在區(qū)間[90,100]內(nèi)的頻率為0.05,而0.05<10%<0.25+0.05.所以設(shè)排名前10%的分界點(diǎn)為90-a,則0.025a+0.005×10=10%,解得a=2,所以排名前10%的分界點(diǎn)為88分,即獲獎(jiǎng)的學(xué)生至少需要88分.鞏固訓(xùn)練2 解析:(1)因?yàn)楸徽{(diào)查的所有市民中二居室住戶共100戶,所占比例為,所以n=100÷=450,四居室住戶有450×=150戶,三居室住戶有200戶,故A,B正確;用分層抽樣的方法抽取的二居室住戶有100×0.2=20戶,故C正確;用分層抽樣的方法抽取的市民中對三居室滿意的有200×0.2×0.5=20戶,故D錯(cuò)誤.故選D.(2)由統(tǒng)計(jì)圖可以得到,2022年第一、二季度的制造業(yè)指數(shù)均高于50%,所以2022年第一、二季度的各月制造業(yè)在逐月擴(kuò)張,故A正確;由統(tǒng)計(jì)圖可以得到,2022年10月份的制造業(yè)指數(shù)低于50%,故B錯(cuò)誤;由統(tǒng)計(jì)圖可以得到,2023年1、2月份的制造業(yè)指數(shù)高于50%,故C錯(cuò)誤;由統(tǒng)計(jì)圖可以得到,2023年4~6月份制造業(yè)指數(shù)呈現(xiàn)上升趨勢,但是2023年4、5月份制造業(yè)指數(shù)均低于50%,即制造業(yè)景氣水平較上月收縮,故D錯(cuò)誤.故選A.(3)因?yàn)?2a+0.02+0.025+0.045)×10=1,所以a=0.005,又因?yàn)閇50,60)內(nèi)和[60,70]內(nèi)的樣本個(gè)數(shù)比例為0.020∶0.005=4∶1,根據(jù)分層抽樣可知,日支出在[60,70]中被抽取的人數(shù)為10×=2.答案:(1)D (2)A (3)0.005 2隨堂檢測1.解析:設(shè)被抽取參與調(diào)研的乙村村民有x人,則根據(jù)分層抽樣按兩村人口比例,甲村被抽取參與調(diào)研的有3x人,所以3x-x=8,即x=4,所以參加調(diào)研的總?cè)藬?shù)x+3x=16.故選A.答案:A2.解析:由題意,梧桐樹苗的數(shù)量為600×40%=240(棵),所以中年教師應(yīng)分得梧桐的數(shù)量為240×=72(棵).故選C.答案:C3.解析:由題得10×(0.005+0.035+a+0.020+0.010)=1,所以a=0.030.在[120,130)之間的學(xué)生:100×10×0.030=30(人),在[130,140)之間的學(xué)生:100×10×0.020=20(人),在[120,140)之間的學(xué)生:100×(10×0.030+10×0.020)=50(人),又用分層抽樣的方法在[120,140)之間的學(xué)生50人中抽取5人,即抽取比為:,所以成績在[120,130)之間的學(xué)生中抽取的人數(shù)應(yīng)為30×=3,即b=3.故選D.答案:D4.解析:設(shè)魚塘中的魚有x條,因?yàn)椴稉瞥龅?20條魚中有6條有記號,因此由題意可得=,解得x=2 000,即魚塘中的魚大概有2 000條.答案:2 000第二節(jié) 用樣本估計(jì)總體1.會(huì)用統(tǒng)計(jì)圖表對總體進(jìn)行估計(jì),會(huì)求n個(gè)數(shù)據(jù)的第p百分位數(shù).2.能用數(shù)字特征估計(jì)總體集中趨勢和總體離散程度.問題思考·夯實(shí)技能【問題1】 一組數(shù)據(jù)的百分位數(shù)一定是這組數(shù)據(jù)中的數(shù)嗎?【問題2】 如何利用頻率分布直方圖估計(jì)平均數(shù)、中位數(shù)和眾數(shù)?關(guān)鍵能力·題型剖析題型一 百分位數(shù)的估計(jì)例 1 (1)[2024·安徽馬鞍山模擬]現(xiàn)有一組數(shù)據(jù):663,664,665,668,671,664,656,674,651,653,652,656,則這組數(shù)據(jù)的第85百分位數(shù)是( )A.652 B.668C.671 D.674(2)[2024·河北邢臺模擬]《中國居民膳食指南(2022)》數(shù)據(jù)顯示,6歲至17歲兒童青少年超重肥胖率高達(dá)19.0%.為了解某地中學(xué)生的體重情況,某機(jī)構(gòu)從該地中學(xué)生中隨機(jī)抽取100名學(xué)生,測量他們的體重(單位:千克),根據(jù)測量數(shù)據(jù),按[40,45),[45,50),[50,55),[55,60),[60,65),[65,70]分成六組,得到的頻率分布直方圖如圖所示.根據(jù)調(diào)查的數(shù)據(jù),估計(jì)該地中學(xué)生體重的第75百分位數(shù)是( )A.55 B.57.25C.58.75 D.60題后師說頻率分布直方圖中第p百分位數(shù)的計(jì)算步驟鞏固訓(xùn)練1(1)[2024·廣東江門模擬]某校從高一新生中隨機(jī)抽取了一個(gè)容量為10的身高樣本,數(shù)據(jù)(單位:cm)從小到大排序如下:158,165,165,167,168,169,x,172,173,175,若樣本數(shù)據(jù)的第60百分位數(shù)是170,則x=( )A.169 B.170C.171 D.172(2)高一某班10名學(xué)生的英語口語測試成績(單位:分)如下:76,90,84,82,81,87,86,82,85,83.這組數(shù)據(jù)的上四分位數(shù)是______.題型二 總體集中趨勢的估計(jì)角度一 樣本的數(shù)字特征例 2 [2024·江蘇連云港模擬]某高校為傳承中華文化,舉辦了“論語吟唱”的比賽.在比賽中,由A,B兩個(gè)評委小組(各9人)給參賽選手打分.根據(jù)兩個(gè)評委小組對同一名選手的打分繪制成如圖所示折線圖,則下列說法正確的是( )A.A組打分的眾數(shù)為50B.B組打分的中位數(shù)為75C.A組的意見相對一致D.B組打分的均值小于A組打分的均值題后師說中位數(shù)、眾數(shù)分別反映了一組數(shù)據(jù)的“中等水平”“多數(shù)水平”;平均數(shù)反映了數(shù)據(jù)的平均水平,它們均描述了數(shù)據(jù)的集中趨勢.角度二 頻率分布直方圖中的數(shù)字特征例 3 [2024·安徽淮北模擬]某城市100戶居民的月平均用電量(單位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分組的頻率分布直方圖如圖.(1)求直方圖中x的值;(2)求月平均用電量的眾數(shù)和中位數(shù);(3)在月平均用電量為[220,240),[240,260),[260,280),[280,300]的四組用戶中,用分層抽樣的方法抽取11戶居民,則月平均用電量在[220,240)的用戶中應(yīng)抽取多少戶?題后師說頻率分布直方圖中的數(shù)字特征的求解方法(1)眾數(shù):最高矩形的底邊中點(diǎn)的橫坐標(biāo).(2)中位數(shù):中位數(shù)左邊和右邊的矩形的面積和相等.(3)平均數(shù):平均數(shù)在頻率分布直方圖中等于各組區(qū)間的中點(diǎn)值與對應(yīng)頻率之積的和.鞏固訓(xùn)練2(1)[2024·黑龍江哈爾濱模擬]PM2.5是衡量空氣質(zhì)量的重要指標(biāo),下圖是某地6月1日至10日的PM2.5日均值(單位:μg/m3)的折線圖,則下列關(guān)于這10天中PM2.5日均值的說法錯(cuò)誤的是( )A.眾數(shù)為30B.中位數(shù)為31.5C.平均數(shù)小于中位數(shù)D.極差為109(2)(多選)[2024·山東聊城模擬]某校舉辦了迎新年知識競賽,隨機(jī)選取了100人的成績整理后畫出的頻率分布直方圖如圖,則根據(jù)頻率分布直方圖,下列說法正確的是( )A. 中位數(shù)70 B.眾數(shù)75C.平均數(shù)68.5 D.平均數(shù)70題型三 總體離散程度的估計(jì)例 4 [2023·全國乙卷]某廠為比較甲乙兩種工藝對橡膠產(chǎn)品伸縮率的處理效應(yīng),進(jìn)行10次配對試驗(yàn),每次配對試驗(yàn)選用材質(zhì)相同的兩個(gè)橡膠產(chǎn)品,隨機(jī)地選其中一個(gè)用甲工藝處理,另一個(gè)用乙工藝處理,測量處理后的橡膠產(chǎn)品的伸縮率.甲、乙兩種工藝處理后的橡膠產(chǎn)品的伸縮率分別記為xi,yi(i=1,2,…,10).試驗(yàn)結(jié)果如下:試驗(yàn)序號i 1 2 3 4 5 6 7 8 9 10伸縮率xi 545 533 551 522 575 544 541 568 596 548伸縮率yi 536 527 543 530 560 533 522 550 576 536記zi=xi-yi(i=1,2,…,10),記z1,z2,…,z10的樣本平均數(shù)為,樣本方差為s2.(1)求,s2;(2)判斷甲工藝處理后的橡膠產(chǎn)品的伸縮率較乙工藝處理后的橡膠產(chǎn)品的伸縮率是否有顯著提高(如果≥2,則認(rèn)為甲工藝處理后的橡膠產(chǎn)品的伸縮率較乙工藝處理后的橡膠產(chǎn)品的伸縮率有顯著提高,否則不認(rèn)為有顯著提高).題后師說標(biāo)準(zhǔn)差(方差)反映了數(shù)據(jù)的離散與集中、波動(dòng)與穩(wěn)定的程度.標(biāo)準(zhǔn)差(方差)越大,數(shù)據(jù)的離散程度越大;標(biāo)準(zhǔn)差(方差)越小,數(shù)據(jù)的離散程度越小.鞏固訓(xùn)練3[2024·河北滄州模擬]為了鞏固拓展脫貧攻堅(jiān)成果,不斷提高群眾的幸福感,政府積極引導(dǎo)某村農(nóng)戶因地制宜種植某種經(jīng)濟(jì)作物,該類經(jīng)濟(jì)作物的質(zhì)量以其質(zhì)量指標(biāo)值來衡量,質(zhì)量指標(biāo)值越大表明質(zhì)量越好.為了解該類經(jīng)濟(jì)作物在該村的種植效益,該村引進(jìn)了甲、乙兩個(gè)品種,現(xiàn)隨機(jī)抽取了這兩個(gè)不同品種的經(jīng)濟(jì)作物各100份(每份1千克)作為樣本進(jìn)行檢測,檢測結(jié)果如下表所示:(同一區(qū)間的數(shù)據(jù)取該區(qū)間的中點(diǎn)值作代表)分別記甲、乙品種質(zhì)量指標(biāo)值的樣本平均數(shù)為和,樣本方差為和.(1)現(xiàn)已求得==324.64,試求及,并比較樣本平均數(shù)與方差的大小;(2)該經(jīng)濟(jì)作物按其質(zhì)量指標(biāo)值劃分等級如下表:質(zhì)量指標(biāo)值 [0,40) [40,80) [80,100]作物等級 二級 一級 特級利潤(元/千克) 10 20 50現(xiàn)利用樣本估計(jì)總體,試從樣本利潤平均數(shù)的角度分析該村村民種植哪個(gè)品種的經(jīng)濟(jì)作物獲利更多.1.[2024·九省聯(lián)考]樣本數(shù)據(jù)16,24,14,10,20,30,12,14,40的中位數(shù)為( )A.14 B.16C.18 D.202.(多選)[2021·新高考Ⅰ卷]有一組樣本數(shù)據(jù)x1,x2,…,xn,由這組數(shù)據(jù)得到新樣本數(shù)據(jù)y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c為非零常數(shù),則( )A.兩組樣本數(shù)據(jù)的樣本平均數(shù)相同B.兩組樣本數(shù)據(jù)的樣本中位數(shù)相同C.兩組樣本數(shù)據(jù)的樣本標(biāo)準(zhǔn)差相同D.兩組樣本數(shù)據(jù)的樣本極差相同3.(多選)[2021·新高考Ⅱ卷]下列統(tǒng)計(jì)量中,能度量樣本x1,x2,…,xn的離散程度的是( )A.樣本x1,x2,…,xn的標(biāo)準(zhǔn)差B.樣本x1,x2,…,xn的中位數(shù)C.樣本x1,x2,…,xn的極差D.樣本x1,x2,…,xn的平均數(shù)4.如圖,是根據(jù)某班學(xué)生在一次數(shù)學(xué)考試中的成績畫出的頻率分布直方圖,記由該直方圖得到的數(shù)學(xué)考試成績的眾數(shù)、中位數(shù)和平均數(shù)分別為a,b,c,則( )A.b>c>a B.a(chǎn)>b>cC.>b D.>c第二節(jié) 用樣本估計(jì)總體問題思考·夯實(shí)技能【問題1】 提示:不一定.可能是這組數(shù)據(jù)中的數(shù),也可能不是這組數(shù)據(jù)中的數(shù).例如數(shù)據(jù)1,2,3的第50百分位數(shù)是2,是這組數(shù)據(jù)中的數(shù);數(shù)據(jù)1,2,3,4的第50百分位數(shù)是2.5,不是這組數(shù)據(jù)中的數(shù).【問題2】 提示:在頻率分布直方圖中,平均數(shù)的估計(jì)值等于頻率分布直方圖中每個(gè)小矩形的面積與小矩形底邊中點(diǎn)的橫坐標(biāo)之積的總和.中位數(shù)左邊和右邊的直方圖的面積應(yīng)該相等,由此可估計(jì)中位數(shù)的值.眾數(shù)的估計(jì)值為最高矩形的中點(diǎn)的橫坐標(biāo).關(guān)鍵能力·題型剖析例1 解析:(1)由題意這組數(shù)共12個(gè),則12×85%=10.2,將這組數(shù)據(jù)從小到大排列為651,652,653,656,656,663,664,664,665,668,671,674,故這組數(shù)據(jù)的第85百分位數(shù)為第11個(gè)數(shù),即671.故選C.(2)因?yàn)?0.01+0.03+0.08)×5=0.6<0.75,0.6+0.04×5=0.8>0.75,所以該地中學(xué)生體重的第75百分位數(shù)在[55,60)內(nèi),設(shè)第75百分位數(shù)為m,則(m-55)×0.04+0.6=0.75,解得m=58.75.故選C.答案:(1)C (2)C鞏固訓(xùn)練1 解析:(1)因?yàn)闃颖救萘繛?0,且樣本數(shù)據(jù)從小到大排序如下:158,165,165,167,168,169,x,172,173,175,又10×60%=6,所以第60百分位數(shù)為,由已知=170,所以x=171.故選C.(2)成績從小到大排序?yàn)椋?6,81,82,82,83,84,85,86,87,90,則10×=7.5,所以這組數(shù)據(jù)的上四分位數(shù)是86.答案:(1)C (2)86例2 解析:由折線圖可知,小組A打分的分值為:42,47,45,46,50,47,55,50,47,則小組A打分的分值的眾數(shù)為47,故選項(xiàng)A錯(cuò)誤;小組B打分的分值為:55,36,70,66,75,68,68,62,58,按照從小到大排列為:36,55,58,62,66,68,68,70,75,中間數(shù)為66,故中位數(shù)為66,故選項(xiàng)B錯(cuò)誤 ;小組A的打分成績比較均勻,波動(dòng)更小,故A小組意見相對一致,故選項(xiàng)C正確;小組A的打分分值的均值=47.7,而小組B的打分分值的均值=62,所以小組B打分的分值的均值大于小組A打分的分值的均值,故選項(xiàng)D錯(cuò)誤.故選C.答案:C例3 解析:(1)由直方圖的性質(zhì)可得(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1得:x=0.007 5,所以直方圖中x的值是0.007 5.(2)月平均用電量的眾數(shù)是=230.因?yàn)?0.002+0.009 5+0.011)×20=0.45<0.5,所以月平均用電量的中位數(shù)在[220,240)內(nèi),設(shè)中位數(shù)為a,由(0.002+0.009 5+0.011)×20+0.012 5×(a-220)=0.5得:a=224,所以月平均用電量的中位數(shù)是224.(3)月平均用電量為[220,240)的用戶有0.012 5×20×100=25戶,月平均用電量為[240,260)的用戶有0.007 5×20×100=15戶,月平均用電量為[260,280)的用戶有0. 005×20×100=10戶,月平均用電量為[280,300]的用戶有0.002 5×20×100=5戶,抽取比例==,所以月平均用電量在[220,240)的用戶中應(yīng)抽取25×=5戶.鞏固訓(xùn)練2 解析:(1)眾數(shù)即是出現(xiàn)次數(shù)最多的數(shù)字,由折線圖可得,眾數(shù)為30,即A正確;將折線圖中數(shù)字由小到大依次排序,得到:17,25,30,30,31,32,34,38,42,126,處在中間位置的數(shù)字是31,32,因此中位數(shù)為31.5,即B正確;由折線圖可得,平均數(shù)為:=40.5>31.5,故C錯(cuò);根據(jù)極差概念,126-17=109,故D正確.故選C.(2)[40,50)的頻率為=0.1,因?yàn)樽罡咝【匦蔚闹悬c(diǎn)橫坐標(biāo)為75,顯然眾數(shù)是75,故B正確;[40,50)的頻率是0.1,[50,60)的頻率是0.15,[60,70)的頻率是0.25,其頻率和為0.5,所以中位數(shù)為70,故A正確;平均數(shù)=45×0.1+55×0.15+65×0.25+75×0.35+85×0.1+95×0.05=68.5,所以C正確,D不正確.故選ABC.答案:(1)C (2)ABC例4 解析:(1)zi的值分別為:9,6,8,-8,15,11,19,18,20,12,則==11.故s2==61.(2)由(1)知:=11,2=2=,故有≥2,所以認(rèn)為甲工藝處理后的橡膠產(chǎn)品的伸縮率較乙工藝處理后的橡膠產(chǎn)品的伸縮率有顯著提高.鞏固訓(xùn)練3 解析:(1)=×(10×2+30×6+50×24+70×48+90×20)=65.6,=(10-60)2×0.02+(30-60)2×0.08+(50-60)2×0.38+(70-60)2×0.42+(90-60)2×0.1=292.又因?yàn)椋剑?24.64,所以.(2)分別記甲、乙兩品種利潤的樣本平均數(shù)為,則=×(8×10+72×20+20×50)=25.2(元),=×(10×10+80×20+10×50)=22(元),所以>,所以從樣本利潤平均數(shù)的角度看種植甲品種的經(jīng)濟(jì)作物獲得的利潤更高.隨堂檢測1.解析:將這些數(shù)據(jù)從小到大排列可得:10,12,14,14,16,20,24,30,40,則其中位數(shù)為16.故選B.答案:B2.解析:A:E(y)=E(x+c)=E(x)+c且c≠0,故平均數(shù)不相同,錯(cuò)誤;B:若第一組中位數(shù)為xi,則第二組的中位數(shù)為yi=xi+c,顯然不相同,錯(cuò)誤;C:D(y)=D(x)+D(c)=D(x),故方差相同,正確.D:由極差的定義知:若第一組的極差為xmax-xmin,則第二組的極差為ymax-ymin=(xmax+c)-(xmin+c)=xmax-xmin,故極差相同,正確.故選CD.答案:CD3.解析:由標(biāo)準(zhǔn)差的定義可知,標(biāo)準(zhǔn)差考查的是數(shù)據(jù)的離散程度;由中位數(shù)的定義可知,中位數(shù)考查的是數(shù)據(jù)的集中趨勢;由極差的定義可知,極差考查的是數(shù)據(jù)的離散程度;由平均數(shù)的定義可知,平均數(shù)考查的是數(shù)據(jù)的集中趨勢.故選AC.答案:AC4.解析:由頻率分布直方圖可知:眾數(shù)a==75;中位數(shù)應(yīng)落在70~80區(qū)間內(nèi),則有:0.004×10+0.018×10+0.04×(b-70)=0.5,解得:b=77;平均數(shù)c=0.004×10×+0.018×10×+0.04×10×+0.032×10×+0.006×10×=2.2+11.7+30+27.2+5.7=76.8.所以b>c>a.故選A.答案:A第三節(jié) 成對數(shù)據(jù)的統(tǒng)計(jì)分析1.了解樣本相關(guān)系數(shù)的統(tǒng)計(jì)意義.2.了解最小二乘原理,掌握一元線性回歸模型參數(shù)的最小二乘估計(jì)方法,會(huì)用一元線性回歸模型進(jìn)行預(yù)測.3.理解2×2列聯(lián)表的統(tǒng)計(jì)意義,了解2×2列聯(lián)表獨(dú)立性檢驗(yàn)及其應(yīng)用.問題思考·夯實(shí)技能【問題1】 在回歸分析的過程中,散點(diǎn)圖、樣本相關(guān)系數(shù)r、決定系數(shù)R2的作用相同嗎?【問題2】 根據(jù)χ2的值可以判斷兩個(gè)分類變量有關(guān)的可信程度,若χ2越大,則兩分類變量有關(guān)的把握越大對嗎?關(guān)鍵能力·題型剖析題型一 成對數(shù)據(jù)的統(tǒng)計(jì)相關(guān)性例1 (1)[2024·河南南陽模擬]某同學(xué)在研究變量x,y之間的相關(guān)關(guān)系時(shí),得到以下數(shù)據(jù):并采用最小二乘法得到了經(jīng)驗(yàn)回歸方程=x+,則( )x 4.8 5.8 7 8.3 9.1y 2.8 4.1 7.2 9.1 11.8A. >0,>0 B.>0,<0C.<0,<0 D.<0,>0(2)(多選)[2024·河北滄州模擬]醫(yī)學(xué)上判斷體重是否超標(biāo)有一種簡易方法,就是用一個(gè)人身高的厘米數(shù)減去105所得差值即為該人的標(biāo)準(zhǔn)體重.比如身高175 cm的人,其標(biāo)準(zhǔn)體重為175-105=70公斤,一個(gè)人實(shí)際體重超過了標(biāo)準(zhǔn)體重,我們就說該人體重超標(biāo)了,現(xiàn)分析某班學(xué)生的身高和體重的相關(guān)性時(shí),隨機(jī)抽測了8人的身高和體重,數(shù)據(jù)如下表所示:編號 1 2 3 4 5 6 7 8身高x/cm 165 168 170 172 173 174 175 177體重y/kg 55 89 61 65 67 70 75 75由最小二乘法計(jì)算得到經(jīng)驗(yàn)回歸直線l1的方程為=1x+1,相關(guān)系數(shù)為r1,決定系數(shù)為R;經(jīng)過殘差分析確定有一個(gè)樣本點(diǎn)為離群點(diǎn)(對應(yīng)殘差過大),把它去掉后,再用剩下的7組數(shù)據(jù)計(jì)算得到經(jīng)驗(yàn)回歸直線l2的方程為=2x+2,相關(guān)系數(shù)為r2,決定系數(shù)為R,則( )A. r1RC.r1>r2 D.R題后師說判斷數(shù)據(jù)的相關(guān)關(guān)系的三種方法鞏固訓(xùn)練1(1)下列圖中,能反映出相應(yīng)兩個(gè)變量之間具有線性相關(guān)關(guān)系的是( )(2)對兩個(gè)變量x,y進(jìn)行線性相關(guān)檢驗(yàn),得線性相關(guān)系數(shù)r1=0.899 5,對兩個(gè)變量u,v進(jìn)行線性相關(guān)檢驗(yàn),得線性相關(guān)系數(shù)r2=-0.956 8,則下列判斷正確的是( )A.變量x與y正相關(guān),變量u與v負(fù)相關(guān),變量x與y的線性相關(guān)性較強(qiáng)B.變量x與y負(fù)相關(guān),變量u與v正相關(guān),變量x與y的線性相關(guān)性較強(qiáng)C.變量x與y正相關(guān),變量u與v負(fù)相關(guān),變量u與v的線性相關(guān)性較強(qiáng)D.變量x與y負(fù)相關(guān),變量u與v正相關(guān),變量u與v的線性相關(guān)性較強(qiáng)題型二 回歸模型角度一 一元線性回歸模型例2 [2024·遼寧遼陽模擬]2022年12月份以來,全國多個(gè)地區(qū)紛紛采取不同的形式發(fā)放多輪消費(fèi)券,助力消費(fèi)復(fù)蘇.記發(fā)放的消費(fèi)券額度為x(百萬元),帶動(dòng)的消費(fèi)為y(百萬元).某省隨機(jī)抽查的一些城市的數(shù)據(jù)如下表所示.x 3 3 4 5 5 6 6 8y 10 12 13 18 19 21 24 27(1)根據(jù)表中的數(shù)據(jù),請用相關(guān)系數(shù)說明y與x有很強(qiáng)的線性相關(guān)關(guān)系,并求出y關(guān)于x的經(jīng)驗(yàn)回歸方程.(2)(ⅰ)若該省A城市在2023年2月份準(zhǔn)備發(fā)放一輪額度為10百萬元的消費(fèi)券,利用(1)中求得的經(jīng)驗(yàn)回歸方程,預(yù)計(jì)可以帶動(dòng)多少消費(fèi)?(ⅱ)當(dāng)實(shí)際值與估計(jì)值的差的絕對值與估計(jì)值的比值不超過10%時(shí),認(rèn)為發(fā)放的該輪消費(fèi)券助力消費(fèi)復(fù)蘇是理想的.若該省A城市2月份發(fā)放額度為10百萬元的消費(fèi)券后,經(jīng)過一個(gè)月的統(tǒng)計(jì),發(fā)現(xiàn)實(shí)際帶動(dòng)的消費(fèi)為30百萬元,請問發(fā)放的該輪消費(fèi)券助力消費(fèi)復(fù)蘇是否理想?若不理想,請分析可能存在的原因.參考公式:r=,=,=-.當(dāng)|r|>0.75時(shí),兩個(gè)變量之間具有很強(qiáng)的線性相關(guān)關(guān)系.參考數(shù)據(jù):≈5.9.題后師說求經(jīng)驗(yàn)回歸方程的步驟鞏固訓(xùn)練2[2024·吉林長春模擬]偏差是指個(gè)別測定值與測定的平均值之差,在成績統(tǒng)計(jì)中,我們把某同學(xué)的某科考試成績與該科平均成績的差叫某科偏差(實(shí)際成績-平均成績=偏差).在某次考試成績統(tǒng)計(jì)中,教研人員為了對學(xué)生數(shù)學(xué)偏差x(單位:分)與物理偏差y(單位:分)之間的關(guān)系進(jìn)行分析,隨機(jī)挑選了8位同學(xué),得到他們的兩科成績偏差數(shù)據(jù)如下:學(xué)生序號 1 2 3 4 5 6 7 8數(shù)學(xué)偏差x/分 20 15 13 3 2 -5 -10 -18物理偏差y/分 6.5 3.5 3.5 1.5 0.5 -0.5 -2.5 -3.5(1)若x與y之間具有線性相關(guān)關(guān)系,求y關(guān)于x的經(jīng)驗(yàn)回歸方程;(2)若本次考試數(shù)學(xué)平均成績?yōu)?00分,物理平均成績?yōu)?0.5分,試由(1)的結(jié)論預(yù)測數(shù)學(xué)成績?yōu)?16分的同學(xué)的物理成績.參考公式:=,=-.參考數(shù)據(jù):=1 256,iyi=324.角度二 非線性回歸模型例3 [2024·河北承德模擬]某公司研制了一種對人畜無害的滅草劑,為了解其效果,通過實(shí)驗(yàn),收集到其不同濃度x(mol/L)與滅死率y的數(shù)據(jù),得下表:濃度x(mol/L) 10-12 10-10 10-8 10-6 10-4滅死率y 0.1 0.24 0.46 0.76 0.94(1)以x為解釋變量,y為響應(yīng)變量,在=x+和=1+2lg x中選一個(gè)作為滅死率y關(guān)于濃度x(mol/L)的經(jīng)驗(yàn)回歸方程,不用說明理由;(2)(i)根據(jù)(1)的選擇結(jié)果及表中數(shù)據(jù),求出所選經(jīng)驗(yàn)回歸方程;(ii)依據(jù)(i)中所求經(jīng)驗(yàn)回歸方程,要使滅死率不低于0.8,估計(jì)該滅草劑的濃度至少要達(dá)到多少mol/L 參考公式:對于一組數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其經(jīng)驗(yàn)回歸直線=x+的斜率和截距的最小二乘法估計(jì)分別為==,=-.題后師說解決非線性回歸模型的應(yīng)用問題的關(guān)鍵是對非線性回歸函數(shù)模型作變換,一般思路是換元,化非線性為線性,進(jìn)而應(yīng)用線性回歸的方法進(jìn)行求解.如①若=+,設(shè)t=,則=+t;②若滿足對數(shù)式:=+ln x,設(shè)t=ln x,則=+t;③若滿足指數(shù)式:y=c1ec2x,兩邊取對數(shù)得ln y=ln c1+c2x,設(shè)z=ln y,=ln c1,=c2,則=+x.鞏固訓(xùn)練3[2024·山東濱州模擬]為了加快實(shí)現(xiàn)我國高水平科技自立自強(qiáng),某科技公司逐年加大高科技研發(fā)投入.下圖1是該公司2013年至2022年的年份代碼x和年研發(fā)投入y(單位:億元)的散點(diǎn)圖,其中年份代碼1~10分別對應(yīng)年份2013~2022.根據(jù)散點(diǎn)圖,分別用模型①y=bx+a,②y=c+d作為年研發(fā)投入y關(guān)于年份代碼x的經(jīng)驗(yàn)回歸方程模型,并進(jìn)行殘差分析,得到圖2所示的殘差圖.結(jié)合數(shù)據(jù),計(jì)算得到如下表所示的一些統(tǒng)計(jì)量的值:表中ti=,=i.(1)根據(jù)殘差圖,判斷模型①和模型②哪一個(gè)更適宜作為年研發(fā)投入y關(guān)于年份代碼x的經(jīng)驗(yàn)回歸方程模型?并說明理由;(2)根據(jù)(1)中所選模型,求出y關(guān)于x的經(jīng)驗(yàn)回歸方程,并預(yù)測該公司2028年的高科技研發(fā)投入.附:對于一組數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其經(jīng)驗(yàn)回歸直線=+x的斜率和截距的最小二乘估計(jì)分別為=,=-.題型三 獨(dú)立性檢驗(yàn)例4 [2023·全國甲卷]一項(xiàng)試驗(yàn)旨在研究臭氧效應(yīng),試驗(yàn)方案如下:選40只小白鼠,隨機(jī)地將其中20只分配到試驗(yàn)組,另外20只分配到對照組,試驗(yàn)組的小白鼠飼養(yǎng)在高濃度臭氧環(huán)境,對照組的小白鼠飼養(yǎng)在正常環(huán)境,一段時(shí)間后統(tǒng)計(jì)每只小白鼠體重的增加量(單位:g).試驗(yàn)結(jié)果如下:對照組的小白鼠體重的增加量從小到大排序?yàn)?br/>15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.132.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2試驗(yàn)組的小白鼠體重的增加量從小到大排序?yàn)?br/>7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.219.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5(1)計(jì)算試驗(yàn)組的樣本平均數(shù);(2)(ⅰ)求40只小白鼠體重的增加量的中位數(shù)m,再分別統(tǒng)計(jì)兩樣本中小于m與不小于m的數(shù)據(jù)的個(gè)數(shù),完成如下列聯(lián)表對照組試驗(yàn)組(ⅱ)根據(jù)(i)中的列聯(lián)表,能否有95%的把握認(rèn)為小白鼠在高濃度臭氧環(huán)境中與在正常環(huán)境中體重的增加量有差異?附:χ2=,P(x2≥k0) 0.100 0.050 0.010k0 2.706 3.841 6.635題后師說獨(dú)立性檢驗(yàn)的一般步驟鞏固訓(xùn)練4[2024·河北秦皇島模擬]某市電視臺為了解一檔節(jié)目收視情況,隨機(jī)抽取了該市n對夫妻進(jìn)行調(diào)查,根據(jù)調(diào)查得到每人日均收看該節(jié)目的時(shí)間繪制成如圖所示的頻率分布直方圖,收視時(shí)間不低于40分鐘的觀眾稱為“熱心觀眾”,收視時(shí)間低于40分鐘的觀眾稱為“非熱心觀眾”,已知抽取樣本中收視時(shí)間低于10分鐘的有10人.(1)求n,p;(2)根據(jù)已知條件完成下面2×2列聯(lián)表,試根據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),分析“熱心觀眾”是否與性別有關(guān).非熱心觀眾 熱心觀眾 總計(jì)男女 10總計(jì)附:χ2=,其中n=a+b+c+d.α 0.10 0.05 0.025 0.010 0.005 0.001xα 2.706 3.841 5.024 6.635 7.879 10.8281.[2023·天津卷]調(diào)查某種群花萼長度和花瓣長度,所得數(shù)據(jù)如圖所示,其中相關(guān)系數(shù)r=0.8245,下列說法正確的是( ) A.花瓣長度和花萼長度沒有相關(guān)性B.花瓣長度和花萼長度呈現(xiàn)負(fù)相關(guān)C.花瓣長度和花萼長度呈現(xiàn)正相關(guān)D.若從樣本中抽取一部分,則這部分的相關(guān)系數(shù)一定是0.824 52.[2024·黑龍江大慶模擬]我國西北某地區(qū)開展改造沙漠的巨大工程,該地區(qū)對近5年投入的沙漠治理經(jīng)費(fèi)x(億元)和沙漠治理面積y(萬畝)的相關(guān)數(shù)據(jù)統(tǒng)計(jì)如下表所示.治理經(jīng)費(fèi)x/億元 3 4 5 6 7治理面積y/萬畝 10 12 11 12 20根據(jù)表中所給數(shù)據(jù),得到y(tǒng)關(guān)于x的經(jīng)驗(yàn)回歸方程為=2x+a,則a=( )A.1 B.2C.3 D.43.[2024·福建莆田模擬]根據(jù)分類變量X和Y的樣本觀察數(shù)據(jù)的計(jì)算結(jié)果,有不少于99.5%的把握認(rèn)為X和Y有關(guān),則χ2的一個(gè)可能取值為( )α 0.10 0.05 0.025 0.010 0.005xα 2.706 3.841 5.024 6.635 7.879A. 3.971 B.5.872C.6.775 D.9.6984.[2024·江蘇鎮(zhèn)江模擬]2023年五一節(jié)日期間,通過對某一路口在具體時(shí)刻的瞬時(shí)速度進(jìn)行觀測統(tǒng)計(jì)發(fā)現(xiàn),時(shí)刻x和瞬時(shí)速度y的關(guān)系如下:x(時(shí)) 4 5 6 7 8 9y(速度) 90 84 83 80 75 68由表中數(shù)據(jù)得到的經(jīng)驗(yàn)回歸方程為=-4x+a,則由此可預(yù)測此路口11時(shí)的瞬時(shí)速度為__________.第三節(jié) 成對數(shù)據(jù)的統(tǒng)計(jì)分析問題思考·夯實(shí)技能【問題1】 提示:不同.散點(diǎn)圖判定兩個(gè)分類變量是否具有相關(guān)關(guān)系,樣本相關(guān)系數(shù)r判定兩個(gè)分類變量相關(guān)性的強(qiáng)弱,決定系數(shù)R2判定所選模型擬合的程度.【問題2】 提示:正確.關(guān)鍵能力·題型剖析例1 解析:(1)畫出散點(diǎn)圖如下:從而可以看出=x+中,>0,<0.故選D.(2)去掉離群點(diǎn)后成對樣本數(shù)據(jù)的線性相關(guān)程度更強(qiáng),擬合效果會(huì)更好,且由表可知,兩個(gè)變量呈正相關(guān),所以r1故選AD.答案:(1)D (2)AD鞏固訓(xùn)練1 解析:(1)對于A,由圖象可知,兩個(gè)變量是確定的函數(shù)關(guān)系,不是相關(guān)關(guān)系,故A不正確;對于B,由散點(diǎn)圖可知,散點(diǎn)呈帶狀分布,所以兩個(gè)變量具有線性相關(guān)關(guān)系,故B正確;由散點(diǎn)圖可知,散點(diǎn)不呈帶狀分布,所以兩個(gè)變量不具有線性相關(guān)關(guān)系,故CD不正確.故選B.(2)因?yàn)榫€性相關(guān)系數(shù)r1=0.899 5>0,所以x,y正相關(guān),因?yàn)榫€性相關(guān)系數(shù)r2=-0.956 8<0,所以u,v負(fù)相關(guān),又因?yàn)閨r1|<|r2|,所以變量u,v的線性相關(guān)性比x,y的線性相關(guān)性強(qiáng),故A、B、D錯(cuò)誤,C正確.故選C.答案:(1)B (2)C例2 解析:(1)==5,==18.(xi-)(yi-)=16+12+5+0+0+3+6+27=69,(xi-)2=4+4+1+0+0+1+1+9=20,(yi-)2=64+36+25+0+1+9+36+81=252,代入公式可得相關(guān)系數(shù)r===≈0.97.由于|r|>0.75且r非常接近1,所以y與x具有很強(qiáng)的線性相關(guān)關(guān)系.經(jīng)計(jì)算可得===3.45,=-=18-3.45×5=0.75.所以所求經(jīng)驗(yàn)回歸方程為=3.45x+0.75.(2)(ⅰ)當(dāng)x=10時(shí),=3.45×10+0.75=35.25,所以預(yù)計(jì)能帶動(dòng)的消費(fèi)達(dá)35.25百萬元.(ⅱ)因?yàn)?10%,所以發(fā)放的該輪消費(fèi)券助力消費(fèi)復(fù)蘇不是理想的.發(fā)放消費(fèi)券只是影響消費(fèi)的其中一個(gè)因素,還有其他重要因素,比如:A城市經(jīng)濟(jì)發(fā)展水平不高,居民的收入水平直接影響了居民的消費(fèi)水平;A城市人口數(shù)量有限、商品價(jià)格水平、消費(fèi)者偏好、消費(fèi)者年齡構(gòu)成等因素一定程度上影響了消費(fèi)總量.(只要寫出一個(gè)原因即可).鞏固訓(xùn)練2 解析:(1)由題意可得,=×[20+15+13+3+2+(-5)+(-10)+(-18)]=,=×[6.5+3.5+3.5+1.5+0.5+(-0.5)+(-2.5)+(-3.5)]=,又=1 256,iyi=324,∴==,=-×=,∴y關(guān)于x的經(jīng)驗(yàn)回歸方程為:=x+.(2)設(shè)該同學(xué)的物理成績?yōu)閃,則物理偏差為W-70.5.又?jǐn)?shù)學(xué)偏差為116-100=16,∴W-70.5=×16+,解得W=75.∴預(yù)測這位同學(xué)的物理成績?yōu)?5分.例3 解析:(1)根據(jù)表格數(shù)據(jù)可知解釋變量x呈現(xiàn)指數(shù)增長,而響應(yīng)變量y增長幅度不大,且相應(yīng)的增加量大約相等,故選=1+2lg x.(2)(ⅰ)令ui=lg xi,則=1+2u,所以可得如下數(shù)據(jù)u -12 -10 -8 -6 -4y 0.1 0.24 0.46 0.76 0.94則=(-12-10-8-6-4)=-8,=(0.1+0.24+0.46+0.76+0.94)=0.5,=(-12)2+(-10)2+(-8)2+(-6)2+(-4)2=360,iyi=(-12)×0.1+(-10)×0.24+(-8)×0.46+(-6)×0.76+(-4)×0.94=-15.6,所以2==0.11,1=0.5-0.11×(-8)=1.38,所以=1.38+0.11u,即=1.38+0.11lg x;(ⅱ)依題意=1.38+0.11lg x≥0.8,即0.11lg x≥-0.58,即lg x≥-,所以x≥10-,即要使滅死率不低于0.8,則該滅草劑的濃度至少要達(dá)到10-mol/L.鞏固訓(xùn)練3 解析:(1)根據(jù)圖2可知,模型①的殘差波動(dòng)性很大,說明擬合關(guān)系較差;模型②的殘差波動(dòng)性很小,基本分布在0的附近,說明擬合關(guān)系很好,所以選擇模型②更適宜.(2)設(shè)t=,所以y=c+dt,所以===6.3,=- =60.825,所以y關(guān)于x的經(jīng)驗(yàn)回歸方程為y=60.825+6.3,令x=16,則y=60.825+6.3×4=86.025,即預(yù)測該公司2028年的高科技研發(fā)投入為86.025億元.例4 解析:(1)試驗(yàn)組樣本平均數(shù)為:(7.8+9.2+11.4+12.4+13.2+15.5+16.5+18.0+18.8+19.2+19.8+20.2+21.6+22.8+23.6+23.9+25.1+28.2+32.3+36.5)==19.8.(2)(ⅰ)依題意,可知這40只小鼠體重的中位數(shù)是將兩組數(shù)據(jù)合在一起,從小到大排列后第20位與第21位數(shù)據(jù)的平均數(shù),由原數(shù)據(jù)可得第11位數(shù)據(jù)為18.8,后續(xù)依次為19.2,19.8,20.2,20.2,21.3,21.6,22.5,22.8,23.2,23.6,…,故第20位為23.2,第21位數(shù)據(jù)為23.6,所以m==23.4,故列聯(lián)表為:對照組 6 14 20試驗(yàn)組 14 6 20合計(jì) 20 20 40(ⅱ)由(ⅰ)可得,K2==6.400>3.841,所以能有95%的把握認(rèn)為小白鼠在高濃度臭氧環(huán)境中與在正常環(huán)境中體重的增加量有差異.鞏固訓(xùn)練4 解析:(1)收視時(shí)間在0~10分鐘組的頻率為1-(0.018+0.022+0.025+0.020+0.005)×10=0.1,∴p==0.01,又∵收視時(shí)間低于10分鐘的有10人,∴2n=,∴n=50.(2)∵n=50,∴“熱心觀眾”有2×50×(0.020+0.005)×10=25人,則2×2列聯(lián)表如圖所示,非熱心觀眾 熱心觀眾 總計(jì)男 35 15 50女 40 10 50總計(jì) 75 25 100零假設(shè)H0:“熱心觀眾”與性別無關(guān)聯(lián).將2×2列聯(lián)表數(shù)據(jù)代入公式計(jì)算得:χ2==≈1.333<3.841,根據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),沒有充分證據(jù)證明H0不成立,因此可認(rèn)為H0成立,即認(rèn)為“熱心觀眾”與性別無關(guān)聯(lián).隨堂檢測1.解析:根據(jù)散點(diǎn)的集中程度可知,花瓣長度和花萼長度有相關(guān)性,A選項(xiàng)錯(cuò)誤;散點(diǎn)的分布是從左下到右上,從而花瓣長度和花萼長度呈現(xiàn)正相關(guān),B選項(xiàng)錯(cuò)誤,C選項(xiàng)正確;由于r=0.824 5是全部數(shù)據(jù)的相關(guān)系數(shù),取出來一部分?jǐn)?shù)據(jù),相關(guān)性可能變強(qiáng),可能變?nèi)酰慈〕龅臄?shù)據(jù)的相關(guān)系數(shù)不一定是0.824 5,D選項(xiàng)錯(cuò)誤.故選C.答案:C2.解析: ==5,==13,因回歸方程過定點(diǎn)(,),將其代入=2x+a,得13=2×5+a,解得a=3.故選C.答案:C3.解析:因?yàn)橛胁簧儆?9.5%的把握認(rèn)為X和Y有關(guān),所以χ2≥7.879,9.698≥7.879,滿足題意,故選D.答案:D4.解析:由題意可得,==,==80,則80=-4×+a,解得a=106,當(dāng)x=11時(shí),=-4×11+106=62.答案:62 展開更多...... 收起↑ 資源列表 2025屆高中數(shù)學(xué)一輪復(fù)習(xí)導(dǎo)學(xué)案:9.1隨機(jī)抽樣、統(tǒng)計(jì)圖表.docx 2025屆高中數(shù)學(xué)一輪復(fù)習(xí)導(dǎo)學(xué)案:9.2用樣本估計(jì)總體.docx 2025屆高中數(shù)學(xué)一輪復(fù)習(xí)導(dǎo)學(xué)案:9.3成對數(shù)據(jù)的統(tǒng)計(jì)分析.docx 縮略圖、資源來源于二一教育資源庫