中文字幕精品无码一区二区,成全视频在线播放观看方法,大伊人青草狠狠久久,亚洲一区影音先锋色资源

【名師導航2024】高中數學二輪復習學案——9.1統計與成對數據的統計分析(新高考)

資源下載
  1. 二一教育資源

【名師導航2024】高中數學二輪復習學案——9.1統計與成對數據的統計分析(新高考)

資源簡介

中小學教育資源及組卷應用平臺
9.1統計與成對數據的統計分析
【備考指南】 1
【知識導圖】 2
【考點梳理】 6
考點一:隨機抽樣 6
考點二:用樣本估計總體 8
考點三:變量間的相關關系 10
考點四:相關系數r 12
考點五:誤差分析 15
考點六:獨立性檢驗 17
【真題在線】 20
【專項突破】 26
考點 考情分析 考頻
古典概率模型 2022年新高考Ⅰ卷T5 2022年全國甲卷T6 2022年全國甲卷T15 1年3考
相互獨立事件 2023年新高考Ⅰ卷T21 2022年全國乙卷T10 2年2考
獨立性檢驗模型 2022年全國甲卷T17 2021年新高考Ⅰ卷T8 2年2考
分布列、均值與統計圖 2022年新高考Ⅱ卷T9
分布列、均值與概率 2022年全國甲卷T19
分布列、均值與獨立性檢驗 2023年全國甲卷T19
用樣本估計總體 2022年全國甲卷T2 2022年全國乙卷T4 1年2考
正態分布 2022年新高考Ⅱ卷T13
條件概率 2022年新高考Ⅰ卷T20
統計與樣本方差 2023年全國乙卷T17
預測:統計與成對數據的統計分析是高考的重點、熱點,一般情況考察難度適中,建議加強基礎概念的掌握與合理的運用.
考點一:隨機抽樣
【典例精析】(多選)(2024·貴州黔東南·二模)某學校為了解學生身高(單位:cm)情況,采用分層隨機抽樣的方法從4000名學生(該校男女生人數之比為)中抽取了一個容量為100的樣本.其中,男生平均身高為175,方差為184,女生平均身高為160,方差為179.則下列說法正確的是參考公式:總體分為2層,各層抽取的樣本量、樣本平均數和樣本方差分別為:,,,,,.記總的樣本平均數為,樣本方差為,則( )
參考公式:
A.抽取的樣本里男生有60人
B.每一位學生被抽中的可能性為
C.估計該學校學生身高的平均值為170
D.估計該學校學生身高的方差為236
【變式訓練】
一、單選題
1.(2021·甘肅天水·模擬預測)我國古代數學名著《數書九章》中有“米谷粒分”問題;“開倉受納,有甲戶米一千五百三十四石到廊.驗得米內夾谷,乃于樣內取米一捻,數計二百五十四粒內有谷二十八顆,凡粒米率每勺三百,今欲知米內雜谷多少”,其大意是,糧倉開倉收糧,有人送來米1534石,驗得米內夾谷,抽樣取米一把,數得254粒內夾谷28粒,則這批米內夾谷約為( )
A.153石 B.154石 C.169石 D.170石
2.(2024·陜西西安·一模)某高校對中文系新生進行體測,利用隨機數表對650名學生進行抽樣,先將650名學生進行編號,001,002,…,649,650.從中抽取50個樣本,下圖提供隨機數表的第4行到第6行,若從表中第5行第6列開始向右讀取數據,則得到的第6個樣本編號是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.623 B.328 C.072 D.457
二、多選題
3.(2023·安徽合肥·模擬預測)某學校高三年級學生有500人,其中男生320人,女生180人.為了獲得該校全體高三學生的身高信息,現采用分層抽樣的方法抽取樣本,并觀測樣本的指標值(單位:cm),計算得男生樣本的均值為174,方差為16,女生樣本的均值為164,方差為30.則下列說法正確的是( )
A.如果抽取25人作為樣本,則抽取的樣本中男生有16人
B.該校全體高三學生的身高均值為171
C.抽取的樣本的方差為44.08
D.如果已知男 女的樣本量都是25,則總樣本的均值和方差可以作為總體均值和方差的估計值
4.(2024·湖南懷化·二模)下列說法正確的是( )
A.某校高一年級共有男女學生500人,現按性別采用分層抽樣的方法抽取容量為50人的樣本,若樣本中男生有30人,則該校高一年級女生人數是200
B.數據1,3, 4,5,7,9,11,16的第75百分位數為10
C.線性回歸方程中,若線性相關系數越大,則兩個變量的線性相關性越強
D.根據分類變量與的成對樣本數據,計算得到,根據小概率值的獨立性檢驗,可判斷與有關聯,此推斷犯錯誤的概率不大于0.05
三、填空題
5.(2024·陜西安康·模擬預測)杭州亞運會期間,某社區有200人參加協助交通管理的志愿團隊,為了解他們參加這項活動的感受,用分層抽樣的方法隨機抽取了一個容量為40的樣本,若樣本中女性有16人,則該志愿團隊中的男性人數為 .
考點二:用樣本估計總體
【典例精析】(多選)(2024·河南三門峽·模擬預測)某燈具配件廠生產了一種塑膠配件,該廠質檢人員某日隨機抽取了100個該配件的質量指標值(單位:分)作為一個樣本,得到如下所示的頻率分布直方圖,則(同一組中的數據用該組區間的中點值作代表)( )
A.
B.樣本質量指標值的平均數為75
C.樣本質量指標值的眾數小于其平均數
D.樣本質量指標值的第75百分位數為85
【變式訓練】
一、單選題
1.(2024·江西·二模)從甲隊60人、乙隊40人中,按照分層抽樣的方法從兩隊共抽取10人,進行一輪答題.相關統計情況如下:甲隊答對題目的平均數為1,方差為1;乙隊答對題目的平均數為1.5,方差為0.4,則這10人答對題目的方差為( )
A.0.8 B.0.675 C.0.74 D.0.82
二、多選題
2.(2023·全國·模擬預測)新能源汽車產業是戰略性新興產業,發展新能源汽車是推動節能減排的有效措施,是解決能源環境問題的有效途徑,同時也是實現國家生態文明建設的有力舉措.某地區2017年至2021年每年汽車總銷量(單位:萬輛)和新能源汽車銷量占比(注:汽車總銷量指新能源汽車銷量與非新能源汽車銷量之和)如表所示,則( )
年份 2017 2018 2019 2020 2021
汽車總銷量/萬輛 5.5 5.8 6.0 7.0 7.7
新能源汽車銷量占比 4% 6% 8% 7% 20%
A.該地區2017年至2021年平均每年銷售汽車6.4萬輛
B.該地區2017年至2021年平均每年銷售新能源汽車少于0.5萬輛
C.該地區2017年至2021年新能源汽車銷量逐年增加
D.該地區2017年至2021年非新能源汽車銷量逐年減少
三、填空題
3.(2022·吉林·模擬預測)北京時間2022年4月16日09時56分,神舟十三號載人飛船返回艙在東風著陸場成功著陸,將在太空“出差”半年的翟志剛 王亞平 葉光富送回到闊別已久的祖國大地.神舟十三號載人飛行任務的圓滿成功,標志著空間站關鍵技術驗證階段任務圓滿完成,中國空間站即將進入建造階段.某機構研究室通過隨機抽樣的方式,對18歲及以上人群進行了“你是否曾有過航天夢想”的調查研究,得到如下的統計結果:
根據調查結果,以下說法正確的是 .
①在“曾有過航天夢想”的人群中,54歲及以上的人數最少
②在“曾有過航天夢想”的人群中,年齡越大,在航天相關方面的人均消費越少
③在“曾有過航天夢想”的人群中,18-29歲在航天相關方面的總消費最多
四、解答題
4.(2024·四川成都·三模)某保險公司為了給年齡在20~70歲的民眾提供某種疾病的醫療保障,設計了一款針對該疾病的保險,現從10000名參保人員中隨機抽取100名進行分析,這100個樣本按年齡段分成了五組,其頻率分布直方圖如下圖所示,每人每年所交納的保費與參保年齡如下表格所示.(保費:元)據統計,該公司每年為該項保險支出的各種費用為一百萬元.
年齡
保費
(1)用樣本的頻率分布估計總體的概率分布,為使公司不虧本,則保費至少為多少元?(精確到整數)
(2)隨著年齡的增加,該疾病患病的概率越來越大,經調查,年齡在的老人中每15人就有1人患該項疾病,年齡在的老人中每10人就有1人患該項疾病,現分別從年齡在和的老人中各隨機選取1人,記表示選取的這2人中患該疾病的人數,求的數學期望.
考點三:變量間的相關關系
【典例精析】(多選)(2024·山東棗莊·模擬預測)已知兩個變量y與x對應關系如下表:
x 1 2 3 4 5
y 5 m 8 9 10.5
若y與x滿足一元線性回歸模型,且經驗回歸方程為,則( )
A.y與x正相關 B.
C.樣本數據y的第60百分位數為8 D.各組數據的殘差和為0
【變式訓練】
一、單選題
1.(2024·河北·一模)某校為了解本校高一男生身高和體重的相關關系,在該校高一年級隨機抽取了7名男生,測量了他們的身高和體重得下表:
身高x(單位:) 167 173 175 177 178 180 181
體重y(單位:) 90 54 59 64 67 72 76
由表格制作成如圖所示的散點圖:
由最小二乘法計算得到經驗回歸直線的方程為,其相關系數為;經過殘差分析,點對應殘差過大,把它去掉后,再用剩下的6組數據計算得到經驗回歸直線的方程為,相關系數為.則下列選項正確的是( )
A. B.
C. D.
2.(2024·安徽蚌埠·模擬預測)為維護市場秩序,保護消費者權益,在“五一”假期來臨之際,我市物價部門對某商品在5家商場的售價(元)及其一天的銷售量(件)進行調查,得到五對數據,經過分析、計算,得,關于的經驗回歸方程為,則相應于點的殘差為( )
A. B.1 C. D.3
二、多選題
3.(2024·浙江金華·三模)某班主任用下表分析高三前5次考試中本班級在年級中的成績排名y與考試次數x的相關性時,忘記了第二次和第四次考試排名,但他記得平均排名,于是分別用和得到了兩個經驗回歸方程:,,對應的樣本相關系數分別為,,排名y對應的方差分別為,,則( )
x 1 2 3 4 5
y 10 m 6 n 2
附:,,.
A. B.
C. D.
三、填空題
4.(2022·北京·模擬預測)某班在一次考試后分析學生在語文 數學 英語三個學科的表現,繪制了各科年級排名的散點圖(如下圖所示).
關于該班級學生這三個學科本次考試的情況,給出下列四個結論:
①三科中,數學年級排名的平均數及方差均最小;
②語文、數學、英語年級排名均在150名以外的學生為1人;
③本次考試該班語文第一名、數學第一名、英語第一名可能為三名不同的同學;
④從該班學生中隨機抽取1人,若其語文排名大于200,則其英語和數學排名均在150以內的概率為.
其中所有正確結論的序號是 .
四、解答題
5.(2024·四川眉山·三模)某公司為改進生產,現對近5年來生產經營情況進行分析.收集了近5年的利潤(單位:億元)與年份代碼共5組數據(其中年份代碼分別指2019年,2020年,年),并得到如下值:.
(1)若用線性回歸模型擬合變量與的相關關系,計算該樣本相關系數,并判斷變量與的相關程度(精確到0.01);
(2)求變量關于的線性回歸方程,并求2024年利潤的預報值.
附:①;②若,相關程度很強;,相關程度一般;,相關程度較弱;③一組數據,其回歸直線的斜率和截距的最小二乘估計分別為;相關系數.
考點四:相關系數r
【典例精析】(多選)(2024·湖北武漢·二模)下列說法正確的是( )
A.將一組數據的每一個數減去同一個數后,新數據的方差與原數據方差相同
B.線性回歸直線一定過樣本點中心
C.線性相關系數越大,兩個變量的線性相關性越強
D.在殘差的散點圖中,殘差分布的水平帶狀區域的寬度越窄,其模型的擬合效果越好
【變式訓練】
一、單選題
1.(2024·天津·二模)有人通過調查統計發現,兒子成年時的身高與父親的身高呈線性相關,且兒子成年時的身高(單位:)與父親的身高(單位:)的經驗回歸方程為,根據以上信息,下列判斷正確的為( ).
A.兒子成年時的身高與父親的身高的樣本相關系數
B.父親的身高為,兒子成年時的身高一定在到之間
C.父親的身高每增加,兒子成年時的身高平均增加
D.兒子在成年時的身高一般會比父親高
2.(2024·上海徐匯·二模)為了研究y關于x的線性相關關系,收集了5組樣本數據(見下表):
x 1 2 3 4 5
y 0.5 0.9 1 1.1 1.5
若已求得一元線性回歸方程為,則下列選項中正確的是( )
A.
B.當時,y的預測值為2.2
C.樣本數據y的第40百分位數為1
D.去掉樣本點后,x與y的樣本相關系數r不會改變
二、多選題
3.(2024·吉林長春·模擬預測)相關變量x,y的散點圖如下,若剔除點13后,剩下數據得到的統計中,較剔除之前值變小的是( )
A.樣本的相關系數 B.殘差的平方和
C.樣本數據y的平均值 D.回歸直線中的回歸系數
三、填空題
4.(2023·上海徐匯·模擬預測)下列說法中正確的有 (填正確說法的序號).
①若樣本數據,,…,的方差為4,則數據,,…,的標準差為4;
②已知隨機變量,且,則;
③若線性相關系數越接近1,則兩個變量的線性相關性越弱;
④若事件A,B滿足,,,則有.
四、解答題
5.(2024·山東聊城·三模)今年五一節期間,聊城百貨大樓有限公司搞促銷活動,下表是該公司5月1號至10號(日期簡記為1,2,3,……,10)連續10天的銷售情況:
日期 1 2 3 4 5 6 7 8 9 10
銷售額(萬元) 19 19.3 19.6 20 21.2 22.4 23.8 24.6 25 25.4
由上述數據,用最小二乘法得到銷售額和日期的線性回歸方程為,日期的方差約為3.02,銷售額的方差約為2.59.
(1)根據線性回歸方程,分析銷售額隨日期變化趨勢的特征,并計算第4天的殘差;
(2)計算相關系數,并分析銷售額和日期的相關程度(精確到0.001);
(3)該公司為了促銷,擬打算對電視機實行分期付款方式銷售,假設顧客購買一臺電視機選擇分期付款的期數及相應的概率和公司獲得的利潤(單位:元)情況如下表:
2 4 6
400 600 800
已知成等比數列.
設該公司銷售兩臺電視機所獲得的利潤為(單位:元),當的概率取得最大值時,求利潤的分布列和數學期望.
參考公式:相關系數.回歸方程中斜率和截距的最小二乘法估計公式分別為:.相關數據.
考點五:誤差分析
【典例精析】(多選)(2024·江西鷹潭·二模)下列說法中,正確的是( )
A.一組數據10,11,11,12,13,14,16,18,20,22的第40百分位數為12
B.兩組樣本數據,,,和,,,的方差分別為,,若已知(),則
C.已知隨機變量服從正態分布,若,則
D.已知一系列樣本點()的回歸方程為,若樣本點與的殘差(殘差=實際值-模型預測值)相等,則
【變式訓練】
一、單選題
1.(2024·四川成都·三模)地球生命來自外星嗎?一篇發布在《生物學快訊》上的文章《基因庫的增長是生命起源和演化的時鐘》可能給出了一種答案.該論文的作者根據生物功能性基因組里的堿基排列數的大小定義了基因庫的復雜度y(單位:1),通過研究各個年代的古代生物化石里基因庫的復雜度,提出了一個有趣的觀點:生物基因庫的復雜度近似是隨時間呈指數增長的,只要知道生物基因庫的復雜度就可以推測該生物體出現的年代.如圖是該論文作者根據生物化石(原核生物,真核生物,蠕蟲,魚類,哺乳動物)中的基因復雜度的常用對數與時間(單位:十億年)的散點圖及回歸擬合情況(其中回歸方程為:,相關指數).根據題干與圖中的信息,下列說法錯誤的是( )
A.根據信息生物基因庫的復雜度近似是隨時間呈指數增長的情況,不同于作者采取取常用對數的做法,我們也可采用函數模型來擬合
B.根據回歸方程可以得到,每過10億年,生物基因庫的復雜度一定增加到原來的倍
C.雖然擬合相關指數為0.97,但是樣本點只有5個,不能很好地闡釋其統計規律,所以增加可靠的樣本點可以更好地完善回歸方程
D.根據物理界主流觀點:地球的形成始于45億年前,及擬合信息:地球在誕生之初時生物的復雜度大約為,可以推斷地球生命可能并非誕生于地球
2.(2024·江蘇蘇州·模擬預測)下列說法中,正確的是( )
A.已知一系列樣本點一個經驗回歸方程,若樣本點與的殘差相等,則
B.已知隨機變量,若,則
C.將5名同學分到三個組開展活動,每個組至少1名,則不同分配方法數是240
D.每人參加一次游戲,每輪游戲有三個題目,每個題目答對的概率均為且相互獨立,若答對題數多于答錯題數可得4分,否則得2分,則某人參加游戲得分的期望為3
二、多選題
3.(2024·河北唐山·二模)為研究光照時長(小時)和種子發芽數量(顆)之間的關系,某課題研究小組采集了10組數據,繪制散點圖如圖所示,并進行線性回歸分析,若去掉點后,下列說法正確的是( )
A.相關系數變小 B.經驗回歸方程斜率變小
C.殘差平方和變小 D.決定系數變小
三、填空題
4.(2024·廣東廣州·一模)某校數學建模興趣小組收集了一組恒溫動物體重(單位:克)與脈搏率(單位:心跳次數/分鐘)的對應數據,根據生物學常識和散點圖得出與近似滿足(為參數).令,,計算得,,.由最小二乘法得經驗回歸方程為,則的值為 ;為判斷擬合效果,通過經驗回歸方程求得預測值,若殘差平方和,則決定系數 .(參考公式:決定系數)
四、解答題
5.(2024·四川德陽·三模)某公司為了確定下季度的前期廣告投入計劃,收集并整理了近6個月廣告投入量x(單位:萬元)和收益y(單位:萬元)的數據如表(其中有些數據污損不清):
月份 1 2 3 4 5 6
廣告投入量 2 7 8 10
收益 20 30 34 37
他們分別用兩種模型①,②進行擬合,得到相應的回歸方程并進行殘差分析,得到如圖所示的殘差圖及一些統計量的值.
(1)根據殘差圖,比較模型①,②的擬合效果,應選擇哪個模型
(2)殘差絕對值大于2 的數據被認為是異常數據,需要剔除.
(i)剔除異常數據后,求出(1)中所選模型的回歸方程;
(ii)若廣告投入量x=19,則(1)中所選模型收益的預報值是多少萬元 (精確到0.01)
附:對于一組數據 其回歸直線 的斜率和截距的最小二乘估計分別為: .
考點六:獨立性檢驗
【典例精析】(多選)(2024·安徽黃山·二模)下列論述正確的有( )
A.若隨機變量滿足,則
B.若隨機事件,滿足:,,,則事件與相互獨立
C.基于小概率值的檢驗規則是:當時,我們就推斷不成立,即認為和不獨立,該推斷犯錯誤的概率不超過;當時,我們沒有充分證據推斷不成立,可以認為和獨立
D.若關于的經驗回歸方程為,則樣本點的殘差為
【變式訓練】
一、單選題
1.(2024·黑龍江哈爾濱·二模)針對2025年第九屆亞冬會在哈爾濱舉辦,校團委對“是否喜歡冰雪運動與學生性別的關系”進行了一次調查,其中被調查的男、女生人數相同,男生中喜歡冰雪運動的人數占男生人數的,女生中喜歡冰雪運動的人數占女生人數的,若依據的獨立性檢驗,認為是否喜歡冰雪運動與學生性別有關,則被調查的學生中男生的人數不可能是( )
附:.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.48 B.54 C.60 D.66
2.(2024·山東棗莊·一模)某兒童醫院用甲、乙兩種療法治療小兒消化不良.采用有放回簡單隨機抽樣的方法對治療情況進行檢查,得到兩種療法治療數據的列聯表:
療法 療效 合計
未治愈 治愈
甲 15 52 67
乙 6 63 69
合計 21 115 136
經計算得到,根據小概率值的獨立性檢驗(已知獨立性檢驗中),則可以認為( )
A.兩種療法的效果存在差異
B.兩種療法的效果存在差異,這種判斷犯錯誤的概率不超過0.005
C.兩種療法的效果沒有差異
D.兩種療法的效果沒有差異,這種判斷犯錯誤的概率不超過0.005
二、多選題
3.(2024·云南·模擬預測)下列說法正確的是( )
A.設隨機變量的均值為是不等于的常數,則相對于的偏離程度小于相對于的偏離程度(偏離程度用差的平方表示)
B.若一組數據的方差為0,則所有數據都相同
C.用決定系數比較兩個回歸模型的擬合效果時,越小,殘差平方和越小,模型擬合效果越好
D.在對兩個分類變量進行獨立性檢驗時,如果列聯表中所有數據都擴大為原來的10倍,在相同的檢驗標準下,再去判斷兩變量的關聯性時,結論不會發生改變
三、填空題
4.(22-23高三·全國·課后作業)某校團委對“學生性別和喜歡網絡游戲是否有關”作了一次調查,其中被調查的男女生人數相同,男生喜歡網絡游戲的人數占男生人數的,女生喜歡網絡游戲的人數占女生人數的.若根據獨立性檢驗認為喜歡網絡游戲和性別有關,且此推斷犯錯誤的概率超過0.01但不超過0.05,則被調查的學生中男生可能有 人.(請將所有可能的結果都填在橫線上)
附表:,其中.
0.050 0.010
3.841 6.635
四、解答題
5.(2024·貴州畢節·三模)2023年12月30日8時13分,長征二號丙/遠征一號S運載火箭在酒泉衛星發射中心點火起飛,隨后成功將衛星互聯網技術試驗衛星送入預定軌道由中國航天科技集團有限公司研制的運載火箭48次宇航任務全部取得圓滿成功.也代表著中國航天2023年完美收官某市一調研機構為了了解當地學生對我國航天事業發展的關注度,隨機從本市大學生和高中生中抽取一個容量為的樣本,根據調查結果得到如下列聯表:
學生群體 關注度 合計
關注 不關注
大學生
高中生
合計
(1)完成上述列聯表;依據小概率值的獨立性檢驗,認為關注航天事業發展與學生群體有關聯,求樣本容量n的最小值;
(2)用頻率估計概率,從本市大學生和高中生中隨機選取3人,用X表示不關注的人數,求X的分布列和數學期望.
附:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
,其中.
一、單選題
1.(2023·全國·高考真題)某學校為了解學生參加體育運動的情況,用比例分配的分層隨機抽樣方法作抽樣調查,擬從初中部和高中部兩層共抽取60名學生,已知該校初中部和高中部分別有400名和200名學生,則不同的抽樣結果共有( ).
A.種 B.種
C.種 D.種
2.(2022·全國·高考真題)某社區通過公益講座以普及社區居民的垃圾分類知識.為了解講座效果,隨機抽取10位社區居民,讓他們在講座前和講座后各回答一份垃圾分類知識問卷,這10位社區居民在講座前和講座后問卷答題的正確率如下圖:
則( )
A.講座前問卷答題的正確率的中位數小于
B.講座后問卷答題的正確率的平均數大于
C.講座前問卷答題的正確率的標準差小于講座后正確率的標準差
D.講座后問卷答題的正確率的極差大于講座前正確率的極差
3.(2021·全國·高考真題)為了解某地農村經濟情況,對該地農戶家庭年收入進行抽樣調查,將農戶家庭年收入的調查數據整理得到如下頻率分布直方圖:
根據此頻率分布直方圖,下面結論中不正確的是( )
A.該地農戶家庭年收入低于4.5萬元的農戶比率估計為6%
B.該地農戶家庭年收入不低于10.5萬元的農戶比率估計為10%
C.估計該地農戶家庭年收入的平均值不超過6.5萬元
D.估計該地有一半以上的農戶,其家庭年收入介于4.5萬元至8.5萬元之間
二、多選題
4.(2023·全國·高考真題)有一組樣本數據,其中是最小值,是最大值,則( )
A.的平均數等于的平均數
B.的中位數等于的中位數
C.的標準差不小于的標準差
D.的極差不大于的極差
5.(2021·全國·高考真題)下列統計量中,能度量樣本的離散程度的是( )
A.樣本的標準差 B.樣本的中位數
C.樣本的極差 D.樣本的平均數
三、解答題
6.(2023·全國·高考真題)一項試驗旨在研究臭氧效應.實驗方案如下:選40只小白鼠,隨機地將其中20只分配到實驗組,另外20只分配到對照組,實驗組的小白鼠飼養在高濃度臭氧環境,對照組的小白鼠飼養在正常環境,一段時間后統計每只小白鼠體重的增加量(單位:g).
(1)設表示指定的兩只小白鼠中分配到對照組的只數,求的分布列和數學期望;
(2)實驗結果如下:
對照組的小白鼠體重的增加量從小到大排序為:
15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1
32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2
實驗組的小白鼠體重的增加量從小到大排序為:
7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2
19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5
(i)求40只小鼠體重的增加量的中位數m,再分別統計兩樣本中小于m與不小于的數據的個數,完成如下列聯表:
對照組
實驗組
(ii)根據(i)中的列聯表,能否有95%的把握認為小白鼠在高濃度臭氧環境中與正常環境中體重的增加量有差異.
附:
0.100 0.050 0.010
2.706 3.841 6.635
7.(2023·全國·高考真題)某廠為比較甲乙兩種工藝對橡膠產品伸縮率的處理效應,進行10次配對試驗,每次配對試驗選用材質相同的兩個橡膠產品,隨機地選其中一個用甲工藝處理,另一個用乙工藝處理,測量處理后的橡膠產品的伸縮率.甲、乙兩種工藝處理后的橡膠產品的伸縮率分別記為,.試驗結果如下:
試驗序號 1 2 3 4 5 6 7 8 9 10
伸縮率 545 533 551 522 575 544 541 568 596 548
伸縮率 536 527 543 530 560 533 522 550 576 536
記,記的樣本平均數為,樣本方差為.
(1)求,;
(2)判斷甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率是否有顯著提高(如果,則認為甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率有顯著提高,否則不認為有顯著提高)
8.(2023·全國·高考真題)某研究小組經過研究發現某種疾病的患病者與未患病者的某項醫學指標有明顯差異,經過大量調查,得到如下的患病者和未患病者該指標的頻率分布直方圖:
利用該指標制定一個檢測標準,需要確定臨界值c,將該指標大于c的人判定為陽性,小于或等于c的人判定為陰性.此檢測標準的漏診率是將患病者判定為陰性的概率,記為;誤診率是將未患病者判定為陽性的概率,記為.假設數據在組內均勻分布,以事件發生的頻率作為相應事件發生的概率.
(1)當漏診率%時,求臨界值c和誤診率;
(2)設函數,當時,求的解析式,并求在區間的最小值.
9.(2022·全國·高考真題)在某地區進行流行病學調查,隨機調查了100位某種疾病患者的年齡,得到如下的樣本數據的頻率分布直方圖:

(1)估計該地區這種疾病患者的平均年齡(同一組中的數據用該組區間的中點值為代表);
(2)估計該地區一位這種疾病患者的年齡位于區間的概率;
(3)已知該地區這種疾病的患病率為,該地區年齡位于區間的人口占該地區總人口的.從該地區中任選一人,若此人的年齡位于區間,求此人患這種疾病的概率.(以樣本數據中患者的年齡位于各區間的頻率作為患者的年齡位于該區間的概率,精確到0.0001).
10.(2022·全國·高考真題)某地經過多年的環境治理,已將荒山改造成了綠水青山.為估計一林區某種樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:)和材積量(單位:),得到如下數據:
樣本號i 1 2 3 4 5 6 7 8 9 10 總和
根部橫截面積 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材積量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并計算得.
(1)估計該林區這種樹木平均一棵的根部橫截面積與平均一棵的材積量;
(2)求該林區這種樹木的根部橫截面積與材積量的樣本相關系數(精確到0.01);
(3)現測量了該林區所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和為.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數據給出該林區這種樹木的總材積量的估計值.
附:相關系數.
11.(2022·全國·高考真題)一醫療團隊為研究某地的一種地方性疾病與當地居民的衛生習慣(衛生習慣分為良好和不夠良好兩類)的關系,在已患該疾病的病例中隨機調查了100例(稱為病例組),同時在未患該疾病的人群中隨機調查了100人(稱為對照組),得到如下數據:
不夠良好 良好
病例組 40 60
對照組 10 90
(1)能否有99%的把握認為患該疾病群體與未患該疾病群體的衛生習慣有差異?
(2)從該地的人群中任選一人,A表示事件“選到的人衛生習慣不夠良好”,B表示事件“選到的人患有該疾病”.與的比值是衛生習慣不夠良好對患該疾病風險程度的一項度量指標,記該指標為R.
(ⅰ)證明:;
(ⅱ)利用該調查數據,給出的估計值,并利用(ⅰ)的結果給出R的估計值.
附,
0.050 0.010 0.001
k 3.841 6.635 10.828
12.(2021·全國·高考真題)甲、乙兩臺機床生產同種產品,產品按質量分為一級品和二級品,為了比較兩臺機床產品的質量,分別用兩臺機床各生產了200件產品,產品的質量情況統計如下表:
一級品 二級品 合計
甲機床 150 50 200
乙機床 120 80 200
合計 270 130 400
(1)甲機床、乙機床生產的產品中一級品的頻率分別是多少
(2)能否有99%的把握認為甲機床的產品質量與乙機床的產品質量有差異
附:
0.050 0.010 0.001
k 3.841 6.635 10.828
一、單選題
1.(2024·遼寧·模擬預測)下表為某地春節假期某日游客抽取的100人樣本的出行方式統計數據
出行方式 高鐵 自駕 飛機 客車
頻數 27 16 28 29
某實驗點從這批游客中抽取25人,當中選擇飛機出行的人數大約為( )
A.8 B.7 C.6 D.4
2.(2024·河北保定·二模)某學生通過計步儀器,記錄了自己最近30天每天走的步數,數據從小到大排序如下:
5588 6054 8799 9851 9901 10111 11029 11207 12634 12901
13001 13092 13127 13268 13562 13621 13761 13801 14101 14172
14191 14292 14426 14468 14562 14621 15061 15601 15901 19972
估計該學生最近30天每天走的步數數據的第75百分位數為( )
A.14292 B.14359 C.14426 D.14468
3.(2024·廣東茂名·二模)已知變量和的統計數據如表:
1 2 3 4 5
6 6 7 8 8
根據上表可得回歸直線方程,據此可以預測當時,( )
A.8.5 B.9 C.9.5 D.10
4.(2024·上海金山·二模)下列說法不正確的是( ).
A.一組數據10,11,11,12,13,14,16,18,20,22的第60百分位數為14
B.若隨機變量服從正態分布,且,則
C.若線性相關系數越接近1,則兩個變量的線性相關程度越高
D.對具有線性相關關系的變量、,且回歸方程為,若樣本點的中心為,則實數的值是
5.(2024·全國·模擬預測)2023年第19屆亞運會在杭州舉行,亞運會的吉祥物琮琮、蓮蓮、宸宸深受大家喜愛,某商家統計了最近5個月銷量,如下表所示:
時間x 1 2 3 4 5
銷售量y/萬只 5 4.5 4 3.5 2.5
若y與x線性相關,且線性回歸方程為,則下列說法不正確的是( )
A.由題中數據可知,變量y與x負相關 B.當時,殘差為0.2
C.可以預測當時銷量約為2.1萬只 D.線性回歸方程中
6.(2024·黑龍江·二模)根據分類變量x與y的成對樣本數據,計算得,依據的獨立性檢驗,結論為( )參考值:
0.1 0.05 0.01
2.706 3.841 6.635
A.x與y不獨立
B.x與y不獨立,這個結論犯錯誤的概率不超過0.05
C. x與y獨立
D.x與y獨立,這個結論犯錯誤的概率不超過0.05
二、多選題
7.(2024·海南海口·二模)已知甲、乙兩組樣本各有10個數據,甲、乙兩組數據合并后得到一組新數據,下列說法正確的是( )
A.若甲、乙兩組數據的平均數都為a,則新數據的平均數等于a
B.若甲、乙兩組數據的極差都為b,則新數據的極差可能大于b
C.若甲、乙兩組數據的方差都為c,則新數據的方差可能小于c
D.若甲、乙兩組數據的中位數都為d,則新數據的中位數等于d
8.(2024·江西·模擬預測)下列命題正確的是( )
A.已知由一組樣本數據,得到的回歸直線方程為,且,則這組樣本數據中一定有
B.某學校高三年級學生有男生500人,女生400人,為了獲得該校高三全體學生的身高信息,現采用樣本量比例分配的分層隨機抽樣方法抽取了容量為180的樣本,經計算得男生樣本的均值為170,方差為19,女生樣本的均值為161,方差為28,則抽取的樣本的方差為43
C.已知互不相同的30個樣本數據,若去掉其中最大和最小的數據,則剩下28個數據的分位數可能等于原樣本數據的分位數
D.若隨機變量,且,則
三、填空題
9.(2024·云南大理·模擬預測)已知某種商品的廣告費支出(單位:萬元)與銷售額(單位:萬元)之間有如下表對應數據:
1 3 4 5 7
15 20 30 40 45
根據表中數據得到關于的經驗回歸方程為,則當時,殘差為 .(殘差觀測值-預測值)
10.(2024·上海金山·二模)為了考察某種藥物預防疾病的效果,進行動物試驗,得到如下圖所示列聯表:
藥物 疾病 合計
未患病 患病
服用 50
未服用 50
合計 80 20 100
取顯著性水平,若本次考察結果支持“藥物對疾病預防有顯著效果”,則()的最小值為 .
(參考公式:;參考值:)
11.(2024·河北石家莊·三模)為了解全市高三學生的體能素質情況,在全市高三學生中隨機抽取了1000名學生進行體能測試,并將這1000名學生的體能測試成績整理成如下頻率分布直方圖.則直方圖中實數的值為 .
四、解答題
12.(2024·全國·模擬預測)第24屆哈爾濱冰雪大世界開園后,為了了解進園游客對本屆冰雪大世界的滿意度,從進園游客中隨機抽取50人進行調查并統計其滿意度評分,制成頻率分布直方圖如圖所示,其中滿意度評分在的游客人數為18.

(1)求頻率分布直方圖中的值;
(2)從抽取的50名游客中滿意度評分在及的游客中用分層抽樣的方法抽取5人,再從抽取的5人中隨機抽取2人,求2人中恰有1人的滿意度評分在的概率.
13.(2024·陜西西安·模擬預測)全球新能源汽車產量呈上升趨勢.以下為年全球新能源汽車的銷售量情況統計.
年份 2018 2019 2020 2021 2022 2023
年份編號 1 2 3 4 5 6
銷售量/百萬輛 2.02 2.21 3.13 6.70 10.80 14.14
若與的相關關系擬用線性回歸模型表示,回答如下問題:
(1)求變量與的樣本相關系數(結果精確到0.01);
(2)求關于的線性回歸方程,并據此預測2024年全球新能源汽車的銷售量.
附:線性回歸方程,其中,
樣本相關系數.
參考數據:.
14.(2024·陜西榆林·三模)“直播的盡頭是帶貨”,如今網絡直播帶貨越來越火爆,但商品的質量才是一個主播能否持久帶貨的關鍵.某主播委托甲 乙兩個工廠為其生產加工商品,為了了解商品質量情況,分別從甲 乙兩個工廠各隨機抽取了100件商品,根據商品質量可將其分為一、二、三等品,統計的結果如下圖:
(1)根據獨立性檢驗,判斷是否有的把握認為商品為一等品與加工工廠有關?
(2)將樣本數據的頻率視為概率,現在甲 乙工廠為該主播進行商品展示活動,每輪活動分別從甲 乙工廠中隨機挑選一件商品進行展示,求在兩輪活動中恰有三個一等品的概率;
(3)綜合各個方面的因素,最終該主播決定以后只委托甲工廠為其生產商品,已知商品隨機裝箱出售,每箱30個.商品出廠前,工廠可自愿選擇是否對每箱商品進行檢驗.若執行檢驗,則每個商品的檢驗費用為10元,并將檢驗出的三等品更換為一等品或二等品;若不執行檢驗,則對賣出的每個三等品商品支付100元賠償費用.將樣本數據的頻率視為概率,以整箱檢驗費用的期望記為,所有賠償費用的期望記為,以和的大小關系作為決策依據,判斷是否需要對每箱商品進行檢驗?請說明理由.
0.100 0.050 0.010 0.005
2.706 3.841 6.635 7.879
21世紀教育網 www.21cnjy.com 精品試卷·第 2 頁 (共 2 頁)
21世紀教育網(www.21cnjy.com)中小學教育資源及組卷應用平臺
9.1統計與成對數據的統計分析
【備考指南】 1
【知識導圖】 2
【考點梳理】 6
考點一:隨機抽樣 6
考點二:用樣本估計總體 9
考點三:變量間的相關關系 14
考點四:相關系數r 19
考點五:誤差分析 24
考點六:獨立性檢驗 30
【真題在線】 36
【專項突破】 49
考點 考情分析 考頻
古典概率模型 2022年新高考Ⅰ卷T5 2022年全國甲卷T6 2022年全國甲卷T15 1年3考
相互獨立事件 2023年新高考Ⅰ卷T21 2022年全國乙卷T10 2年2考
獨立性檢驗模型 2022年全國甲卷T17 2021年新高考Ⅰ卷T8 2年2考
分布列、均值與統計圖 2022年新高考Ⅱ卷T9
分布列、均值與概率 2022年全國甲卷T19
分布列、均值與獨立性檢驗 2023年全國甲卷T19
用樣本估計總體 2022年全國甲卷T2 2022年全國乙卷T4 1年2考
正態分布 2022年新高考Ⅱ卷T13
條件概率 2022年新高考Ⅰ卷T20
統計與樣本方差 2023年全國乙卷T17
預測:統計與成對數據的統計分析是高考的重點、熱點,一般情況考察難度適中,建議加強基礎概念的掌握與合理的運用.
考點一:隨機抽樣
【典例精析】(多選)(2024·貴州黔東南·二模)某學校為了解學生身高(單位:cm)情況,采用分層隨機抽樣的方法從4000名學生(該校男女生人數之比為)中抽取了一個容量為100的樣本.其中,男生平均身高為175,方差為184,女生平均身高為160,方差為179.則下列說法正確的是參考公式:總體分為2層,各層抽取的樣本量、樣本平均數和樣本方差分別為:,,,,,.記總的樣本平均數為,樣本方差為,則( )
參考公式:
A.抽取的樣本里男生有60人
B.每一位學生被抽中的可能性為
C.估計該學校學生身高的平均值為170
D.估計該學校學生身高的方差為236
【答案】ABD
【分析】根據分層抽樣的公式,以及利用每層樣本的平均數和方差公式,代入總體的均值和方差公式,即可判斷選項.
【詳解】對于項,抽取的樣本里男生有人,所以A項正確;
對于B項,由題可知,每一位學生被抽中的可能性為,所以B項正確;
對于C項,估計該學校學生身高的平均值為,所以C項錯誤;
對于D,估計該學校學生身高的方差為,所以D項正確.
故選:ABD
【變式訓練】
一、單選題
1.(2021·甘肅天水·模擬預測)我國古代數學名著《數書九章》中有“米谷粒分”問題;“開倉受納,有甲戶米一千五百三十四石到廊.驗得米內夾谷,乃于樣內取米一捻,數計二百五十四粒內有谷二十八顆,凡粒米率每勺三百,今欲知米內雜谷多少”,其大意是,糧倉開倉收糧,有人送來米1534石,驗得米內夾谷,抽樣取米一把,數得254粒內夾谷28粒,則這批米內夾谷約為( )
A.153石 B.154石 C.169石 D.170石
2.(2024·陜西西安·一模)某高校對中文系新生進行體測,利用隨機數表對650名學生進行抽樣,先將650名學生進行編號,001,002,…,649,650.從中抽取50個樣本,下圖提供隨機數表的第4行到第6行,若從表中第5行第6列開始向右讀取數據,則得到的第6個樣本編號是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.623 B.328 C.072 D.457
二、多選題
3.(2023·安徽合肥·模擬預測)某學校高三年級學生有500人,其中男生320人,女生180人.為了獲得該校全體高三學生的身高信息,現采用分層抽樣的方法抽取樣本,并觀測樣本的指標值(單位:cm),計算得男生樣本的均值為174,方差為16,女生樣本的均值為164,方差為30.則下列說法正確的是( )
A.如果抽取25人作為樣本,則抽取的樣本中男生有16人
B.該校全體高三學生的身高均值為171
C.抽取的樣本的方差為44.08
D.如果已知男 女的樣本量都是25,則總樣本的均值和方差可以作為總體均值和方差的估計值
4.(2024·湖南懷化·二模)下列說法正確的是( )
A.某校高一年級共有男女學生500人,現按性別采用分層抽樣的方法抽取容量為50人的樣本,若樣本中男生有30人,則該校高一年級女生人數是200
B.數據1,3, 4,5,7,9,11,16的第75百分位數為10
C.線性回歸方程中,若線性相關系數越大,則兩個變量的線性相關性越強
D.根據分類變量與的成對樣本數據,計算得到,根據小概率值的獨立性檢驗,可判斷與有關聯,此推斷犯錯誤的概率不大于0.05
三、填空題
5.(2024·陜西安康·模擬預測)杭州亞運會期間,某社區有200人參加協助交通管理的志愿團隊,為了解他們參加這項活動的感受,用分層抽樣的方法隨機抽取了一個容量為40的樣本,若樣本中女性有16人,則該志愿團隊中的男性人數為 .
參考答案:
1.C
【分析】這批米內夾谷約為石,則,由此能求出這批米內夾谷數量.
【詳解】這批米內夾谷約為石,根據題意可得
解得
故選:C
2.A
【分析】按照隨機數表提供的數據,三位一組的讀數,并取001到650內的數,重復的只取一次即可
【詳解】從第5行第6列開始向右讀取數據,
第一個數為253,第二個數是313,
第三個數是457,下一個數是860,不符合要求,
下一個數是736,不符合要求,下一個是253,重復,
第四個是007,第五個是328,第六個數是623,,故A正確.
故選:A.
3.AC
【分析】利用分層抽樣計算即可判斷選項A;代入均值與方差公式即可判斷選項BC;因為抽樣中未按比例進行分層抽樣,所以總體中每個個體被抽到的可能性不完全相同,因而樣本的代表性差,所以作為總體的估計不合適,可以判斷D.
【詳解】根據分層抽樣,抽取25人作為樣本,
則抽取的樣本中男生有正確;
樣本學生的身高均值,B錯誤;
抽取的樣本的方差為,C正確;
因為抽樣中未按比例進行分層抽樣,
所以總體中每個個體被抽到的可能性不完全相同,
因而樣本的代表性差,所以作為總體的估計不合適.D錯誤.
故選:AC
4.ABD
【分析】利用分層抽樣計算判斷A;求出第75百分位數判斷B;利用線性相關系數的意義判斷C;利用獨立性檢驗的思想判斷D.
【詳解】對于A,該校高一年級女生人數是,A正確;
對于B,由,得第75百分位數為,B正確;
對于C,線性回歸方程中,線性相關系數絕對值越大,兩個變量的線性相關性越強,C錯誤;
對于D,由,可判斷與有關聯,此推斷犯錯誤的概率不大于0.05,D正確.
故選:ABD
5.
【分析】根據題意,結合分層抽樣的概念和計算方法,即可求解.
【詳解】根據題意,結合分層抽樣的概念及運算,可得愿團隊中的男性人數為.
故答案為:.
考點二:用樣本估計總體
【典例精析】(多選)(2024·河南三門峽·模擬預測)某燈具配件廠生產了一種塑膠配件,該廠質檢人員某日隨機抽取了100個該配件的質量指標值(單位:分)作為一個樣本,得到如下所示的頻率分布直方圖,則(同一組中的數據用該組區間的中點值作代表)( )
A.
B.樣本質量指標值的平均數為75
C.樣本質量指標值的眾數小于其平均數
D.樣本質量指標值的第75百分位數為85
【答案】ACD
【分析】運用頻率分布直方圖中所有頻率之和為1及平均數、眾數、百分位數公式計算即可.
【詳解】對于A項,由題意知,解得0.030,故A項正確;
對于B項,樣本質量指標值的平均數為,故B項錯誤;
對于C項,樣本質量指標值的眾數是,故C項正確;
對于D項,前3組的頻率之和為,前4組的頻率之和為,
故第75百分位數位于第4組,設其為,
則,解得,
即第75百分位數為85,故D項正確.
故選:ACD項.
【變式訓練】
一、單選題
1.(2024·江西·二模)從甲隊60人、乙隊40人中,按照分層抽樣的方法從兩隊共抽取10人,進行一輪答題.相關統計情況如下:甲隊答對題目的平均數為1,方差為1;乙隊答對題目的平均數為1.5,方差為0.4,則這10人答對題目的方差為( )
A.0.8 B.0.675 C.0.74 D.0.82
二、多選題
2.(2023·全國·模擬預測)新能源汽車產業是戰略性新興產業,發展新能源汽車是推動節能減排的有效措施,是解決能源環境問題的有效途徑,同時也是實現國家生態文明建設的有力舉措.某地區2017年至2021年每年汽車總銷量(單位:萬輛)和新能源汽車銷量占比(注:汽車總銷量指新能源汽車銷量與非新能源汽車銷量之和)如表所示,則( )
年份 2017 2018 2019 2020 2021
汽車總銷量/萬輛 5.5 5.8 6.0 7.0 7.7
新能源汽車銷量占比 4% 6% 8% 7% 20%
A.該地區2017年至2021年平均每年銷售汽車6.4萬輛
B.該地區2017年至2021年平均每年銷售新能源汽車少于0.5萬輛
C.該地區2017年至2021年新能源汽車銷量逐年增加
D.該地區2017年至2021年非新能源汽車銷量逐年減少
三、填空題
3.(2022·吉林·模擬預測)北京時間2022年4月16日09時56分,神舟十三號載人飛船返回艙在東風著陸場成功著陸,將在太空“出差”半年的翟志剛 王亞平 葉光富送回到闊別已久的祖國大地.神舟十三號載人飛行任務的圓滿成功,標志著空間站關鍵技術驗證階段任務圓滿完成,中國空間站即將進入建造階段.某機構研究室通過隨機抽樣的方式,對18歲及以上人群進行了“你是否曾有過航天夢想”的調查研究,得到如下的統計結果:
根據調查結果,以下說法正確的是 .
①在“曾有過航天夢想”的人群中,54歲及以上的人數最少
②在“曾有過航天夢想”的人群中,年齡越大,在航天相關方面的人均消費越少
③在“曾有過航天夢想”的人群中,18-29歲在航天相關方面的總消費最多
四、解答題
4.(2024·四川成都·三模)某保險公司為了給年齡在20~70歲的民眾提供某種疾病的醫療保障,設計了一款針對該疾病的保險,現從10000名參保人員中隨機抽取100名進行分析,這100個樣本按年齡段分成了五組,其頻率分布直方圖如下圖所示,每人每年所交納的保費與參保年齡如下表格所示.(保費:元)據統計,該公司每年為該項保險支出的各種費用為一百萬元.
年齡
保費
(1)用樣本的頻率分布估計總體的概率分布,為使公司不虧本,則保費至少為多少元?(精確到整數)
(2)隨著年齡的增加,該疾病患病的概率越來越大,經調查,年齡在的老人中每15人就有1人患該項疾病,年齡在的老人中每10人就有1人患該項疾病,現分別從年齡在和的老人中各隨機選取1人,記表示選取的這2人中患該疾病的人數,求的數學期望.
參考答案:
1.D
【分析】根據分層抽樣的均值與方差公式計算即可.
【詳解】根據題意,按照分層抽樣的方法從甲隊中抽取人,
從乙隊中抽取人,
這人答對題目的平均數為,
所以這人答對題目的方差為.
2.AC
【分析】根據表中數據,依次討論各選項即可得答案.
【詳解】解:對于A:該地區2017年至2021年平均每年銷售汽車(萬輛,故A正確;
對于B:該地區2017年至2021年新能源汽車銷量的平均數為7.7)(萬輛),所以B錯誤;
對于C:2017年至2021年新能源汽車銷量依次為0.22萬輛,0.348萬輛,0.48萬輛,0.49萬輛,1.54萬輛,故C正確;
對于D:該地區2018,2019年非新能源汽車銷量分別為5.452萬輛,5.52萬輛,故D錯誤.
故選:AC
3.①③
【分析】觀察“曾有過航天夢想”的人年齡分布圖和在航天相關方面的人均消費可判斷①②,再把各年齡階段在航天相關方面的總消費算出,即可求出答案.
【詳解】對于①,從曾有過航天夢想的年齡分布圖可知,在“曾有過航天夢想”的人群中,54歲及以上的人數最少,所以①正確;
對于②,在“曾有過航天夢想”的人群中,歲的消費最多,所以②錯誤;
對于③,設總人數為 ,18-29歲在航天相關方面的總消費約為:,
30-40歲在航天相關方面的總消費約為:,
41-53歲在航天相關方面的總消費約為:,
54歲及以上在航天相關方面的總消費約為:.
所以在“曾有過航天夢想”的人群中,18-29歲在航天相關方面的總消費最多.
故選:①③.
4.(1)30元
(2)
【分析】(1)根據小矩形面積和為得到關于的方程,解出值,再列出不等式,解出即可;
(2)首先分析出的取值為0,1,2,再列出對應概率值,利用期望公式計算即可.
【詳解】(1),解得,
保險公司每年收取的保費為:

所以要使公司不虧本,則,即,
解得,即保費元;
(2)由題意知的取值為0,1,2,



列表如下:
.
考點三:變量間的相關關系
【典例精析】(多選)(2024·山東棗莊·模擬預測)已知兩個變量y與x對應關系如下表:
x 1 2 3 4 5
y 5 m 8 9 10.5
若y與x滿足一元線性回歸模型,且經驗回歸方程為,則( )
A.y與x正相關 B.
C.樣本數據y的第60百分位數為8 D.各組數據的殘差和為0
【答案】AD
【分析】利用相關性的定義及線性回歸直線可判定A,根據樣本中心點在回歸方程上可判定B,利用百分位數的計算可判定C,利用回歸方程計算預測值可得殘差即可判定D.
【詳解】由回歸直線方程知:,所以y與x正相關,即A正確;
由表格數據及回歸方程易知,即B錯誤;
易知,所以樣本數據y的第60百分位數為,即C錯誤;
由回歸直線方程知時對應的預測值分別為,
對應殘差分別為,顯然殘差之和為0,即D正確.
故選:AD
【變式訓練】
一、單選題
1.(2024·河北·一模)某校為了解本校高一男生身高和體重的相關關系,在該校高一年級隨機抽取了7名男生,測量了他們的身高和體重得下表:
身高x(單位:) 167 173 175 177 178 180 181
體重y(單位:) 90 54 59 64 67 72 76
由表格制作成如圖所示的散點圖:
由最小二乘法計算得到經驗回歸直線的方程為,其相關系數為;經過殘差分析,點對應殘差過大,把它去掉后,再用剩下的6組數據計算得到經驗回歸直線的方程為,相關系數為.則下列選項正確的是( )
A. B.
C. D.
2.(2024·安徽蚌埠·模擬預測)為維護市場秩序,保護消費者權益,在“五一”假期來臨之際,我市物價部門對某商品在5家商場的售價(元)及其一天的銷售量(件)進行調查,得到五對數據,經過分析、計算,得,關于的經驗回歸方程為,則相應于點的殘差為( )
A. B.1 C. D.3
二、多選題
3.(2024·浙江金華·三模)某班主任用下表分析高三前5次考試中本班級在年級中的成績排名y與考試次數x的相關性時,忘記了第二次和第四次考試排名,但他記得平均排名,于是分別用和得到了兩個經驗回歸方程:,,對應的樣本相關系數分別為,,排名y對應的方差分別為,,則( )
x 1 2 3 4 5
y 10 m 6 n 2
附:,,.
A. B.
C. D.
三、填空題
4.(2022·北京·模擬預測)某班在一次考試后分析學生在語文 數學 英語三個學科的表現,繪制了各科年級排名的散點圖(如下圖所示).
關于該班級學生這三個學科本次考試的情況,給出下列四個結論:
①三科中,數學年級排名的平均數及方差均最小;
②語文、數學、英語年級排名均在150名以外的學生為1人;
③本次考試該班語文第一名、數學第一名、英語第一名可能為三名不同的同學;
④從該班學生中隨機抽取1人,若其語文排名大于200,則其英語和數學排名均在150以內的概率為.
其中所有正確結論的序號是 .
四、解答題
5.(2024·四川眉山·三模)某公司為改進生產,現對近5年來生產經營情況進行分析.收集了近5年的利潤(單位:億元)與年份代碼共5組數據(其中年份代碼分別指2019年,2020年,年),并得到如下值:.
(1)若用線性回歸模型擬合變量與的相關關系,計算該樣本相關系數,并判斷變量與的相關程度(精確到0.01);
(2)求變量關于的線性回歸方程,并求2024年利潤的預報值.
附:①;②若,相關程度很強;,相關程度一般;,相關程度較弱;③一組數據,其回歸直線的斜率和截距的最小二乘估計分別為;相關系數.
參考答案:
1.A
【分析】根據的特點判斷斜率和截距;由于去掉,其它點的線性關系更強,從而可判斷相關系數.
【詳解】身高的平均數為,
因為離群點的橫坐標167小于平均值176,縱坐標90相對過大,
所以去掉后經驗回歸直線的截距變小而斜率變大,故,
去掉后相關性更強,擬合效果也更好,且還是正相關,所以.
故選:A
2.A
【分析】將樣本點中心,并代入回歸方程,求,并代入后,即可求解殘差.
【詳解】因為回歸直線過樣本點中心即,代入,可得,
解得,當時,,所以殘差為.
故選:A
3.AD
【分析】當時,根據相關數據結合,可求得,進而利用可求,利用相關系數公式可求得,利用方差公式可求得,同理計算時,,,,,進而可得結論.
【詳解】當時,,,解得,


,得,


同理,當時,,,,,
所以,,,.
故選:AD.
4.①②④
【分析】依據平均數和方差的定義判斷①;求得語文、數學、英語年級排名均在150名以外的學生人數判斷②;求得語文第一名、數學第一名、英語第一名的同學判斷③;求得從該班學生中隨機抽取1人,若其語文排名大于200,則其英語和數學排名均在150以內的概率判斷④.
【詳解】①:三科中,數學對應的點比英語對應的點到橫軸的距離近且較為密集,
數學對應的點到橫軸的距離比語文對應的點到縱軸距離近且較為密集,
所以數學年級排名的平均數及方差均最小.判斷正確;
②:語文、數學、英語年級排名均在150名以外的學生為1人.判斷正確;
③:本次考試該班語文第一名、數學第一名、英語第一名為同一名同學.判斷錯誤;
④:由圖表可知語文排名大于200的有3位同學,
語文排名大于200且英語和數學排名均在150以內的同學僅有1位同學.
故從該班學生中隨機抽取1人,若其語文排名大于200,
則其英語和數學排名均在150以內的概率為.判斷正確.
故答案為①②④
5.(1),變量與的相關程度很強
(2),78(億元)
【分析】(1)根據題意,由相關系數的計算公式代入計算,即可得到結果;
(2)根據題意,由最小二乘法的計算公式代入計算即可得到,,從而得到線性回歸方程.
【詳解】(1)依題意,,

則,
則,故變量與的相關程度很強.
(2)令變量與的線性回歸方程為.

所以,
所以,變量關于的回歸方程為.
2024年,即時,(億元).
所以,該公司2024年利潤的預報值為78(億元).
考點四:相關系數r
【典例精析】(多選)(2024·湖北武漢·二模)下列說法正確的是( )
A.將一組數據的每一個數減去同一個數后,新數據的方差與原數據方差相同
B.線性回歸直線一定過樣本點中心
C.線性相關系數越大,兩個變量的線性相關性越強
D.在殘差的散點圖中,殘差分布的水平帶狀區域的寬度越窄,其模型的擬合效果越好
【答案】ABD
【分析】借助方差的性質、樣本點中心的性質、線性相關系數的性質與殘差的性質逐項判斷即可得.
【詳解】對A:由方差的性質可知,將一組數據的每一個數減去同一個數后,
新數據的方差與原數據方差相同,故A正確;
對B:由,故線性回歸直線一定過樣本點中心,故B正確;
對C:線性相關系數越大,兩個變量的線性相關性越強,故C錯誤;
對D:在殘差的散點圖中,殘差分布的水平帶狀區域的寬度越窄,
其模型的擬合效果越好,故D正確.
故選:ABD.
【變式訓練】
一、單選題
1.(2024·天津·二模)有人通過調查統計發現,兒子成年時的身高與父親的身高呈線性相關,且兒子成年時的身高(單位:)與父親的身高(單位:)的經驗回歸方程為,根據以上信息,下列判斷正確的為( ).
A.兒子成年時的身高與父親的身高的樣本相關系數
B.父親的身高為,兒子成年時的身高一定在到之間
C.父親的身高每增加,兒子成年時的身高平均增加
D.兒子在成年時的身高一般會比父親高
2.(2024·上海徐匯·二模)為了研究y關于x的線性相關關系,收集了5組樣本數據(見下表):
x 1 2 3 4 5
y 0.5 0.9 1 1.1 1.5
若已求得一元線性回歸方程為,則下列選項中正確的是( )
A.
B.當時,y的預測值為2.2
C.樣本數據y的第40百分位數為1
D.去掉樣本點后,x與y的樣本相關系數r不會改變
二、多選題
3.(2024·吉林長春·模擬預測)相關變量x,y的散點圖如下,若剔除點13后,剩下數據得到的統計中,較剔除之前值變小的是( )
A.樣本的相關系數 B.殘差的平方和
C.樣本數據y的平均值 D.回歸直線中的回歸系數
三、填空題
4.(2023·上海徐匯·模擬預測)下列說法中正確的有 (填正確說法的序號).
①若樣本數據,,…,的方差為4,則數據,,…,的標準差為4;
②已知隨機變量,且,則;
③若線性相關系數越接近1,則兩個變量的線性相關性越弱;
④若事件A,B滿足,,,則有.
四、解答題
5.(2024·山東聊城·三模)今年五一節期間,聊城百貨大樓有限公司搞促銷活動,下表是該公司5月1號至10號(日期簡記為1,2,3,……,10)連續10天的銷售情況:
日期 1 2 3 4 5 6 7 8 9 10
銷售額(萬元) 19 19.3 19.6 20 21.2 22.4 23.8 24.6 25 25.4
由上述數據,用最小二乘法得到銷售額和日期的線性回歸方程為,日期的方差約為3.02,銷售額的方差約為2.59.
(1)根據線性回歸方程,分析銷售額隨日期變化趨勢的特征,并計算第4天的殘差;
(2)計算相關系數,并分析銷售額和日期的相關程度(精確到0.001);
(3)該公司為了促銷,擬打算對電視機實行分期付款方式銷售,假設顧客購買一臺電視機選擇分期付款的期數及相應的概率和公司獲得的利潤(單位:元)情況如下表:
2 4 6
400 600 800
已知成等比數列.
設該公司銷售兩臺電視機所獲得的利潤為(單位:元),當的概率取得最大值時,求利潤的分布列和數學期望.
參考公式:相關系數.回歸方程中斜率和截距的最小二乘法估計公式分別為:.相關數據.
參考答案:
1.C
【分析】根據題意,由線性回歸方程的性質,對選項逐一判斷,即可得到結果.
【詳解】因為,且,
即與不一定相等,故A錯誤;
當父親身高為時,孩子身高可能在到之間,
而不是一定,故B錯誤;
因為,即父親的身高每增加,
兒子成年時的身高平均增加,故C正確;
由回歸方程可知,是否比父親高還得取決于父親身高,因此判斷不了兒子成年時一般比父親高,故D錯誤;
故選:C
2.D
【分析】由表格數據求出樣本點的中心坐標,代入可得的值由此即可判斷A,進一步可得回歸方程,由此即可驗算B選項,由百分位數的概念即可判斷C,由相關系數公式即可判斷D.
【詳解】,所以樣本點的中心坐標為,
將它代入得,,解得,故A錯誤;
對于B,當時,y的預測值為,故B錯誤;
對于C,樣本數據y的第40百分位數為,故C錯誤;
對于D,由相關系數公式可知,去掉樣本點后,x與y的樣本相關系數r不會改變,故D正確.
故選:D.
3.ABC
【分析】根據已知條件,結合變量間的相關關系,結合圖象分析判斷即可.
【詳解】由散點圖可知,去掉點后,與的線性相關加強,且為負相關,
所以樣本的相關系數變小,殘差的平方和變小,樣本數據y的平均值變小,故ABC正確;
回歸直線中的回歸系數變大,故D錯誤.
故選:ABC.
4.①②④
【分析】對于①,利用方差的性質求解判斷,對于②,根據正態分布的性質計算,
對于③,根據相關系數的性質判斷,對于④,利用獨立事件和條件概率公式求解判斷.
【詳解】由于,所以數據,,…,的方差為16,
故標準差為4,因此①正確;
根據正態分布,,故,即,
故.3,因此②正確;
線性相關系數越接近1,則兩個變量的線性相關性越強,故③錯誤;
由于等價于“事件A與事件B相互獨立,即,
故必有,因此④正確.
故答案為:①②④
5.(1)日期每增加一天,銷售額約增加萬元,第4天的殘差為
(2),銷售額和日期的相關程度較強
(3)分布列見解析,1200
【分析】(1)根據線性回歸方程特點分析,再將代入回歸方程計算,利用殘差定義求解即可;
(2)由相關系數的公式結合題中的數據計算,然后根據相關系數與1比較即可判斷;
(3)先根據等比中項性質得,,由題意可得的可能取值有,計算其對應的概率,利用基本不等式求得的概率取得最大值時,從而列出分布列,求出期望即可.
【詳解】(1)根據線性回歸方程,日期每增加一天,銷售額約增加萬元,
把代入回歸直線方程,得,
因為,所以第4天的殘差為;
(2)由得,
比較接近于1,故銷售額和日期的相關程度較強.
(3)由成等比數列,得,且,
設其公比為,則,所以,
由題意可得的值分別為,
則,,,
,,
又,取得最大值的條件即,
此時,
故分布列為:
800 1000 1200 1400 1600
期望.
考點五:誤差分析
【典例精析】(多選)(2024·江西鷹潭·二模)下列說法中,正確的是( )
A.一組數據10,11,11,12,13,14,16,18,20,22的第40百分位數為12
B.兩組樣本數據,,,和,,,的方差分別為,,若已知(),則
C.已知隨機變量服從正態分布,若,則
D.已知一系列樣本點()的回歸方程為,若樣本點與的殘差(殘差=實際值-模型預測值)相等,則
【答案】BC
【分析】A選項,根據百分位數的運算公式得到答案;B選項,利用平均數定義得到,根據方差的計算公式得到;C選項,由正態分布的對稱性得到C正確;D選項,由題意得到,得到D錯誤.
【詳解】A選項,,故從小到大從第4個和第5個數的平均數作為第40百分位數,即,A錯誤;
B選項,,,
因為,(),故,
故,

故,B正確;
C選項,因為,,
關于對稱,所以,C正確;
D選項,由題意得,整理得,D錯誤.
故選:BC
【變式訓練】
一、單選題
1.(2024·四川成都·三模)地球生命來自外星嗎?一篇發布在《生物學快訊》上的文章《基因庫的增長是生命起源和演化的時鐘》可能給出了一種答案.該論文的作者根據生物功能性基因組里的堿基排列數的大小定義了基因庫的復雜度y(單位:1),通過研究各個年代的古代生物化石里基因庫的復雜度,提出了一個有趣的觀點:生物基因庫的復雜度近似是隨時間呈指數增長的,只要知道生物基因庫的復雜度就可以推測該生物體出現的年代.如圖是該論文作者根據生物化石(原核生物,真核生物,蠕蟲,魚類,哺乳動物)中的基因復雜度的常用對數與時間(單位:十億年)的散點圖及回歸擬合情況(其中回歸方程為:,相關指數).根據題干與圖中的信息,下列說法錯誤的是( )
A.根據信息生物基因庫的復雜度近似是隨時間呈指數增長的情況,不同于作者采取取常用對數的做法,我們也可采用函數模型來擬合
B.根據回歸方程可以得到,每過10億年,生物基因庫的復雜度一定增加到原來的倍
C.雖然擬合相關指數為0.97,但是樣本點只有5個,不能很好地闡釋其統計規律,所以增加可靠的樣本點可以更好地完善回歸方程
D.根據物理界主流觀點:地球的形成始于45億年前,及擬合信息:地球在誕生之初時生物的復雜度大約為,可以推斷地球生命可能并非誕生于地球
2.(2024·江蘇蘇州·模擬預測)下列說法中,正確的是( )
A.已知一系列樣本點一個經驗回歸方程,若樣本點與的殘差相等,則
B.已知隨機變量,若,則
C.將5名同學分到三個組開展活動,每個組至少1名,則不同分配方法數是240
D.每人參加一次游戲,每輪游戲有三個題目,每個題目答對的概率均為且相互獨立,若答對題數多于答錯題數可得4分,否則得2分,則某人參加游戲得分的期望為3
二、多選題
3.(2024·河北唐山·二模)為研究光照時長(小時)和種子發芽數量(顆)之間的關系,某課題研究小組采集了10組數據,繪制散點圖如圖所示,并進行線性回歸分析,若去掉點后,下列說法正確的是( )
A.相關系數變小 B.經驗回歸方程斜率變小
C.殘差平方和變小 D.決定系數變小
三、填空題
4.(2024·廣東廣州·一模)某校數學建模興趣小組收集了一組恒溫動物體重(單位:克)與脈搏率(單位:心跳次數/分鐘)的對應數據,根據生物學常識和散點圖得出與近似滿足(為參數).令,,計算得,,.由最小二乘法得經驗回歸方程為,則的值為 ;為判斷擬合效果,通過經驗回歸方程求得預測值,若殘差平方和,則決定系數 .(參考公式:決定系數)
四、解答題
5.(2024·四川德陽·三模)某公司為了確定下季度的前期廣告投入計劃,收集并整理了近6個月廣告投入量x(單位:萬元)和收益y(單位:萬元)的數據如表(其中有些數據污損不清):
月份 1 2 3 4 5 6
廣告投入量 2 7 8 10
收益 20 30 34 37
他們分別用兩種模型①,②進行擬合,得到相應的回歸方程并進行殘差分析,得到如圖所示的殘差圖及一些統計量的值.
(1)根據殘差圖,比較模型①,②的擬合效果,應選擇哪個模型
(2)殘差絕對值大于2 的數據被認為是異常數據,需要剔除.
(i)剔除異常數據后,求出(1)中所選模型的回歸方程;
(ii)若廣告投入量x=19,則(1)中所選模型收益的預報值是多少萬元 (精確到0.01)
附:對于一組數據 其回歸直線 的斜率和截距的最小二乘估計分別為: .
參考答案:
1.B
【分析】利用指數式與對數式互化判斷A;利用回歸方程的意義判斷B;利用相關指數的意義判斷C;求出地球在誕生之初時生物的復雜度,結合描述判斷D.
【詳解】對于A,由,得,
令,滿足,A正確;
對于B,觀察散點圖,所給5個點不全在回歸直線上,回歸擬合是近似的,
不能說每過10億年,生物基因庫的復雜度一定增加到原來的倍,B錯誤;
對于C,數據越多,擬合的準確性越高,因此增加可靠的樣本點可以更好地完善回歸方程,C正確;
對于D,當時,,根據回歸方程可知,
當時,,即地球在誕生之初時生物的復雜度大約為,
可以推斷地球生命可能并非誕生于地球,D正確.
故選:B
2.D
【分析】根據回歸方程及殘差的概念可判定A,根據正態分布可判定B,根據部分平均分組可判定C,隨機變量的期望可判定 D.
【詳解】對于A,經驗回歸方程,若樣本點與的殘差相等,
則,可得,A錯誤;
對于B,曲線關于對稱,因為,則,
所以,B錯誤;
對于C,將5名同學分到三個組開展活動,每個組至少1名,
有兩種分組方法,即或,
則不同的分配方法有,C錯誤;
對于D,設為得分,故可能為4或2,
故,,
故,D正確.
故選:D
3.BC
【分析】由圖可知:點較其他的點偏離直線最大,所以去掉點后,回歸效果更好.結合相關系數、決定系數、殘差平方和以及相關性逐項分析判斷.
【詳解】由圖可知:較其他的點偏離直線最大,所以去掉點后,回歸效果更好.
對于A,相關系數越接近于1,線性相關性越強,因為散點圖是遞增的趨勢,
所以去掉點后,相關系數變大,故A錯誤;
對于B,去掉點后,經驗回歸方程斜率變小,故B正確;
對于C,殘差平方和變大,擬合效果越差,所以去掉點后,
殘差平方和變小,故C正確;
對于D,決定系數越接近于1,擬合效果越好,所以去掉點后,
決定系數變大,故D錯誤;
故選:BC.
4.
【分析】根據回歸直線方程必過樣本中心點求出,即可求出,再根據決定系數公式求出.
【詳解】因為,兩邊取對數可得,
又,,
依題意回歸直線方程必過樣本中心點,
所以,解得,所以,
又.
故答案為:;
5.(1)模型①;
(2)(i);(ii).
【分析】(1)觀察殘差圖,利用殘差波動大小選擇.
(2)(i)利用給定數據,計算最小二乘法公式中相關量,求出回歸直線方程;(ii)利用求得的回歸方程進行數據估計.
【詳解】(1)由于模型①殘差波動小,應該選擇模型①.
(2)(i)剔除異常數據,即3月份的數據,剩下數據的平均數為,
,,,
,,

所以所選模型的回歸方程為.
(ii)若廣告投入量,
則該模型收益的預報值是(萬元).
考點六:獨立性檢驗
【典例精析】(多選)(2024·安徽黃山·二模)下列論述正確的有( )
A.若隨機變量滿足,則
B.若隨機事件,滿足:,,,則事件與相互獨立
C.基于小概率值的檢驗規則是:當時,我們就推斷不成立,即認為和不獨立,該推斷犯錯誤的概率不超過;當時,我們沒有充分證據推斷不成立,可以認為和獨立
D.若關于的經驗回歸方程為,則樣本點的殘差為
【答案】BCD
【分析】根據隨機變量的方差性質可判定A;根據和事件與獨立事件的概率公式可判定B;根據獨立性檢驗的基本思想可判定C;根據殘差的定義可判定D.
【詳解】對于A,由題意可知,故A錯誤;
對于B,由題意可知,
所以,所以事件A與B相互獨立,即B正確;
對于C,由獨立性檢驗的基本思想可知其正確;
對于D,將樣本點代入得預測值為,
所以,故D正確.
故選:BCD.
【變式訓練】
一、單選題
1.(2024·黑龍江哈爾濱·二模)針對2025年第九屆亞冬會在哈爾濱舉辦,校團委對“是否喜歡冰雪運動與學生性別的關系”進行了一次調查,其中被調查的男、女生人數相同,男生中喜歡冰雪運動的人數占男生人數的,女生中喜歡冰雪運動的人數占女生人數的,若依據的獨立性檢驗,認為是否喜歡冰雪運動與學生性別有關,則被調查的學生中男生的人數不可能是( )
附:.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.48 B.54 C.60 D.66
2.(2024·山東棗莊·一模)某兒童醫院用甲、乙兩種療法治療小兒消化不良.采用有放回簡單隨機抽樣的方法對治療情況進行檢查,得到兩種療法治療數據的列聯表:
療法 療效 合計
未治愈 治愈
甲 15 52 67
乙 6 63 69
合計 21 115 136
經計算得到,根據小概率值的獨立性檢驗(已知獨立性檢驗中),則可以認為( )
A.兩種療法的效果存在差異
B.兩種療法的效果存在差異,這種判斷犯錯誤的概率不超過0.005
C.兩種療法的效果沒有差異
D.兩種療法的效果沒有差異,這種判斷犯錯誤的概率不超過0.005
二、多選題
3.(2024·云南·模擬預測)下列說法正確的是( )
A.設隨機變量的均值為是不等于的常數,則相對于的偏離程度小于相對于的偏離程度(偏離程度用差的平方表示)
B.若一組數據的方差為0,則所有數據都相同
C.用決定系數比較兩個回歸模型的擬合效果時,越小,殘差平方和越小,模型擬合效果越好
D.在對兩個分類變量進行獨立性檢驗時,如果列聯表中所有數據都擴大為原來的10倍,在相同的檢驗標準下,再去判斷兩變量的關聯性時,結論不會發生改變
三、填空題
4.(22-23高三·全國·課后作業)某校團委對“學生性別和喜歡網絡游戲是否有關”作了一次調查,其中被調查的男女生人數相同,男生喜歡網絡游戲的人數占男生人數的,女生喜歡網絡游戲的人數占女生人數的.若根據獨立性檢驗認為喜歡網絡游戲和性別有關,且此推斷犯錯誤的概率超過0.01但不超過0.05,則被調查的學生中男生可能有 人.(請將所有可能的結果都填在橫線上)
附表:,其中.
0.050 0.010
3.841 6.635
四、解答題
5.(2024·貴州畢節·三模)2023年12月30日8時13分,長征二號丙/遠征一號S運載火箭在酒泉衛星發射中心點火起飛,隨后成功將衛星互聯網技術試驗衛星送入預定軌道由中國航天科技集團有限公司研制的運載火箭48次宇航任務全部取得圓滿成功.也代表著中國航天2023年完美收官某市一調研機構為了了解當地學生對我國航天事業發展的關注度,隨機從本市大學生和高中生中抽取一個容量為的樣本,根據調查結果得到如下列聯表:
學生群體 關注度 合計
關注 不關注
大學生
高中生
合計
(1)完成上述列聯表;依據小概率值的獨立性檢驗,認為關注航天事業發展與學生群體有關聯,求樣本容量n的最小值;
(2)用頻率估計概率,從本市大學生和高中生中隨機選取3人,用X表示不關注的人數,求X的分布列和數學期望.
附:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
,其中.
參考答案:
1.A
【分析】根據已知條件設男生人數為,結合獨立性檢驗公式得出不等式,根據的取值,即可求解.
【詳解】設男生人數為,因為被調查的男、女生人數相同,
所以女生人數也為,根據題意列出列聯表:
男生 女生 合計
喜歡冰雪運動
不喜歡冰雪運動
合計
則,
因為依據的獨立性檢驗,認為是否喜歡冰雪運動與學生性別有關,
所以,即,解得,又,
所以B、C、D正確,A錯誤.
故選:A
2.C
【分析】根據條件可得列聯表,計算的值,結合臨界值表可得結論.
【詳解】零假設為:療法與療效獨立,即兩種療法效果沒有差異.
根據列聯表中的數據,,根據小概率值的獨立性檢驗,
沒有充分證據推斷不成立,
因此可以認為成立,
即認為兩種療法效果沒有差異.
故選:C.
3.AB
【分析】根據均值的性質,方差的公式及決定系數的含義可判斷A,B,C;根據獨立性檢驗的含義可判斷D.
【詳解】對于:由均值的性質可知,由于是不等于的常數,
故可得,即相對于的偏離程度小于相對于的偏離程度,A正確;
對于:根據方差公式,可知若一組數據
,的方差為0,則正確;
對于:由決定系數的定義可知,錯誤;
對于D:如果列聯表中所有數據都擴大為原來的10倍,則的值變為原來的10倍,在相同的檢驗標準下,再去判斷兩變量的關聯性時,結論可能發生改變,D錯誤,
故選:AB.
4.45,50,55,60,65
【分析】利用獨立性檢驗表達列聯表及觀測值可解得答案.
【詳解】設男生有x人,由題意可得列聯表如下,
喜歡 不喜歡 合計
男生 x
女生 x
合計
若認為喜歡網絡游戲和性別有關,且該推斷犯錯誤的概率超過0.01但不超過0.05,
則.
∵,
∴,解得,
又x為5的整數倍,∴被調查的學生中男生可能人數為45,50,55,60,65.
故答案為:45,50,55,60,65.
5.(1)列聯表見解析,
(2)分布列見解析,
【分析】(1)根據題意即可完成列聯表,在由題意可得,即可求出;
(2)由題意可得服從二項分布,再根據二項分布的期望公式即可得解.
【詳解】(1)列聯表如下:
學生群體 關注度 合計
關注 不關注
大學生
高中生
合計

因為依據小概率值的獨立性檢驗,認為關注航天事業發展與學生群體有關,
所以,
由題可知,n是10的倍數,所以n的最小值為;
(2)由(1)可知,所以不關注的人數為,
用頻率估計概率,所以不關注的概率為,
X的所有可能取值為0,1,2,3,


所以X的分布列為
X 0 1 2 3
P
因為,所以.
一、單選題
1.(2023·全國·高考真題)某學校為了解學生參加體育運動的情況,用比例分配的分層隨機抽樣方法作抽樣調查,擬從初中部和高中部兩層共抽取60名學生,已知該校初中部和高中部分別有400名和200名學生,則不同的抽樣結果共有( ).
A.種 B.種
C.種 D.種
2.(2022·全國·高考真題)某社區通過公益講座以普及社區居民的垃圾分類知識.為了解講座效果,隨機抽取10位社區居民,讓他們在講座前和講座后各回答一份垃圾分類知識問卷,這10位社區居民在講座前和講座后問卷答題的正確率如下圖:
則( )
A.講座前問卷答題的正確率的中位數小于
B.講座后問卷答題的正確率的平均數大于
C.講座前問卷答題的正確率的標準差小于講座后正確率的標準差
D.講座后問卷答題的正確率的極差大于講座前正確率的極差
3.(2021·全國·高考真題)為了解某地農村經濟情況,對該地農戶家庭年收入進行抽樣調查,將農戶家庭年收入的調查數據整理得到如下頻率分布直方圖:
根據此頻率分布直方圖,下面結論中不正確的是( )
A.該地農戶家庭年收入低于4.5萬元的農戶比率估計為6%
B.該地農戶家庭年收入不低于10.5萬元的農戶比率估計為10%
C.估計該地農戶家庭年收入的平均值不超過6.5萬元
D.估計該地有一半以上的農戶,其家庭年收入介于4.5萬元至8.5萬元之間
二、多選題
4.(2023·全國·高考真題)有一組樣本數據,其中是最小值,是最大值,則( )
A.的平均數等于的平均數
B.的中位數等于的中位數
C.的標準差不小于的標準差
D.的極差不大于的極差
5.(2021·全國·高考真題)下列統計量中,能度量樣本的離散程度的是( )
A.樣本的標準差 B.樣本的中位數
C.樣本的極差 D.樣本的平均數
三、解答題
6.(2023·全國·高考真題)一項試驗旨在研究臭氧效應.實驗方案如下:選40只小白鼠,隨機地將其中20只分配到實驗組,另外20只分配到對照組,實驗組的小白鼠飼養在高濃度臭氧環境,對照組的小白鼠飼養在正常環境,一段時間后統計每只小白鼠體重的增加量(單位:g).
(1)設表示指定的兩只小白鼠中分配到對照組的只數,求的分布列和數學期望;
(2)實驗結果如下:
對照組的小白鼠體重的增加量從小到大排序為:
15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1
32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2
實驗組的小白鼠體重的增加量從小到大排序為:
7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2
19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5
(i)求40只小鼠體重的增加量的中位數m,再分別統計兩樣本中小于m與不小于的數據的個數,完成如下列聯表:
對照組
實驗組
(ii)根據(i)中的列聯表,能否有95%的把握認為小白鼠在高濃度臭氧環境中與正常環境中體重的增加量有差異.
附:
0.100 0.050 0.010
2.706 3.841 6.635
7.(2023·全國·高考真題)某廠為比較甲乙兩種工藝對橡膠產品伸縮率的處理效應,進行10次配對試驗,每次配對試驗選用材質相同的兩個橡膠產品,隨機地選其中一個用甲工藝處理,另一個用乙工藝處理,測量處理后的橡膠產品的伸縮率.甲、乙兩種工藝處理后的橡膠產品的伸縮率分別記為,.試驗結果如下:
試驗序號 1 2 3 4 5 6 7 8 9 10
伸縮率 545 533 551 522 575 544 541 568 596 548
伸縮率 536 527 543 530 560 533 522 550 576 536
記,記的樣本平均數為,樣本方差為.
(1)求,;
(2)判斷甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率是否有顯著提高(如果,則認為甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率有顯著提高,否則不認為有顯著提高)
8.(2023·全國·高考真題)某研究小組經過研究發現某種疾病的患病者與未患病者的某項醫學指標有明顯差異,經過大量調查,得到如下的患病者和未患病者該指標的頻率分布直方圖:
利用該指標制定一個檢測標準,需要確定臨界值c,將該指標大于c的人判定為陽性,小于或等于c的人判定為陰性.此檢測標準的漏診率是將患病者判定為陰性的概率,記為;誤診率是將未患病者判定為陽性的概率,記為.假設數據在組內均勻分布,以事件發生的頻率作為相應事件發生的概率.
(1)當漏診率%時,求臨界值c和誤診率;
(2)設函數,當時,求的解析式,并求在區間的最小值.
9.(2022·全國·高考真題)在某地區進行流行病學調查,隨機調查了100位某種疾病患者的年齡,得到如下的樣本數據的頻率分布直方圖:

(1)估計該地區這種疾病患者的平均年齡(同一組中的數據用該組區間的中點值為代表);
(2)估計該地區一位這種疾病患者的年齡位于區間的概率;
(3)已知該地區這種疾病的患病率為,該地區年齡位于區間的人口占該地區總人口的.從該地區中任選一人,若此人的年齡位于區間,求此人患這種疾病的概率.(以樣本數據中患者的年齡位于各區間的頻率作為患者的年齡位于該區間的概率,精確到0.0001).
10.(2022·全國·高考真題)某地經過多年的環境治理,已將荒山改造成了綠水青山.為估計一林區某種樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:)和材積量(單位:),得到如下數據:
樣本號i 1 2 3 4 5 6 7 8 9 10 總和
根部橫截面積 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材積量 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并計算得.
(1)估計該林區這種樹木平均一棵的根部橫截面積與平均一棵的材積量;
(2)求該林區這種樹木的根部橫截面積與材積量的樣本相關系數(精確到0.01);
(3)現測量了該林區所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和為.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數據給出該林區這種樹木的總材積量的估計值.
附:相關系數.
11.(2022·全國·高考真題)一醫療團隊為研究某地的一種地方性疾病與當地居民的衛生習慣(衛生習慣分為良好和不夠良好兩類)的關系,在已患該疾病的病例中隨機調查了100例(稱為病例組),同時在未患該疾病的人群中隨機調查了100人(稱為對照組),得到如下數據:
不夠良好 良好
病例組 40 60
對照組 10 90
(1)能否有99%的把握認為患該疾病群體與未患該疾病群體的衛生習慣有差異?
(2)從該地的人群中任選一人,A表示事件“選到的人衛生習慣不夠良好”,B表示事件“選到的人患有該疾病”.與的比值是衛生習慣不夠良好對患該疾病風險程度的一項度量指標,記該指標為R.
(ⅰ)證明:;
(ⅱ)利用該調查數據,給出的估計值,并利用(ⅰ)的結果給出R的估計值.
附,
0.050 0.010 0.001
k 3.841 6.635 10.828
12.(2021·全國·高考真題)甲、乙兩臺機床生產同種產品,產品按質量分為一級品和二級品,為了比較兩臺機床產品的質量,分別用兩臺機床各生產了200件產品,產品的質量情況統計如下表:
一級品 二級品 合計
甲機床 150 50 200
乙機床 120 80 200
合計 270 130 400
(1)甲機床、乙機床生產的產品中一級品的頻率分別是多少
(2)能否有99%的把握認為甲機床的產品質量與乙機床的產品質量有差異
附:
0.050 0.010 0.001
k 3.841 6.635 10.828
參考答案:
1.D
【分析】利用分層抽樣的原理和組合公式即可得到答案.
【詳解】根據分層抽樣的定義知初中部共抽取人,高中部共抽取,
根據組合公式和分步計數原理則不同的抽樣結果共有種.
故選:D.
2.B
【分析】由圖表信息,結合中位數、平均數、標準差、極差的概念,逐項判斷即可得解.
【詳解】講座前中位數為,所以錯;
講座后問卷答題的正確率只有一個是個,剩下全部大于等于,所以講座后問卷答題的正確率的平均數大于,所以B對;
講座前問卷答題的正確率更加分散,所以講座前問卷答題的正確率的標準差大于講座后正確率的標準差,所以C錯;
講座后問卷答題的正確率的極差為,
講座前問卷答題的正確率的極差為,所以錯.
故選:B.
3.C
【分析】根據直方圖的意義直接計算相應范圍內的頻率,即可判定ABD,以各組的中間值作為代表乘以相應的頻率,然后求和即得到樣本的平均數的估計值,也就是總體平均值的估計值,計算后即可判定C.
【詳解】因為頻率直方圖中的組距為1,所以各組的直方圖的高度等于頻率.樣本頻率直方圖中的頻率即可作為總體的相應比率的估計值.
該地農戶家庭年收入低于4.5萬元的農戶的比率估計值為,故A正確;
該地農戶家庭年收入不低于10.5萬元的農戶比率估計值為,故B正確;
該地農戶家庭年收入介于4.5萬元至8.5萬元之間的比例估計值為,故D正確;
該地農戶家庭年收入的平均值的估計值為(萬元),超過6.5萬元,故C錯誤.
綜上,給出結論中不正確的是C.
故選:C.
【點睛】本題考查利用樣本頻率直方圖估計總體頻率和平均值,屬基礎題,樣本的頻率可作為總體的頻率的估計值,樣本的平均值的估計值是各組的中間值乘以其相應頻率然后求和所得值,可以作為總體的平均值的估計值.注意各組的頻率等于.
4.BD
【分析】根據題意結合平均數、中位數、標準差以及極差的概念逐項分析判斷.
【詳解】對于選項A:設的平均數為,的平均數為,
則,
因為沒有確定的大小關系,所以無法判斷的大小,
例如:,可得;
例如,可得;
例如,可得;故A錯誤;
對于選項B:不妨設,
可知的中位數等于的中位數均為,故B正確;
對于選項C:因為是最小值,是最大值,
則的波動性不大于的波動性,即的標準差不大于的標準差,
例如:,則平均數,
標準差,
,則平均數,
標準差,
顯然,即;故C錯誤;
對于選項D:不妨設,
則,當且僅當時,等號成立,故D正確;
故選:BD.
5.AC
【分析】考查所給的選項哪些是考查數據的離散程度,哪些是考查數據的集中趨勢即可確定正確選項.
【詳解】由標準差的定義可知,標準差考查的是數據的離散程度;
由中位數的定義可知,中位數考查的是數據的集中趨勢;
由極差的定義可知,極差考查的是數據的離散程度;
由平均數的定義可知,平均數考查的是數據的集中趨勢;
故選:AC.
6.(1)分布列見解析,
(2)(i);列聯表見解析,(ii)能
【分析】(1)利用超幾何分布的知識即可求得分布列及數學期望;
(2)(i)根據中位數的定義即可求得,從而求得列聯表;
(ii)利用獨立性檢驗的卡方計算進行檢驗,即可得解.
【詳解】(1)依題意,的可能取值為,
則,,,
所以的分布列為:
故.
(2)(i)依題意,可知這40只小白鼠體重增量的中位數是將兩組數據合在一起,從小到大排后第20位與第21位數據的平均數,觀察數據可得第20位為,第21位數據為,
所以,
故列聯表為:
合計
對照組 6 14 20
實驗組 14 6 20
合計 20 20 40
(ii)由(i)可得,,
所以能有的把握認為小白鼠在高濃度臭氧環境中與正常環境中體重的增加量有差異.
7.(1),;
(2)認為甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率有顯著提高.
【分析】(1)直接利用平均數公式即可計算出,再得到所有的值,最后計算出方差即可;
(2)根據公式計算出的值,和比較大小即可.
【詳解】(1),


的值分別為: ,

(2)由(1)知:,,故有,
所以認為甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率有顯著提高.
8.(1),;
(2),最小值為.
【分析】(1)根據題意由第一個圖可先求出,再根據第二個圖求出的矩形面積即可解出;
(2)根據題意確定分段點,即可得出的解析式,再根據分段函數的最值求法即可解出.
【詳解】(1)依題可知,左邊圖形第一個小矩形的面積為,所以,
所以,解得:,

(2)當時,

當時,
,
故,
所以在區間的最小值為.
9.(1)歲;
(2);
(3).
【分析】(1)根據平均值等于各矩形的面積乘以對應區間的中點值的和即可求出;
(2)設{一人患這種疾病的年齡在區間},根據對立事件的概率公式即可解出;
(3)根據條件概率公式即可求出.
【詳解】(1)平均年齡
(歲).
(2)設{一人患這種疾病的年齡在區間},所以

(3)設“任選一人年齡位于區間[40,50)”,“從該地區中任選一人患這種疾病”,
則由已知得:
,
則由條件概率公式可得
從該地區中任選一人,若此人的年齡位于區間,此人患這種疾病的概率為.
10.(1);
(2)
(3)
【分析】(1)計算出樣本的一棵根部橫截面積的平均值及一棵材積量平均值,即可估計該林區這種樹木平均一棵的根部橫截面積與平均一棵的材積量;
(2)代入題給相關系數公式去計算即可求得樣本的相關系數值;
(3)依據樹木的材積量與其根部橫截面積近似成正比,列方程即可求得該林區這種樹木的總材積量的估計值.
【詳解】(1)樣本中10棵這種樹木的根部橫截面積的平均值
樣本中10棵這種樹木的材積量的平均值
據此可估計該林區這種樹木平均一棵的根部橫截面積為,
平均一棵的材積量為
(2)

(3)設該林區這種樹木的總材積量的估計值為,
又已知樹木的材積量與其根部橫截面積近似成正比,
可得,解之得.
則該林區這種樹木的總材積量估計為
11.(1)答案見解析
(2)(i)證明見解析;(ii);
【分析】(1)由所給數據結合公式求出的值,將其與臨界值比較大小,由此確定是否有99%的把握認為患該疾病群體與未患該疾病群體的衛生習慣有差異;(2)(i) 根據定義結合條件概率公式即可完成證明;(ii)根據(i)結合已知數據求.
【詳解】(1)由已知,
又,,
所以有99%的把握認為患該疾病群體與未患該疾病群體的衛生習慣有差異.
(2)(i)因為,
所以
所以,
(ii)
由已知,,
又,,
所以
12.(1)75%;60%;
(2)能.
【分析】根據給出公式計算即可
【詳解】(1)甲機床生產的產品中的一級品的頻率為,
乙機床生產的產品中的一級品的頻率為.
(2),
故能有99%的把握認為甲機床的產品與乙機床的產品質量有差異.
一、單選題
1.(2024·遼寧·模擬預測)下表為某地春節假期某日游客抽取的100人樣本的出行方式統計數據
出行方式 高鐵 自駕 飛機 客車
頻數 27 16 28 29
某實驗點從這批游客中抽取25人,當中選擇飛機出行的人數大約為( )
A.8 B.7 C.6 D.4
2.(2024·河北保定·二模)某學生通過計步儀器,記錄了自己最近30天每天走的步數,數據從小到大排序如下:
5588 6054 8799 9851 9901 10111 11029 11207 12634 12901
13001 13092 13127 13268 13562 13621 13761 13801 14101 14172
14191 14292 14426 14468 14562 14621 15061 15601 15901 19972
估計該學生最近30天每天走的步數數據的第75百分位數為( )
A.14292 B.14359 C.14426 D.14468
3.(2024·廣東茂名·二模)已知變量和的統計數據如表:
1 2 3 4 5
6 6 7 8 8
根據上表可得回歸直線方程,據此可以預測當時,( )
A.8.5 B.9 C.9.5 D.10
4.(2024·上海金山·二模)下列說法不正確的是( ).
A.一組數據10,11,11,12,13,14,16,18,20,22的第60百分位數為14
B.若隨機變量服從正態分布,且,則
C.若線性相關系數越接近1,則兩個變量的線性相關程度越高
D.對具有線性相關關系的變量、,且回歸方程為,若樣本點的中心為,則實數的值是
5.(2024·全國·模擬預測)2023年第19屆亞運會在杭州舉行,亞運會的吉祥物琮琮、蓮蓮、宸宸深受大家喜愛,某商家統計了最近5個月銷量,如下表所示:
時間x 1 2 3 4 5
銷售量y/萬只 5 4.5 4 3.5 2.5
若y與x線性相關,且線性回歸方程為,則下列說法不正確的是( )
A.由題中數據可知,變量y與x負相關 B.當時,殘差為0.2
C.可以預測當時銷量約為2.1萬只 D.線性回歸方程中
6.(2024·黑龍江·二模)根據分類變量x與y的成對樣本數據,計算得,依據的獨立性檢驗,結論為( )參考值:
0.1 0.05 0.01
2.706 3.841 6.635
A.x與y不獨立
B.x與y不獨立,這個結論犯錯誤的概率不超過0.05
C. x與y獨立
D.x與y獨立,這個結論犯錯誤的概率不超過0.05
二、多選題
7.(2024·海南海口·二模)已知甲、乙兩組樣本各有10個數據,甲、乙兩組數據合并后得到一組新數據,下列說法正確的是( )
A.若甲、乙兩組數據的平均數都為a,則新數據的平均數等于a
B.若甲、乙兩組數據的極差都為b,則新數據的極差可能大于b
C.若甲、乙兩組數據的方差都為c,則新數據的方差可能小于c
D.若甲、乙兩組數據的中位數都為d,則新數據的中位數等于d
8.(2024·江西·模擬預測)下列命題正確的是( )
A.已知由一組樣本數據,得到的回歸直線方程為,且,則這組樣本數據中一定有
B.某學校高三年級學生有男生500人,女生400人,為了獲得該校高三全體學生的身高信息,現采用樣本量比例分配的分層隨機抽樣方法抽取了容量為180的樣本,經計算得男生樣本的均值為170,方差為19,女生樣本的均值為161,方差為28,則抽取的樣本的方差為43
C.已知互不相同的30個樣本數據,若去掉其中最大和最小的數據,則剩下28個數據的分位數可能等于原樣本數據的分位數
D.若隨機變量,且,則
三、填空題
9.(2024·云南大理·模擬預測)已知某種商品的廣告費支出(單位:萬元)與銷售額(單位:萬元)之間有如下表對應數據:
1 3 4 5 7
15 20 30 40 45
根據表中數據得到關于的經驗回歸方程為,則當時,殘差為 .(殘差觀測值-預測值)
10.(2024·上海金山·二模)為了考察某種藥物預防疾病的效果,進行動物試驗,得到如下圖所示列聯表:
藥物 疾病 合計
未患病 患病
服用 50
未服用 50
合計 80 20 100
取顯著性水平,若本次考察結果支持“藥物對疾病預防有顯著效果”,則()的最小值為 .
(參考公式:;參考值:)
11.(2024·河北石家莊·三模)為了解全市高三學生的體能素質情況,在全市高三學生中隨機抽取了1000名學生進行體能測試,并將這1000名學生的體能測試成績整理成如下頻率分布直方圖.則直方圖中實數的值為 .
四、解答題
12.(2024·全國·模擬預測)第24屆哈爾濱冰雪大世界開園后,為了了解進園游客對本屆冰雪大世界的滿意度,從進園游客中隨機抽取50人進行調查并統計其滿意度評分,制成頻率分布直方圖如圖所示,其中滿意度評分在的游客人數為18.

(1)求頻率分布直方圖中的值;
(2)從抽取的50名游客中滿意度評分在及的游客中用分層抽樣的方法抽取5人,再從抽取的5人中隨機抽取2人,求2人中恰有1人的滿意度評分在的概率.
13.(2024·陜西西安·模擬預測)全球新能源汽車產量呈上升趨勢.以下為年全球新能源汽車的銷售量情況統計.
年份 2018 2019 2020 2021 2022 2023
年份編號 1 2 3 4 5 6
銷售量/百萬輛 2.02 2.21 3.13 6.70 10.80 14.14
若與的相關關系擬用線性回歸模型表示,回答如下問題:
(1)求變量與的樣本相關系數(結果精確到0.01);
(2)求關于的線性回歸方程,并據此預測2024年全球新能源汽車的銷售量.
附:線性回歸方程,其中,
樣本相關系數.
參考數據:.
14.(2024·陜西榆林·三模)“直播的盡頭是帶貨”,如今網絡直播帶貨越來越火爆,但商品的質量才是一個主播能否持久帶貨的關鍵.某主播委托甲 乙兩個工廠為其生產加工商品,為了了解商品質量情況,分別從甲 乙兩個工廠各隨機抽取了100件商品,根據商品質量可將其分為一、二、三等品,統計的結果如下圖:
(1)根據獨立性檢驗,判斷是否有的把握認為商品為一等品與加工工廠有關?
(2)將樣本數據的頻率視為概率,現在甲 乙工廠為該主播進行商品展示活動,每輪活動分別從甲 乙工廠中隨機挑選一件商品進行展示,求在兩輪活動中恰有三個一等品的概率;
(3)綜合各個方面的因素,最終該主播決定以后只委托甲工廠為其生產商品,已知商品隨機裝箱出售,每箱30個.商品出廠前,工廠可自愿選擇是否對每箱商品進行檢驗.若執行檢驗,則每個商品的檢驗費用為10元,并將檢驗出的三等品更換為一等品或二等品;若不執行檢驗,則對賣出的每個三等品商品支付100元賠償費用.將樣本數據的頻率視為概率,以整箱檢驗費用的期望記為,所有賠償費用的期望記為,以和的大小關系作為決策依據,判斷是否需要對每箱商品進行檢驗?請說明理由.
0.100 0.050 0.010 0.005
2.706 3.841 6.635 7.879
參考答案:
1.B
【分析】由題意可知:每人被抽到乘飛機的可能性均為,結合分層抽樣的性質運算求解.
【詳解】由題意可知:每人被抽到乘飛機的可能性均為,
所以選擇飛機出行的人數大約為.
故選:B.
2.C
【分析】根據給定數據,利用第75百分位數的意義求解即得.
【詳解】由,得樣本的第75百分位數為第23個數據,
據此估計該學生最近30天每天走的步數數據的第75百分位數為14426.
故選:C
3.D
【分析】計算出樣本中心點的坐標,代入回歸直線方程求得a的值,然后在回歸直線方程中,令可求得結果.
【詳解】,,
則,∴,∴,
∴時,預測.
故選:D
4.A
【分析】利用百分位數的定義即可判斷選項A,利用正態分布的性質即可判斷選項B,根據線性相關系數的性質即可判斷選項C,利用線性回歸方程中的基本量即可判斷選項D.
【詳解】對A:因為,所以第百分位數為,A錯誤;
對B:若隨機變量服從正態分布,且,
則,
則,B正確;
對C:若線性相關系數越接近,則兩個變量的線性相關性越強,C正確;
對于D,樣本點的中心為,所以,,
因為滿足線性回歸方程,所以,所以,D正確.
故選:A
5.B
【分析】對于選項A,利用表中數據變化情況或看回歸方程的正負均可求解;對于選項B,利用樣本中心點求出線性回歸方程,再利用回歸方程即可求出預測值,進而可求出殘差;對于選項C,利用回歸方程即可求出預測值;對于選項D,利用回歸方程一定過樣本中心點即可求解.
【詳解】對于選項A,從數據看隨的增大而減小,所以變量與負相關,故A正確;
對于選項B,由表中數據知,,
所以樣本中心點為,將樣本中心點代入中得,
所以線性回歸方程為,所以,,故B錯誤;
對于選項C,當時銷量約為(萬只),故C正確.
對于選項D,由上,故D正確.
故選:B.
6.C
【分析】利用獨立性檢驗的基本思想即可得解.
【詳解】零假設為:x與y獨立,
由,依據的獨立性檢驗,可得成立,
故可以認為x與y獨立.
故選:C.
7.ABD
【分析】根據平均數,極差,方差和中位數的定義和公式,逐個判斷即可得.
【詳解】設甲:,乙:,新數據為:,
對于A:因為,所以A正確;
對于B:設甲:,乙:,兩組數據極差均為9,
但混合后數據的極差為29,所以B正確;
對于C:因為,
所以,,,
所以新數據的方差為,
因為,
所以新數據的方差一定不小于,所以C錯誤.
對于D:不妨設,,則,
將混合后數據按從小到大排列,
若,則,所以第10,11個數為和;
若,則,所以第10,11個數為和,
兩種情形下,新數據的中位數都等于,所以D正確;
故選:ABD.
8.BD
【分析】根據題意,結合回歸方程的性質,樣本均值和方程的計算方法,以及百分位數的計算方法,正態分布的概率計算,逐項判定,即可求解.
【詳解】對于A中,根據回歸方程經過樣本中心,但樣本中心不一定是數據中的點,
所以這組數據不一定有,所以A錯誤;
對于中,樣本均值,
樣本方差:
,所以B正確
對于C中,將這原來的30個數從小到大排列為,則,
所以原來的分位數為,
若去掉其中最大和最小的數據,剩下28個數據為,則,
以剩下28個數據的分位數為,由于互不相同,所以C不正確;
對于D中,由,
則,所以D正確.
故選:BD.
9.
【分析】首先求樣本點中心,并代入回歸方程,求,并代入后,即可求解殘差.
【詳解】,
因為回歸直線過點,代入,可得,
當時,,
所以殘差為.
故答案為:
10.
【分析】由題意列出不等式,結合近似計算求出m的取值范圍,即可得答案.
【詳解】由題意可知,
則,
解得或,而,
故m的最小值為44.
故答案為:44.
11.
【分析】利用直方圖直方塊總面積為,進行運算解出即可.
【詳解】由直方圖可知:組距為,
所以,
解得.
故答案為:.
12.(1),
(2).
【分析】(1)根據評分在的游客人數為18和總人數為50得到,利用頻率之和為1得到方程,求出;
(2)根據分層抽樣的方法得到評分在的人數為2,設為,滿意度評分在的人數為3,設為,列舉出所有情況和2人中恰有1人的滿意度評分在的情況,求出概率.
【詳解】(1)由題知,,
,解得.
(2)由題知,抽取的50名游客中滿意度評分在的人數為,
滿意度評分在的人數為,
抽取的5人中,滿意度評分在的人數為2,設為,滿意度評分在的人數為3,設為,
從5人中隨機抽取2人的不同取法為,,共有10種不同取法,
設“2人中恰有1人的滿意度評分在”為事件,
則事件包含的取法為,,共有6種不同取法.

13.(1)
(2),百萬輛
【分析】(1)利用相關系數公式即可求解;
(2)根據已知數據,利用公式先求出,進而求出,得到線性回歸方程,再利用線性回歸方程進行預測即可.
【詳解】(1)因為,

所以,

所以
(2)由題意得,
所以,
得關于的線性回歸方程為,
所以可以預測2024年全球新能源汽車的銷售量為百萬輛.
14.(1)沒有的把握認為商品為一等品與加工工廠有關
(2)
(3)應進行檢驗,理由見解析
【分析】(1)列列聯表,由表中數據計算卡方,即可判斷;
(2)利用獨立事件乘法公式計算甲、乙展示的商品均為一等品的概率及只有一輪展示的商品為一等品的概率,進而利用互斥事件概率加法公式求解即可;
(3)設每箱30個商品中的三等品個數為,由題意知,利用二項分布期望公式求解,然后根據數學期望的定義及性質分別求解進行檢驗和不進行檢驗的數學期望,比較大小即可得出結論.
【詳解】(1)由題意得列聯表如下:
一等品 非一等品 合計
甲 70 30 100
乙 60 40 100
合計 130 70 200

所以沒有的把握認為商品為一等品與加工工廠有關.
(2)兩輪中,甲展示的商品均為一等品的概率為,
只有一輪展示的商品為一等品的概率為;
兩輪中,乙展示的商品均為一等品的概率為,
只有一輪展示的商品為一等品的概率為.
則兩輪活動中恰有三個一等品的概率為:.
(3)由已知,每個零件為三等品的概率為,
設每箱30個商品中的三等品個數為,則,所以.
若不進行檢驗,則450元.
若進行檢驗,則總檢驗費用的期望值為元.
因為,所以應進行檢驗.
21世紀教育網 www.21cnjy.com 精品試卷·第 2 頁 (共 2 頁)
21世紀教育網(www.21cnjy.com)

展開更多......

收起↑

資源列表

    <track id="r4fhd"></track>

    <pre id="r4fhd"><abbr id="r4fhd"><code id="r4fhd"></code></abbr></pre>
      <ul id="r4fhd"></ul>

        <menu id="r4fhd"></menu>
        1. 主站蜘蛛池模板: 玉龙| 于田县| 即墨市| 绥芬河市| 万山特区| 华阴市| 英德市| 久治县| 德兴市| 资兴市| 巴塘县| 怀仁县| 平定县| 庄河市| 西丰县| 舒兰市| 八宿县| 大竹县| 突泉县| 平塘县| 宁城县| 简阳市| 大石桥市| 赤水市| 柏乡县| 缙云县| 英吉沙县| 宜丰县| 泰和县| 夏河县| 大方县| 山西省| 梅河口市| 雅江县| 浦县| 邳州市| 阜平县| 姚安县| 沛县| 新龙县| 沛县|