資源簡介 (共35張PPT)9.2 獨立性檢驗必備知識 清單破 假設兩個分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其2×2列聯表為知識點 1 2×2列聯表Yy1 y2 合計X x1 a b a+bx2 c d c+d合計 a+c b+d a+b+c+d2×2列聯表給出了成對分類變量數據的交叉分類頻數. 1.χ2公式 一般地,對于兩個分類變量Ⅰ和Ⅱ,Ⅰ有兩類取值,即類A和類B(如吸煙與不吸煙);Ⅱ也有 兩類取值,即類1和類2(如患呼吸道疾病和未患呼吸道疾病).我們得到字母表示的2×2列聯表:知識點 2 與獨立性檢驗相關的概念Ⅱ類1 類2 合計Ⅰ 類A a b a+b類B c d c+d合計 a+c b+d a+b+c+d 記n=a+b+c+d,則χ2= .2.獨立性檢驗 用χ2統計量研究兩類變量是否有關的方法稱為獨立性檢驗. 1.要推斷“Ⅰ與Ⅱ有關系”,可按下面的步驟進行:(1)提出假設H0:Ⅰ與Ⅱ沒有關系;(2)根據2×2列聯表與χ2= 計算χ2的值;(3)根據臨界值(如下表所示),做出判斷.知識點3 獨立性檢驗的思想P(χ2≥x0) 0.50 0.40 0.25 0.15 0.10x0 0.455 0.708 1.323 2.072 2.706P(χ2≥x0) 0.05 0.025 0.010 0.005 0.001x0 3.841 5.024 6.635 7.879 10.8282.常用檢驗結論(1)若χ2>10.828,則有99.9%的把握認為“Ⅰ與Ⅱ有關系”;(2)若χ2>6.635,則有99%的把握認為“Ⅰ與Ⅱ有關系”;(3)若χ2>2.706,則有90%的把握認為“Ⅰ與Ⅱ有關系”;(4)若χ2≤2.706,則認為沒有充分的證據顯示“Ⅰ與Ⅱ有關系”,但也不能得出結論“H0成 立”,即Ⅰ與Ⅱ沒有關系.知識辨析1.分類變量中的變量與函數中的變量是同一概念嗎 2.獨立性檢驗得出的結論是確定的嗎 3.若事件A與B經獨立性檢驗后得到結論“A與B無關”,則這兩個事件是不是互不影響 一語破的1.不是.變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量,有時可以 把分類變量的不同取值用數字表示,但這時的數字除了分類以外沒有其他含義,而函數中的 變量分為自變量與因變量,都是數的集合,有它們各自的意義.2.不是.因為列聯表中的數據是樣本數據,它只是總體的代表,具有隨機性,所以獨立性檢驗得 出的結論不是確定的.3.不是.只能說明“A與B無關”這一結論犯錯誤的可能性很小.關鍵能力 定點破 獨立性檢驗的關注點 在2×2列聯表中,如果兩個分類變量沒有關系,則應滿足ad-bc≈0,事實上,|ad-bc|越小,兩個 分類變量的關系越弱;|ad-bc|越大,兩個分類變量的關系越強.定點 1 由χ2進行獨立性檢驗典例1 為了研究經常使用手機是否對數學學習成績有影響,某校高二數學學習小組進行了調 查,隨機抽取高二年級50名學生的一次數學單元測試成績,并制成下面的2×2列聯表:及格 不及格 合計很少使用手機 20 5 25經常使用手機 10 15 25合計 30 20 50參考公式:χ2= ,其中n=a+b+c+d.附表:P(χ2≥x0) 0.05 0.025 0.010 0.005 0.001x0 3.841 5.024 6.635 7.879 10.828參照附表,得到的正確結論是 ( )A.有99.9%以上的把握認為“經常使用手機與數學學習成績無關”B.有99.9%以上的把握認為“經常使用手機與數學學習成績有關”C.在犯錯誤的概率不超過0.5%的前提下,認為“經常使用手機與數學學習成績無關”D.在犯錯誤的概率不超過0.5%的前提下,認為“經常使用手機與數學學習成績有關”D解析 提出假設H0:經常使用手機與數學學習成績無關.由題中數據可得,χ2= = ≈8.333,因為當H0成立時,χ2>7.879的概率約為0.005,所以有99.5%的把握認為“經常使用手機與數學 學習成績有關”,即在犯錯誤的概率不超過0.5%的前提下,認為“經常使用手機與數學學習 成績有關”.故選D.典例2 有甲、乙兩個班級共計105人進行數學考試,按照大于或等于85分為優秀,85分以下為 非優秀統計成績,得到下表:優秀 非優秀甲班 10 b乙班 c 30附: χ2= ,n=a+b+c+d.P(χ2≥x0) 0.05 0.010 0.001x0 3.841 6.635 10.828已知在全部的105人中隨機抽取1人,成績優秀的概率為 ,則下列說法正確的是 ( )A.列聯表中c的值為30,b的值為35B.列聯表中c的值為20,b的值為40C.根據列聯表中的數據,若按95%的可靠性要求,能認為“成績與班級有關系”D.根據列聯表中的數據,若按95%的可靠性要求,不能認為“成績與班級有關系”C解析 由題意,在全部的105人中隨機抽取1人,成績優秀的概率為 ,所以成績優秀的人數為105× =30,非優秀的人數為105-30=75,所以c=30-10=20,b=75-30=45.提出假設H0:成績與班級無關.根據列聯表中的數據,可以求得χ2= ≈6.109,因為當H0成立時, χ2>3.841的概率約為0.05,所以有95%的把握認為“成績與班級有關系”. 解決與獨立性檢驗有關的統計、概率綜合問題,一般有以下幾個步驟:(1)厘清題意,理解問題中的條件和所要得出的結論,尤其是直方圖中給定的信息,找關鍵量.(2)分析數據,列出2×2列聯表.(3)利用獨立性檢驗的步驟進行判斷.(4)利用概率公式求事件的概率.(5)反思回顧、檢查關鍵點、易錯點及答題規范.定點 2 獨立性檢驗與統計、概率的綜合應用典例1 北京冬奧組委對報名參加北京冬奧會志愿者的人員開展冬奧會志愿者的培訓活動,并 在培訓結束后進行了一次考核.為了解這次培訓活動的效果,從中隨機抽取160名志愿者的考 核成績,根據這160名志愿者的考核成績,得到的統計圖表如下所示.男志愿者考核成績頻率分布直方圖 女志愿者考核成績頻率分布表分組 頻數 頻率[75,80) 4 0.050[80,85) 26 0.325[85,90) a 0.3[90,95) 20 m[95,100] b 0.075若參加這次考核的志愿者考核成績在[90,100]內,則考核等級為優秀.(1)求a,b,m的值;(2)分別求出這次培訓考核等級為優秀的男、女志愿者人數;(3)補全下面的2×2列聯表,在犯錯誤的概率不超過0.01的條件下,能否認為考核等級是否優秀 與性別有關.單位:人優秀 非優秀 合計男志愿者女志愿者合計P(χ2≥x0) 0.10 0.05 0.010 0.001x0 2.706 3.841 6.635 10.828附: χ2= ,其中n=a+b+c+d.解析 (1)因為0.050+0.325+0.3+m+0.075=1,所以m=0.25,又女志愿者總人數為 =80,所以a=80×0.3=24,b=80×0.075=6.(2)這次培訓考核等級為優秀的男志愿者人數為(160-80)×(0.015+0.010)×5=10;這次培訓考核等級為優秀的女志愿者人數為20+6=26.(3)由題意得,2×2列聯表如下:單位:人優秀 非優秀 合計男志愿者 10 70 80女志愿者 26 54 80合計 36 124 160提出假設H0:考核等級是否優秀與性別無關,根據列聯表數據,得χ2= = ≈9.176,因為當H0成立時,χ2>6.635的概率約為0.01,所以在犯錯誤的概率不超過0.01的條件下,能認為考核等級是否優秀與性別有關.典例2 隨著智能手機的普及,手機計步軟件迅速流行開來,這類軟件能自動記載每個人每日 健步走的步數,從而為科學健身提供一定的幫助.某市總工會為了解該市市民每日健步走的 情況,從本市市民中隨機抽取了2 000名(其中不超過40歲的市民恰好有1 000名),利用手機計 步軟件統計了他們某天健步走的步數(單位:千),并將樣本數據按[3,5),[5,7),[7,9),[9,11),[11,1 3),[13,15),[15,17),[17,19),[19,21]分為九組,將抽取的不超過40歲的市民的樣本數據繪制成頻 率分布直方圖,將40歲以上的市民的樣本數據繪制成頻數分布表,并利用該樣本的頻率估計 總體的概率.步數分組/千 [3,5) [5,7) [7,9) [9,11) [11,13)頻數 10 20 20 30 400步數分組/千 [13,15) [15,17) [17,19) [19,21]頻數 200 200 100 20(1)現規定,每日健步走的步數不低于13 000的為“健步達人”,填寫下面的2×2列聯表,在犯錯 誤的概率不超過0.001的條件下,分析是不是“健步達人”是否與年齡有關;單位:人“健步達人” 非“健步達人” 合計40歲以上的市民不超過40歲的市民合計(2)①利用樣本平均數和中位數估計該市不超過40歲的市民每日健步走的步數(單位:千)的平 均數和中位數(同一組的數據用該組區間的中點值作代表);②由頻率分布直方圖可以認為,不超過40歲的市民每日健步走的步數Z(單位:千)近似地服從 正態分布N(μ,σ2),其中μ近似為樣本平均數,σ的值約為3.64.現從該市不超過40歲的市民中隨 機抽取5人,記其中每日健步走的步數Z(單位:千)在[4.88,15.8]內的人數為X,求X的數學期望.參考公式:χ2= ,其中n=a+b+c+d.參考數據:P(χ2≥x0) 0.10 0.05 0.010 0.005 0.001x0 2.706 3.841 6.635 7.879 10.828若Z~N(μ,σ2),則P(μ-σ≤Z≤μ+σ)≈0.682 7,P(μ-2σ≤Z≤μ+2σ)≈0.954 5.解析 (1)2×2列聯表為單位:人“健步達人” 非“健步達人” 合計40歲以上的市民 520 480 1 000不超過40歲的市民 400 600 1 000合計 920 1 080 2 000提出假設H0:是不是“健步達人”與年齡無關.計算可得χ2= ≈28.986,因為當H0成立時,χ2>10.828的概率約為0.001,所以在犯錯誤的概率不超過0.001的條件下,認為是不是“健步達人”與年齡有關.(2)①樣本平均數為4×0.04+6×0.06+8×0.10+10×0.10+12×0.30+14×0.20+16×0.10+18×0.08+20 ×0.02=12.16.由前4組的頻率之和為0.04+0.06+0.10+0.10=0.30,前5組的頻率之和為0.30+0.30=0.60,知樣本 中位數落在第5組,設樣本中位數為t,則(t-11)×0.15=0.50-0.30,所以t= .故可以估計該市不超過40歲的市民每日健步走的步數(單位:千)的平均數為12.16,中位數為 .②由題意及①可知μ=12.16,σ=3.64,故[μ-2σ,μ+σ]=[4.88,15.8],而P(μ-2σ≤Z≤μ+σ)= P(μ-2σ≤Z≤μ+2σ)+ P(μ-σ≤Z≤μ+σ)≈ ×0.954 5+ ×0.682 7=0.818 6,所以X~B(5,0.818 6),所以E(X)=5×0.818 6=4.093.規律總結 獨立性檢驗與統計、概率的綜合應用主要表現為以統計圖表為載體,考查統計分 析、概率的計算,以及構建兩個分類變量并列2×2列聯表等.解題的關鍵是認真審題,確定分 類變量的取值,得到2×2列聯表,計算χ2,從而解決問題.學科素養 情境破素養 綜合應用統計與概率知識解決實際問題,發展直觀想象、數學建模、數學運算的核心素養素養解讀 在統計與概率的綜合應用問題中,一般要利用散點圖、統計圖表得到相應的統計信息, 通過建立相應的統計與概率模型將實際問題數學化,再利用回歸分析或獨立性檢驗及概率知 識求解,最后還原成實際問題的解,其中涉及的運算有(1)求概率、分布列、數學期望或方差; (2)求樣本相關系數或線性回歸方程;(3)求平均數、中位數、眾數等統計量;(4)求統計量χ2.典例呈現例題 為推進北方地區冬季清潔取暖,國家發改委制定了煤改氣、煤改電價格扶植新政策, 從而使得煤改氣、煤改電用戶大幅度增加.下面條形圖反映了某省2023年1~7月份煤改氣、 煤改電的用戶總數量(單位:萬戶). (1)在下面給定的坐標系中作出煤改氣、煤改電用戶總數量y隨月份t變化的散點圖,并判斷y與t是否具有線性相關關系.如果具有線性相關關系,那么是正相關還是負相關 (2)求樣本相關系數r,并用樣本相關系數說明y與t之間線性相關的程度;(3)建立y關于t的經驗回歸方程(系數精確到0.01),并估計2024年11月份該省煤改氣、煤改電 的用戶總數量;(4)從這7個月的煤改氣、煤改電的用戶總數量數據中隨機抽取2個數據,記其中煤改氣、煤 改電的用戶總數量低于1.3的數據個數為X,求X的概率分布與數學期望.參考數據: 解題思路 (1)通過作出散點圖來分析線性相關性.作出散點圖如圖所示: 由圖可知,各散點基本分布在一條直線附近,所以可以認為y與t具有線性相關關系,且是正相 關.(2)由題中條形圖中的數據得, =4, =28,又 ≈0.53, (ti- )(yi- )=2.79,所以 r= ≈ ≈0.99,因為y與t的樣本相關系數r接近1,所以y與t的線性相關性很強.(3)由(2)可設y關于t的經驗回歸方程為 = + t.利用公式求出其中的相關參數即可得到經驗回歸方程,再把t=23代入方程中進行估計.由 = =1.32及參考數據得 = = ≈0.10, = - ≈1.32-0.10×4=0.92,所以y關于t的經驗回歸方程為 =0.92+0.10t,將t=23代入經驗回歸方程得 =0.92+0.10×23=3.22,所以估計2024年11月份該省煤改氣、煤改電的用戶總數量為3.22萬戶.(4)易知這7個月中,只有前3個月的煤改氣、煤改電的用戶總數量低于1.3,故X的可能取值為0,1,2.P(X=0)= = ,P(X=1)= = ,P(X=2)= = ,所以X的概率分布為X 0 1 2P 所以X的數學期望E(X)=0× +1× +2× = .思維升華 統計與概率作為考查學生應用意識的重要載體,已成為近幾年高考的一大亮點和熱點. 它與其他知識融合、滲透,情境新穎,充分體現了概率與統計的工具性和交匯性,在解題時要 注意理解實際問題的意義,使之和相應的概率計算對應起來,從而快速有效地解決問題.9.2 獨立性檢驗基礎過關練 題組一 2×2列聯表1.某村莊抽取了該村內50名老年人、年輕人每年是否體檢的情況進行了調查,統計數據如表所示:每年體檢 未每年體檢 合計老年人 a 7 c年輕人 6 b d合計 e f 50已知抽取的老年人、年輕人各有25名,則下列結論錯誤的是( )A.a=18 B.b=19C.c+d=50 D.f-e=-22.某次國際會議為了搞好對外宣傳工作,會務組選聘了50名記者擔任對外翻譯工作,在如下“性別與是否會外語”的2×2列聯表中,d= . 會外語 不會外語 合計男 a b 20女 6 d合計 18 50題組二 獨立性檢驗的基本思想及其應用3.對于獨立性檢驗,下列說法正確的是( )A.χ2的值可以為負值B. χ2獨立性檢驗的統計假設是各事件之間相互獨立C.利用χ2獨立性檢驗得到“患慢性氣管炎和吸煙習慣有關”即指“有吸煙習慣的人必會患慢性氣管炎”D.2×2列聯表中的4個數據可為任何實數4.假設有兩個變量X和Y,它們的取值集合分別為{x1,x2}和{y1,y2},其2×2列聯表如下.y1 y2x1 a bx2 c d根據以下選項中的數據計算χ2的值,其中χ2的值最大的一組為( )A.a=60,b=50,c=40,d=30B.a=60,b=40,c=50,d=30C.a=40,b=30,c=50,d=60D.a=30,b=40,c=50,d=605.(多選題)某高校有在校學生9 000名,其中男生4 000名,女生5 000名,為了解學生每天自主學習中國古典文學的時長,隨機調查了40名男生和50名女生,其中每天自主學習中國古典文學的時長超過3小時的學生稱為“古文迷”,否則為“非古文迷”,調查結果如下表,則( )古文迷 非古文迷男生 20 20女生 40 10參考公式及數據: χ2=,其中n=a+b+c+d.P(χ2≥x0) 0.50 0.40 0.25 0.05 0.025 0.010x0 0.455 0.708 1.323 3.841 5.024 6.635A.該校某名學生為“古文迷”的概率為0.6B.隨機調查的男、女生人數符合分層抽樣的抽樣方法C.有99%的把握認為學生是不是“古文迷”與性別有關系D.沒有99%的把握認為學生是不是“古文迷”與性別有關系6.針對2025年第九屆哈爾濱亞冬會,某校團委對“是否喜歡冰雪運動與學生性別的關系”進行了一次調查,其中被調查的男、女生人數相同,男生中喜歡冰雪運動的人數占男生人數的,女生中喜歡冰雪運動的人數占女生人數的,若有95%的把握認為是否喜歡冰雪運動與學生性別有關,則被調查的學生中男生的人數不可能為( )附: χ2=,n=a+b+c+d.P(χ2≥x0) 0.1 0.05 0.01 0.005 0.001x0 2.706 3.841 6.635 7.879 10.828A.48 B.54 C.60 D.667.直播帶貨是一種直播和電商相結合的銷售手段,目前已被廣大消費者所接受.針對這種現狀,某公司決定逐月加大對直播帶貨的投入,使直播帶貨金額穩步提升.以下是該公司2023年前5個月的直播帶貨金額:月份x 1 2 3 4 5直播帶貨 金額y/萬元 350 440 580 700 880(1)求變量x,y滿足的經驗回歸方程,并據此估計2023年7月份該公司的直播帶貨金額;(2)該公司隨機抽取55人進行問卷調查,得到如下不完整的列聯表:參加過直 播帶貨 未參加過 直播帶貨 總計女性 25 30男性 10總計請補全上表,并判斷是否有90%的把握認為參加過直播帶貨與性別有關.參考數據:(xi-)2=10,(yi-)2=176 400,(xi-)(yi-)=1 320,≈664.P(χ2≥x0) 0.15 0.10 0.05 0.025x0 2.072 2.706 3.841 5.024參考公式:經驗回歸方程中,;χ2=,其中n=a+b+c+d.8.盲盒里面通常裝的是動漫、影視作品的周邊,或者設計師單獨設計出來的玩偶等.盒子上沒有標注,購買者只有打開后才會知道自己買到了什么,因此這種驚喜吸引了眾多年輕人,形成了“盲盒經濟”.某款盲盒內可能裝有某一套玩偶的A,B,C三種樣式,且每個盲盒內只裝一個.(1)某銷售網點為調查該款盲盒的受歡迎程度,隨機發放了200份問卷,并全部收回.經統計,有30%的人購買了該款盲盒,在這些購買者中,女生占;而在未購買者中,男生、女生各占50%.請根據以上信息填寫2×2列聯表,并分析是否有95%的把握認為購買該款盲盒與性別有關;女生 男生 合計購買未購買合計(2)該銷售網點已經售賣該款盲盒6周,并記錄了銷售情況,如表:第x周 1 2 3 4 5 6售出盒數y 16 23 25 26 30由于電腦故障,第2周數據現已丟失,該銷售網點負責人決定用第4,5,6周的數據求經驗回歸方程,再用第1,3周的數據進行檢驗.①若由經驗回歸方程得到的估計數據與所選出的檢驗數據的誤差的絕對值均不超過2,則認為得到的經驗回歸方程是可靠的.請用第4,5,6周的數據求出y關于x的經驗回歸方程,并說明所得經驗回歸方程是否可靠;②如果通過①的檢驗得到的經驗回歸方程可靠,那么我們可以認為第2周賣出的盒數誤差的絕對值也不超過2,請你求出第2周賣出的盒數的可能取值;如果不可靠,請你設計一個估計第2周賣出的盒數的方案.參考公式:χ2=,其中n=a+b+c+d;在中,.參考數據:P(χ2≥x0) 0.10 0.05 0.025 0.010 0.005 0.001x0 2.706 3.841 5.024 6.635 7.879 10.828能力提升練 題組一 獨立性檢驗的基本思想及其應用1.“3+1+2”的新高考模式,其中“3”為全國統考科目:語文、數學和外語;“1”為考生在物理和歷史中選擇一門;“2”為考生在思想政治、地理、化學和生物四門中選擇兩門.某中學調查了高一年級學生的選科傾向,隨機抽取200人,其中選考物理的有120人,選考歷史的有80人,統計各選科人數如下表,則下列說法正確的是( )選考類別 選擇科目思想政治 地理 化學 生物物理類 35 50 90 65歷史類 50 45 30 35附: χ2=,其中n=a+b+c+d.P(χ2≥x0) 0.100 0.050 0.025 0.010 0.005 0.001x0 2.706 3.841 5.024 6.635 7.879 10.828A.物理類的學生中選擇地理的比例比歷史類的學生中選擇地理的比例高B.物理類的學生中選擇生物的比例比歷史類的學生中選擇生物的比例低C.有90%以上的把握認為選擇生物與選考類別有關D.沒有95%以上的把握認為選擇生物與選考類別有關2.(多選題)某校為了解高一新生對數學是否感興趣,從400名女生和600名男生中通過分層抽樣的方式隨機抽取了100名學生進行問卷調查,將調查的結果進行統計,得到如下等高堆積條形圖和列聯表,則( )對數學的興趣 合計感興趣 不感興趣女生 a b a+b男生 c d c+d合計 a+c b+d 100參考數據:P(χ2≥x0) 0.1 0.05 0.01 0.005 0.001x0 2.706 3.841 6.635 7.879 10.828A.表中a=12,c=30B.可以估計該校高一新生中對數學不感興趣的女生比男生多C.有95%的把握認為性別與對數學的興趣有關D.有99%的把握認為性別與對數學的興趣有關3.為了調查學生對網絡課程是否喜歡,研究人員隨機調查了相同人數的男、女學生,發現男生中有80%喜歡網絡課程,女生中有40%不喜歡網絡課程,且有95%的把握認為喜歡網絡課程與性別有關,但沒有99%的把握認為喜歡網絡課程與性別有關.已知被調查的男、女學生的總人數為20k(k∈N*),則k= . 4.某市舉行了首屆閱讀大會,為調查市民對閱讀大會的滿意度,相關部門隨機抽取男、女市民各50名,每名市民對大會給出滿意或不滿意的評價,得到下面列聯表:滿意 不滿意男市民 60-m m-10女市民 m+10 40-m當m≤25,m∈N*時,若沒有95%的把握認為男、女市民對大會的評價有差異,則m的最小值為 . 附: χ2=,其中n=a+b+c+d.P(χ2≥x0) 0.10 0.05 0.005x0 2.706 3.841 7.879題組二 獨立性檢驗的綜合應用5.為分析消費能力與性別的關系,某電商運營部門使用相關軟件了解到,2023年第4季度在本店網購的消費者共12 000名,現隨機抽取100名消費者,其中男女各半.若消費者的總消費金額不低于3 000元,則稱其為網購達人.男性消費者中,網購達人占.網購達人中,男性消費者占.(1)請完成下面的2×2列聯表;性別 網購達人 非網購達人 合計男女合計(2)若“認為是不是網購達人與性別有關”犯錯誤的概率不超過P,那么根據臨界值表得到的最精確的P值應為多少 請說明理由.參考公式: χ2=,其中n=a+b+c+d.臨界值表:P(χ2≥x0) 0.10 0.05 0.010 0.001x0 2.706 3.841 6.635 10.8286.某地區對某次考試成績進行分析,隨機抽取100名學生的A,B兩門學科成績作為樣本.將他們的A學科成績進行整理,得到如下頻率直方圖,且規定成績達到70分為良好.已知他們中B學科良好的有50人,兩門學科均良好的有40人.根據所給數據,完成下面的2×2列聯表,并根據列聯表,判斷是否有95%的把握認為這次考試學生的A學科良好與B學科良好有關;B學科良好 B學科不夠良好 合計A學科良好A學科不夠良好合計(2)用樣本頻率估計總體概率,從該地區參加考試的全體學生中隨機抽取3人,記這3人中A,B學科均良好的人數為X,求X的概率分布與數學期望.附: χ2=,其中n=a+b+c+d.P(χ2≥x0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001x0 2.072 2.706 3.841 5.024 6.635 7.879 10.8287.為培養學生的閱讀習慣,某學校規定所有學生每天在校閱讀時長不得少于1小時.若認為每天在校閱讀時長不少于1小時為達標,達到2小時的學生為“閱讀之星”.假設該校學生每天在校閱讀時長X~N(1.5,σ2)(X的單位:小時),達標學生是“閱讀之星”的概率為.(1)從該校學生中隨機選出1人,求達標的概率;(2)為進一步了解該校學生不達標是否與性別有關,隨機調查了90名學生,其中男生占,已知不達標的人數恰是其期望值,且不達標的學生中男生占,是否有99%的把握認為不達標與性別有關 參考公式: χ2=,其中n=a+b+c+d.參考數據:P(χ2≥x0) 0.050 0.025 0.010 0.001x0 3.841 5.024 6.635 10.8288.恰逢盛世,風調雨順,某稻米產地獲得大豐收.為促進當地某品牌大米銷售,甲、乙兩位駐村干部通過直播宣傳并銷售所駐村生產的該品牌大米.通過分析某時段內100名顧客在觀看直播后選擇在甲、乙兩位駐村干部的直播間內(以下簡稱為甲直播間、乙直播間)購買的情況(假定每人只在一個直播間內購買大米),得到以下數據:網民類型 在直播間內購買大米的情況 合計在甲直播間內購買 在乙直播間內購買本地區網民 50 5 55外地區網民 30 15 45合計 80 20 100(1)是否有99.5%的把握認為網民選擇在甲、乙直播間內購買大米與網民所處地區有關 (2)用樣本的頻率分布估計總體的概率分布,若共有100 000名網民在甲、乙直播間內購買大米,且網民選擇在甲、乙兩個直播間內購買大米互不影響,記其中在甲直播間內購買大米的網民人數為X,求事件“X=k”的概率取最大值時k的值.附: χ2=,其中n=a+b+c+d.P(χ2≥x0) 0.1 0.05 0.01 0.005x0 2.706 3.841 6.635 7.879答案與分層梯度式解析9.2 獨立性檢驗基礎過關練1.D 3.B 4.C 5.BC 6.A1.D 由題意得a+7=c=25,6+b=d=25,a+6=e,7+b=f,c+d=50,所以a=18,b=19,e=24,f=26,所以f-e=2,故選D.2.答案 24解析 由題意得解得3.B ∵2×2列聯表中的數據均為正整數,∴根據χ2的計算公式可知χ2的值不可能為負值,排除A;由獨立性檢驗的檢驗步驟可知B正確;利用χ2獨立性檢驗得到“患慢性氣管炎和吸煙習慣有關”,是指有吸煙習慣的人患慢性氣管炎的概率較大,即有一定的把握說它們相關,允許有一定的出錯率,因此C錯誤;2×2列聯表中的4個數據是對于某組特定變量的統計數據,這4個數據間有一定的關系,不能為任意實數,因此D錯誤.故選B.4.C 對于A, ;對于B, ;對于C, ;對于D, .顯然最大,故C正確.5.BC 由題表中數據知,該校某名學生為“古文迷”的概率為≠0.6,A錯誤.男生共4 000名,女生共5 000名,隨機調查了40名男生和50名女生,4 000∶5 000=40∶50,符合分層抽樣的抽樣方法,B正確.提出假設H0:學生是不是“古文迷”與性別無關,由題表中數據得χ2==9,因為當H0成立時, χ2≥6.635的概率約為0.01,所以我們有99%的把握認為學生是不是“古文迷”與性別有關系,故C正確,D錯誤.故選BC.6.A 設男生人數為6n(n∈N*),因為被調查的男、女生人數相同,所以女生人數也為6n(n∈N*),根據題意列出列聯表如下:男生 女生 合計喜歡冰雪運動 5n 4n 9n不喜歡冰雪運動 n 2n 3n合計 6n 6n 12n則χ2=,因為有95%的把握認為是否喜歡冰雪運動與學生性別有關,所以χ2≥3.841,即≥3.841,所以6n≥51.853 5,又n∈N*,故通過分析選項,可知被調查的學生中男生的人數不可能為48,故選A.7.解析 (1)由題得)=1 320,所以=590-132×3=194,所以變量x,y滿足的經驗回歸方程為=132x+194,當x=7時,=132×7+194=1 118,所以估計2023年7月份該公司的直播帶貨金額為1 118萬元.(2)補全的列聯表如下:參加過直播帶貨 未參加過直播帶貨 總計女性 25 5 30男性 15 10 25總計 40 15 55提出假設H0:參加過直播帶貨與性別無關,根據表中數據,計算可得χ2=≈3.743,因為當H0成立時, χ2≥2.706的概率約為0.1,所以我們有90%的把握認為參加過直播帶貨與性別有關.8.解析 (1)2×2列聯表如下:女生 男生 合計購買 40 20 60未購買 70 70 140合計 110 90 200提出假設H0:購買該款盲盒與性別無關.根據列聯表中的數據,可得χ2=≈4.714,因為當H0成立時, χ2≥3.841的概率約為0.05,所以我們有95%的把握認為購買該款盲盒與性別有關.(2)①根據第4,5,6周的數據,得×(4+5+6)=5,×(25+26+30)=27,故=2.5,=27-2.5×5=14.5,則所求經驗回歸方程為=2.5x+14.5,當x=1時,=2.5×1+14.5=17,|17-16|<2,當x=3時,=2.5×3+14.5=22,|22-23|<2,故所得經驗回歸方程是可靠的.②由①可知得到的經驗回歸方程可靠,所以當x=2時,=2.5×2+14.5=19.5.設第2周賣出的盒數為n(n∈N*),則|n-19.5|≤2,即17.5≤n≤21.5,所以n能取18,19,20,21,即第2周賣出的盒數的可能取值為18,19,20,21.能力提升練1.D 依據題表中數據可知,物理類的學生中選擇地理的比例為,所以物理類的學生中選擇地理的比例比歷史類的學生中選擇地理的比例低,故A錯誤;物理類的學生中選擇生物的比例為,所以物理類的學生中選擇生物的比例比歷史類的學生中選擇生物的比例高,故B錯誤;由題中表格可列2×2列聯表如下:選考生物 不選考生物 合計物理類 65 55 120歷史類 35 45 80合計 100 100 200提出假設H0:選擇生物與選考類別無關,故χ2=≈2.083,由2.083<2.706,知沒有90%以上的把握認為選擇生物與選考類別有關,故C錯誤;由2.083<3.841,知沒有95%以上的把握認為選擇生物與選考類別有關,故D正確.故選D.2.AC 由題可知,抽取的男生人數為600×=40,由題中等高堆積條形圖知,抽取的男生中感興趣的人數為60×0.5=30,不感興趣的人數為60×0.5=30,抽取的女生中感興趣的人數為40×0.3=12,不感興趣的人數為40×0.7=28,故2×2列聯表如下:對數學的興趣 合計感興趣 不感興趣女生 12 28 40男生 30 30 60合計 42 58 100由此表可知,a=12,c=30,故A正確;用樣本估計總體,可知該校高一新生中,對數學不感興趣的女生人數約為400×=300,所以估計該校高一新生中對數學不感興趣的女生比男生少,故B錯誤;提出假設H0:性別與對數學的興趣無關,易得χ2=≈3.941>3.841,因為當H0成立時,χ2≥3.841的概率約為0.05,所以我們有95%的把握認為性別與對數學的興趣有關,故C正確;由C中分析知χ2≈3.941<6.635,所以沒有99%的把握認為性別與對數學的興趣有關,故D錯誤.故選AC.3.答案 5或6解析 根據題意,2×2列聯表如下:是否喜歡網絡課程 合計喜歡 不喜歡男生 8k 2k 10k女生 6k 4k 10k合計 14k 6k 20k提出假設H0:喜歡網絡課程與性別無關,所以χ2=.因為有95%的把握認為喜歡網絡課程與性別有關,但沒有99%的把握認為喜歡網絡課程與性別有關,所以3.841≤<6.635,所以4.033 05≤k<6.966 75,又k∈N*,所以k=5或k=6.4.答案 21解析 χ2==,由題意得χ2=<3.841,即(2 500-100m)2<201 652.5,所以-449<2 500-100m<449,即20.515.解析 (1)由題意可得,抽取的男性消費者有50人,女性消費者有50人,男性消費者中網購達人有50×=20(人),則男性消費者中非網購達人有50-20=30(人),抽取的消費者中網購達人共有20×=50(人),則女性消費者中網購達人有50-20=30(人),女性消費者中非網購達人有50-30=20(人),故得2×2列聯表如下:性別 網購達人 非網購達人 合計男 20 30 50女 30 20 50合計 50 50 100(2)提出假設H0:是不是網購達人與性別無關,由(1)中列聯表可得, χ2==4,因為3.841<4<6.635,所以由臨界值表可知,“認為是不是網購達人與性別有關”犯錯誤的概率不超過5%,即P的值為5%.6.解析 (1)由題中頻率直方圖可得A學科良好的人數為100×(0.040+0.025+0.005)×10=70,所以補充完整的2×2列聯表如下:B學科良好 B學科不夠良好 合計A學科良好 40 30 70A學科不夠良好 10 20 30合計 50 50 100提出假設H0:A學科良好與B學科良好無關,易得χ2=≈4.8,因為當H0成立時, χ2≥3.841的概率約為0.05,因此我們有95%的把握認為H0不成立,即有95%的把握認為這次考試學生的A學科良好與B學科良好有關.(2)由題知A,B學科均良好的概率約為,X的可能取值為0,1,2,3,且X~B.所以P(X=0)=,P(X=1)=,P(X=2)=,P(X=3)=.所以X的概率分布為X 0 1 2 3P因為X~B.7.解析 (1)從該校學生中隨機選出1人,記其達標為事件A,是“閱讀之星”為事件B.則P(A)=P(X≥1),P(B)=P(AB)=P(X≥2).因為X~N(1.5,σ2),所以P(B)=1-P(A).又達標學生是“閱讀之星”的概率為,所以P(B|A)=,即從該校學生中隨機選出1人,達標的概率為.(2)依題意,隨機調查的90名學生中,男生人數為40,女生人數為50.設這90名學生中,不達標的學生人數為Y.由(1)知,不達標的概率為.所以數學期望E(Y)=90×=18,即不達標的人數為18.因為不達標的學生中有是男生,所以不達標的男生人數為3,不達標的女生人數為15.則達標的男生人數為37,達標的女生人數為35,得如下2×2列聯表.男生 女生 合計達標 37 35 72不達標 3 15 18合計 40 50 90所以χ2==7.031 25>6.635.因為P(χ2≥6.635)≈0.010,所以有99%的把握認為不達標與性別有關.8.解析 (1)提出假設H0:網民選擇在甲、乙直播間內購買大米與網民所處地區無關,經計算得χ2=≈9.091>7.879,因為當H0成立時, χ2≥7.879的概率約為0.005,所以我們有99.5%的把握認為網民選擇在甲、乙直播間內購買大米與網民所處地區有關.(2)利用樣本的頻率分布估計總體的概率分布,可知網民選擇在甲直播間內購買大米的概率為,則X~B,則P(X=k)=pk(1-p)n-k(k=0,1,2,…,100 000),則問題等價于求當k取何值時,P(X=k)=pk(1-p)n-k取最大值,當k≥1時,,又(n+1)p=100 001×=80 000.8,所以當k<(n+1)p=80 000.8時,P(X=k)>P(X=k-1);當k=(n+1)p=80 000.8時,P(X=k)=P(X=k-1);當k>(n+1)p=80 000.8時,P(X=k)所以P(X=80 000)>P(X=79 999)>…>P(X=1),且P(X=100 000)<…所以當X=80 000時,P(X=k)取最大值,即事件“X=k”的概率取最大值時k的值為80 000.5 展開更多...... 收起↑ 資源列表 9.2 獨立性檢驗.docx 9_2 獨立性檢驗.ppt 縮略圖、資源來源于二一教育資源庫