資源簡介 中小學教育資源及組卷應用平臺第2課時 列聯表與獨立性檢驗課標解讀 考向預測1.通過實例,理解2×2列聯表的統計意義. 2.通過實例,了解2×2列聯表獨立性檢驗及其應用. 預計2025年高考列聯表、獨立性檢驗可能會以實際問題為背景,與概率、隨機變量的分布列及數字特征相結合命題,難度適中.【知識梳理】1.分類變量:變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.2.2×2列聯表一般地,假設有兩個分類變量X和Y,它們的取值均為0,1,其2×2列聯表為X Y 合計Y=0 Y=1X=0 a b a+bX=1 c d c+d合計 a+c b+d a+b+c+d3.獨立性檢驗(1)零假設:以Ω為樣本空間的古典概型,設X和Y為定義在Ω上,取值于{0,1}的成對分類變量,H0:P(Y=1|X=0)=P(Y=1|X=1).通常稱H0為零假設或原假設.(2)χ2的計算公式:記n=a+b+c+d,則χ2=.(3)臨界值:對于任何小概率值α,可以找到相應的正實數xα,使得后面關系成立:P(χ2≥xα)=α.我們稱xα為α的臨界值,這個臨界值就可以作為判斷χ2大小的標準,概率值α越小,臨界值xα越大.(4)基于小概率值α的檢驗規則是:當χ2≥xα時,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α;當χ2<xα時,我們沒有充分證據推斷H0不成立,可以認為X和Y獨立.(5)應用獨立性檢驗解決實際問題的主要環節①提出零假設H0:X和Y相互獨立,并給出在問題中的解釋;②根據抽樣數據整理出2×2列聯表,計算χ2的值,并與臨界值xα比較;③根據檢驗規則得出推斷結論;④在X和Y不獨立的情況下,根據需要,通過比較相應的頻率,分析X和Y間的影響規律.【常用結論】根據χ2的值可以判斷兩個分類變量有關的可信程度,若χ2越大,則認為兩分類變量有關的把握越大.【診斷自測】1.概念辨析(正確的打“√”,錯誤的打“×”)(1)分類變量中的變量與函數中的變量是同一概念.( )(2)2×2列聯表是借助兩個分類變量之間頻率大小差異說明兩個變量之間是否有關聯.( )(3)應用獨立性檢驗的基本思想對兩個變量間的關系作出的推斷一定是正確的.( )(4)若分類變量X,Y關系越密切,則由觀測數據計算得到的χ2的觀測值越小.( )2.小題熱身(1)(人教B選擇性必修第二冊4.3.2練習A T2改編)為了解某大學的學生是否愛好體育鍛煉,用簡單隨機抽樣方法在校園內調查了120位學生,得到如下2×2列聯表:男 女 合計愛好 a b 73不愛好 c 25合計 74則a-b-c=( )A.7 B.8C.9 D.10(2)在下列兩個分類變量X,Y的樣本頻數列聯表中,可以判斷X,Y之間有無關系的是( )y1 y2 合計x1 a b a+bx2 c d c+d合計 a+c b+d a+b+c+dA. B.C. D.(3)已知P(χ2≥6.635)=0.01,P(χ2≥10.828)=0.001.在檢驗喜歡某項體育運動與性別是否有關的過程中,某研究員搜集數據并計算得到χ2=7.235,則根據小概率值α=________的χ2獨立性檢驗,分析喜歡該項體育運動與性別有關.【考點探究】考點一 分類變量的兩種統計表示形式(多考向探究)考向1 等高堆積條形圖例1 (2023·四川南充三診)為考查A,B兩種藥物預防某疾病的效果,進行動物實驗,分別得到如下等高堆積條形圖,根據圖中信息,下列說法最佳的是( )A.藥物B的預防效果優于藥物A的預防效果B.藥物A的預防效果優于藥物B的預防效果C.藥物A,B對該疾病均有顯著的預防效果D.藥物A,B對該疾病均沒有預防效果【通性通法】在等高堆積條形圖中,與相差越大,我們認為兩個分類變量之間關系越強.【鞏固遷移】1.(多選)現行普通高中學生在高一時面臨著選科的問題,學校抽取了部分男、女學生意愿的一份樣本,制作出如下兩個等高堆積條形圖:根據這兩幅圖中的信息,下列統計結論正確的是( )A.樣本中的女生數量多于男生數量B.樣本中有兩理一文意愿的學生數量多于有兩文一理意愿的學生數量C.樣本中的男生偏愛兩理一文D.樣本中的女生偏愛兩文一理考向2 2×2列聯表例2 (1)下面是一個2×2列聯表,則表中a,c處的值分別為( )X Y 合計y1 y2x1 a 25 73x2 21 b c合計 d 49A.98,28 B.28,98C.48,45 D.45,48(2)假設兩個分類變量X和Y的2×2列聯表如下:X Y 合計y1 y2x1 a 10 a+10x2 c 30 c+30合計 a+c 40 100對于同一樣本,以下數據能說明X和Y有關系的可能性最大的一組是( )A.a=40,c=20 B.a=45,c=15C.a=35,c=25 D.a=30,c=30【通性通法】在2×2列聯表中,如果兩個變量沒有關系,則應滿足ad-bc≈0.|ad-bc|越小,說明兩個變量之間關系越弱;|ad-bc|越大,說明兩個變量之間關系越強.【鞏固遷移】2.(多選)有甲、乙兩個班級進行數學考試,按照大于等于85分為優秀,85分以下為非優秀,得到列聯表如下:班級 數學成績優秀 非優秀 合計甲班 10 b乙班 c 30合計 105已知在全部105人中隨機抽取1人,成績優秀的概率為,則下列說法正確的是( )A.c=30,b=35B.c=15,b=50C.c=20,b=45D.由列聯表可看出數學成績與班級有關系考點二 獨立性檢驗的應用例3 (2024·山西太原模擬)為進一步保護環境,加強治理空氣污染,某市環保監測部門對市區空氣質量進行調研,隨機抽查了市區100天的空氣質量等級與當天空氣中SO2的濃度(單位:μg/m3),整理數據得到下表:SO2的濃度 空氣質量等級 [0,50] (50,150] (150,475]1(優) 28 6 22(良) 5 7 83(輕度污染) 3 8 94(中度污染) 1 12 11若某天的空氣質量等級為1或2,則稱這天“空氣質量好”;若某天的空氣質量等級為3或4,則稱這天“空氣質量不好”,根據上述數據,回答以下問題:(1)估計事件“該市一天的空氣質量好,且SO2的濃度不超過150”的概率;(2)完成下面的2×2列聯表;SO2的濃度 空氣質量 [0,150] (150,475] 合計空氣質量好空氣質量不好合計(3)根據(2)中的列聯表,依據小概率值α=0.01的獨立性檢驗,能否據此推斷該市一天的空氣質量與當天SO2的濃度有關?【通性通法】獨立性檢驗的一般步驟(1)根據樣本數據制成2×2列聯表;(2)根據公式χ2=計算;(3)比較χ2與臨界值的大小關系,作統計推斷.【鞏固遷移】3.(2022·全國甲卷)甲、乙兩城之間的長途客車均由A和B兩家公司運營,為了解這兩家公司長途客車的運行情況,隨機調查了甲、乙兩城之間的500個班次,得到下面列聯表:準點班次數 未準點班次數A 240 20B 210 30(1)根據上表,分別估計這兩家公司甲、乙兩城之間的長途客車準點的概率;(2)能否有90%的把握認為甲、乙兩城之間的長途客車是否準點與客車所屬公司有關?附:χ2=,α 0.100 0.050 0.010xα 2.706 3.841 6.63521世紀教育網 www.21cnjy.com 精品試卷·第 2 頁 (共 2 頁)21世紀教育網(www.21cnjy.com)中小學教育資源及組卷應用平臺第2課時 列聯表與獨立性檢驗課標解讀 考向預測1.通過實例,理解2×2列聯表的統計意義. 2.通過實例,了解2×2列聯表獨立性檢驗及其應用. 預計2025年高考列聯表、獨立性檢驗可能會以實際問題為背景,與概率、隨機變量的分布列及數字特征相結合命題,難度適中.【知識梳理】1.分類變量:變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.2.2×2列聯表一般地,假設有兩個分類變量X和Y,它們的取值均為0,1,其2×2列聯表為X Y 合計Y=0 Y=1X=0 a b a+bX=1 c d c+d合計 a+c b+d a+b+c+d3.獨立性檢驗(1)零假設:以Ω為樣本空間的古典概型,設X和Y為定義在Ω上,取值于{0,1}的成對分類變量,H0:P(Y=1|X=0)=P(Y=1|X=1).通常稱H0為零假設或原假設.(2)χ2的計算公式:記n=a+b+c+d,則χ2=.(3)臨界值:對于任何小概率值α,可以找到相應的正實數xα,使得后面關系成立:P(χ2≥xα)=α.我們稱xα為α的臨界值,這個臨界值就可以作為判斷χ2大小的標準,概率值α越小,臨界值xα越大.(4)基于小概率值α的檢驗規則是:當χ2≥xα時,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α;當χ2<xα時,我們沒有充分證據推斷H0不成立,可以認為X和Y獨立.(5)應用獨立性檢驗解決實際問題的主要環節①提出零假設H0:X和Y相互獨立,并給出在問題中的解釋;②根據抽樣數據整理出2×2列聯表,計算χ2的值,并與臨界值xα比較;③根據檢驗規則得出推斷結論;④在X和Y不獨立的情況下,根據需要,通過比較相應的頻率,分析X和Y間的影響規律.【常用結論】根據χ2的值可以判斷兩個分類變量有關的可信程度,若χ2越大,則認為兩分類變量有關的把握越大.【診斷自測】1.概念辨析(正確的打“√”,錯誤的打“×”)(1)分類變量中的變量與函數中的變量是同一概念.( )(2)2×2列聯表是借助兩個分類變量之間頻率大小差異說明兩個變量之間是否有關聯.( )(3)應用獨立性檢驗的基本思想對兩個變量間的關系作出的推斷一定是正確的.( )(4)若分類變量X,Y關系越密切,則由觀測數據計算得到的χ2的觀測值越小.( )答案 (1)× (2)√ (3)× (4)×2.小題熱身(1)(人教B選擇性必修第二冊4.3.2練習A T2改編)為了解某大學的學生是否愛好體育鍛煉,用簡單隨機抽樣方法在校園內調查了120位學生,得到如下2×2列聯表:男 女 合計愛好 a b 73不愛好 c 25合計 74則a-b-c=( )A.7 B.8C.9 D.10答案 C解析 根據題意,可得c=120-73-25=22,a=74-22=52,b=73-52=21,∴a-b-c=52-21-22=9.(2)在下列兩個分類變量X,Y的樣本頻數列聯表中,可以判斷X,Y之間有無關系的是( )y1 y2 合計x1 a b a+bx2 c d c+d合計 a+c b+d a+b+c+dA. B.C. D.答案 D解析 ∵χ2=,則分類變量X和Y有關系時,ad與bc差距會比較大,由-==,故與的值相差應該大,即的大小可以判斷X,Y之間有無關系.(3)已知P(χ2≥6.635)=0.01,P(χ2≥10.828)=0.001.在檢驗喜歡某項體育運動與性別是否有關的過程中,某研究員搜集數據并計算得到χ2=7.235,則根據小概率值α=________的χ2獨立性檢驗,分析喜歡該項體育運動與性別有關.答案 0.01解析 因為6.635<7.235<10.828,所以根據小概率值α=0.01的χ2獨立性檢驗,分析喜歡該項體育運動與性別有關.【考點探究】考點一 分類變量的兩種統計表示形式(多考向探究)考向1 等高堆積條形圖例1 (2023·四川南充三診)為考查A,B兩種藥物預防某疾病的效果,進行動物實驗,分別得到如下等高堆積條形圖,根據圖中信息,下列說法最佳的是( )A.藥物B的預防效果優于藥物A的預防效果B.藥物A的預防效果優于藥物B的預防效果C.藥物A,B對該疾病均有顯著的預防效果D.藥物A,B對該疾病均沒有預防效果答案 B解析 根據題干中兩個等高堆積條形圖知,藥物A實驗顯示不服藥與服藥時患病差異較藥物B實驗顯示明顯,所以藥物A的預防效果優于藥物B的預防效果.【通性通法】在等高堆積條形圖中,與相差越大,我們認為兩個分類變量之間關系越強.【鞏固遷移】1.(多選)現行普通高中學生在高一時面臨著選科的問題,學校抽取了部分男、女學生意愿的一份樣本,制作出如下兩個等高堆積條形圖:根據這兩幅圖中的信息,下列統計結論正確的是( )A.樣本中的女生數量多于男生數量B.樣本中有兩理一文意愿的學生數量多于有兩文一理意愿的學生數量C.樣本中的男生偏愛兩理一文D.樣本中的女生偏愛兩文一理答案 ABC解析 由等高堆積條形圖知,女生數量多于男生數量,故A正確;有兩理一文意愿的學生數量多于有兩文一理意愿的學生數量,故B正確;男生偏愛兩理一文,故C正確;女生中有兩理一文意愿的學生數量多于有兩文一理意愿的學生數量,故D錯誤.故選ABC.考向2 2×2列聯表例2 (1)下面是一個2×2列聯表,則表中a,c處的值分別為( )X Y 合計y1 y2x1 a 25 73x2 21 b c合計 d 49A.98,28 B.28,98C.48,45 D.45,48答案 C解析 由2×2列聯表知a+25=73,b+25=49,b+21=c,解得a=48,b=24,c=45.故選C.(2)假設兩個分類變量X和Y的2×2列聯表如下:X Y 合計y1 y2x1 a 10 a+10x2 c 30 c+30合計 a+c 40 100對于同一樣本,以下數據能說明X和Y有關系的可能性最大的一組是( )A.a=40,c=20 B.a=45,c=15C.a=35,c=25 D.a=30,c=30答案 B解析 χ2==n·,根據2×2列聯表和獨立性檢驗的相關知識,知當b,d一定時,a,c相差越大,與相差就越大,χ2就越大,即X和Y有關系的可能性越大,結合選項,知B中a-c=30與其他選項相比相差最大.【通性通法】在2×2列聯表中,如果兩個變量沒有關系,則應滿足ad-bc≈0.|ad-bc|越小,說明兩個變量之間關系越弱;|ad-bc|越大,說明兩個變量之間關系越強.【鞏固遷移】2.(多選)有甲、乙兩個班級進行數學考試,按照大于等于85分為優秀,85分以下為非優秀,得到列聯表如下:班級 數學成績優秀 非優秀 合計甲班 10 b乙班 c 30合計 105已知在全部105人中隨機抽取1人,成績優秀的概率為,則下列說法正確的是( )A.c=30,b=35B.c=15,b=50C.c=20,b=45D.由列聯表可看出數學成績與班級有關系答案 CD解析 依題意=,解得c=20,由10+20+b+30=105,解得b=45.補全2×2列聯表如下:班級 數學成績 合計優秀 非優秀甲班 10 45 55乙班 20 30 50合計 30 75 105甲班學生數學成績的優秀率為≈0.182,乙班學生數學成績的優秀率為=0.4,乙班學生數學成績的優秀率明顯高于甲班學生數學成績的優秀率,可以認為兩班學生的數學成績優秀率存在差異,所以數學成績與班級有關.故選CD.考點二 獨立性檢驗的應用例3 (2024·山西太原模擬)為進一步保護環境,加強治理空氣污染,某市環保監測部門對市區空氣質量進行調研,隨機抽查了市區100天的空氣質量等級與當天空氣中SO2的濃度(單位:μg/m3),整理數據得到下表:SO2的濃度 空氣質量等級 [0,50] (50,150] (150,475]1(優) 28 6 22(良) 5 7 83(輕度污染) 3 8 94(中度污染) 1 12 11若某天的空氣質量等級為1或2,則稱這天“空氣質量好”;若某天的空氣質量等級為3或4,則稱這天“空氣質量不好”,根據上述數據,回答以下問題:(1)估計事件“該市一天的空氣質量好,且SO2的濃度不超過150”的概率;(2)完成下面的2×2列聯表;SO2的濃度 空氣質量 [0,150] (150,475] 合計空氣質量好空氣質量不好合計(3)根據(2)中的列聯表,依據小概率值α=0.01的獨立性檢驗,能否據此推斷該市一天的空氣質量與當天SO2的濃度有關?解 (1)由表格可知,該市一天的空氣質量好,且SO2的濃度不超過150的天數為28+6+5+7=46,則“該市一天的空氣質量好,且SO2的濃度不超過150”的概率P==0.46.(2)由表格數據可得列聯表如下,SO2的濃度 空氣質量 [0,150] (150,475] 合計空氣質量好 46 10 56空氣質量不好 24 20 44合計 70 30 100(3)零假設為H0:該市一天的空氣質量與當天SO2的濃度無關.由(2)知χ2=≈8.936>6.635=x0.01,根據小概率值α=0.01的獨立性檢驗,我們推斷H0不成立,即認為該市一天的空氣質量與當天SO2的濃度有關,此推斷犯錯誤的概率不超過0.01.【通性通法】獨立性檢驗的一般步驟(1)根據樣本數據制成2×2列聯表;(2)根據公式χ2=計算;(3)比較χ2與臨界值的大小關系,作統計推斷.【鞏固遷移】3.(2022·全國甲卷)甲、乙兩城之間的長途客車均由A和B兩家公司運營,為了解這兩家公司長途客車的運行情況,隨機調查了甲、乙兩城之間的500個班次,得到下面列聯表:準點班次數 未準點班次數A 240 20B 210 30(1)根據上表,分別估計這兩家公司甲、乙兩城之間的長途客車準點的概率;(2)能否有90%的把握認為甲、乙兩城之間的長途客車是否準點與客車所屬公司有關?附:χ2=,α 0.100 0.050 0.010xα 2.706 3.841 6.635解 (1)根據表中數據,A家公司共有班次260次,其中準點班次有240次,設A家公司長途客車準點事件為M,則P(M)==;B家公司共有班次240次,其中準點班次有210次,設B家公司長途客車準點事件為N,則P(N)==.故A家公司長途客車準點的概率為,B家公司長途客車準點的概率為.(2)由題可得χ2=≈3.205>2.706,根據臨界值表可知,有90%的把握認為甲、乙兩城之間的長途客車是否準點與客車所屬公司有關.21世紀教育網 www.21cnjy.com 精品試卷·第 2 頁 (共 2 頁)21世紀教育網(www.21cnjy.com) 展開更多...... 收起↑ 資源列表 第3節 第2課時 列聯表與獨立性檢驗(原卷版).docx 第3節 第2課時 列聯表與獨立性檢驗(解析版).doc 縮略圖、資源來源于二一教育資源庫