資源簡介 §8.3 列聯表與獨立性檢驗[學習目標] 1.理解獨立性檢驗的基本思想及其實施步驟.2.能利用等高堆積條形圖、2×2列聯表探討兩個分類變量的關聯.3.了解隨機變量χ2的含義及作用.4.通過對數據的處理,提高解決實際問題的能力.一、分類變量與列聯表知識梳理數值變量:數值變量的取值為________,其大小和運算都有實際含義.分類變量:這里所說的變量和值不一定是具體的數值,例如:性別變量,其取值為男和女兩種,我們經常會使用一種特殊的隨機變量,以區別不同的現象或性質,這類隨機變量稱為______________,分類變量的取值可以用________表示.問題1 為調查吸煙是否對患肺癌有影響,某腫瘤研究所隨機地調查了9 965人,其中,不吸煙的7 817人中有42人患肺癌,吸煙的2 148人中有49人患肺癌,試分析吸煙是否對患肺癌有影響.我們在研究“吸煙與患肺癌的關系”時,需要關注哪一些量呢?并填表說明.吸煙 肺癌 合計不患肺癌者 患肺癌者不吸煙者 42 7 817吸煙者 49 2 148合計 9 965(1)在不吸煙者中患肺癌的比例為_______________________________________________;(2)在吸煙者中患肺癌的比例為________.知識梳理2×2列聯表定義一對分類變量X和Y,我們整理數據如表所示:X Y 合計Y=0 Y=1X=0 a b a+bX=1 c d c+d合計 a+c b+d n=a+b+c+d上表是關于分類變量X和Y的抽樣數據的2×2列聯表:最后一行的前兩個數分別是事件{Y=0}和{Y=1}的 ;最后一列的前兩個數分別是事件{X=0}和{X=1}的________;中間的四個數a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的______;右下角格中的數n是______________.例1 在研究某種藥物對“H1N1”病毒的治療效果時,進行了動物試驗,得到以下數據:對150只動物進行藥物治療,其中132只動物存活,18只動物死亡,對150只動物進行常規治療,其中114只動物存活,36只動物死亡.請根據以上數據建立一個2×2列聯表.反思感悟 作2×2列聯表時,關鍵是對涉及的變量分清類別.計算時要準確無誤.跟蹤訓練1 為了解對某班學生經常打籃球和性別是否有關,對該班40名學生進行了問卷調查,得到如下的2×2列聯表.性別 打籃球 合計經常 不經常男生 m 4 20女生 8 20合計 n 40則m=________,n=________.二、等高堆積條形圖的應用問題2 問題1中“為調查吸煙是否對患肺癌有影響”,我們還能夠從圖形中得到吸煙與患肺癌之間的關系嗎?知識梳理1.等高堆積條形圖和表格相比,更能直觀地反映出兩個分類變量間是否相互影響,常用等高堆積條形圖展示列聯表數據的頻率特征,依據頻率穩定于概率的原理,我們可以推斷結果.2.觀察等高堆積條形圖發現與相差很大,就判斷兩個分類變量之間有關系.例2 為了解鉛中毒與尿棕色素為陽性是否有關系,分別對病人組和對照組的尿液作尿棕色素定性檢查,結果如表所示.組別 尿棕色素 合計陽性數 陰性數鉛中毒病人組 29 7 36對照組 9 28 37合計 38 35 73試畫出列聯表的等高堆積條形圖,分析鉛中毒病人組和對照組的尿棕色素陽性數有無差別,鉛中毒與尿棕色素為陽性是否有關系.反思感悟 利用等高堆積條形圖判斷兩個分類變量是否有關聯的步驟(1)收集數據,統計結果.(2)列出2×2列聯表,計算頻率粗略估計.(3)畫等高堆積條形圖,直觀分析.跟蹤訓練2 當某礦石粉廠生產一種礦石粉時,在數天內就有部分工人患職業性皮膚炎,在生產季節期間,隨機抽取車間工人抽血化驗,75名穿新防護服的工人中5例陽性,70例陰性,28名穿舊防護服的車間工人中10例陽性,18例陰性,請用等高堆積條形圖判斷這種新防護服對預防工人職業性皮膚炎是否有效.(注:顯陰性即未患皮膚炎)三、獨立性檢驗的綜合應用問題3 由2×2列聯表,如何假設事件{X=1}和{Y=1}之間的關系?X Y 合計Y=0 Y=1X=0 a b a+bX=1 c d c+d合計 a+c b+d n=a+b+c+d問題4 假若分類變量X與Y沒有關聯,則X=1與Y=1、 X=0與Y=1、 X=0與Y=0、 X=1與Y=0有什么關系?知識梳理1.獨立性檢驗:利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ2獨立性檢驗,讀作“________________________”,簡稱________________.2.χ2=________________________________________________________________________,其中n=a+b+c+d.例3 (1)有關研究表明,正確佩戴安全頭盔,規范使用安全帶能夠將交通事故死亡風險大幅降低,對保護群眾生命安全具有重要作用.某市針對電動自行車騎乘人員是否佩戴安全頭盔問題進行調查,在隨機調查的1 000名騎行人員中,年齡低于40歲的占60%,記錄其年齡和是否佩戴頭盔情況,得到2×2列聯表如表所示.年齡 頭盔 合計佩戴 未佩戴低于40歲 540不低于40歲合計 880 1 000①完成上面的列聯表;②依據小概率值α=0.01的獨立性檢驗,能否認為遵守佩戴安全頭盔與年齡有關?附:χ2=,其中n=a+b+c+d.α 0.050 0.010 0.001xα 3.841 6.635 10.828(2)為了了解少年兒童的肥胖是否與常喝碳酸飲料有關,現對30名六年級學生進行了問卷調查,得到如下列聯表.肥胖 碳酸飲料 合計常喝 不常喝肥胖者 2不肥胖者 18合計 30已知從這30名學生中隨機抽取1人,抽到肥胖學生的概率為.①請將上面的列聯表補充完整;②依據小概率值α=0.005的獨立性檢驗,能否認為肥胖與常喝碳酸飲料有關?附:χ2=,其中n=a+b+c+d.α 0.100 0.050 0.010 0.005xα 2.706 3.841 6.635 7.879反思感悟 運用獨立性檢驗的方法(1)列出2×2列聯表,根據公式計算χ2.(2)比較χ2與xα的大小作出結論.跟蹤訓練3 (1)為了有針對性地提高學生體育鍛煉的積極性,某校需要了解學生是否經常鍛煉與性別因素是否有關,為此隨機對該校100名學生進行問卷調查,得到如下列聯表.性別 鍛煉 合計經常 不經常男生 35女生 25合計 100已知從這100名學生中任選1人,經常鍛煉的學生被選中的概率為.①完成上面的列聯表;②依據小概率值α=0.1的獨立性檢驗,能否認為該校學生是否經常鍛煉與性別因素有關?附:χ2=,其中n=a+b+c+d.α 0.1 0.05 0.01 0.001xα 2.706 3.841 6.635 10.828(2)某省進行高中新課程改革,為了解教師對新課程教學模式的使用情況,某教育機構對某學校的教師關于新課程教學模式的使用情況進行了問卷調查,共調查了50人,其中有老教師20人,青年教師30人.老教師對新課程教學模式贊同的有10人,不贊同的有10人;青年教師對新課程教學模式贊同的有24人,不贊同的有6人.①根據以上數據建立一個2×2列聯表;②試根據小概率值α=0.01的獨立性檢驗,分析對新課程教學模式的贊同情況與教師年齡是否有關系.附表:α 0.05 0.01 0.005xα 3.841 6.635 7.8791.知識清單:(1)分類變量.(2)2×2列聯表,等高堆積條形圖.(3)獨立性檢驗、χ2公式.2.方法歸納:數形結合.3.常見誤區:對獨立性檢驗的原理不理解,導致不會用χ2分析問題.1.對兩個分類變量A,B,下列說法中正確的個數為( )①A與B無關,即A與B互不影響;②A與B關系越密切,則χ2的值就越大;③χ2的大小是判定A與B是否相關的唯一依據.A.0 B.1C.2 D.32.(多選)如圖是調查某地區男、女中學生對數學的態度的等高堆積條形圖,陰影部分表示喜歡數學的百分比,從圖可以看出( )A.性別與喜歡數學無關B.女生中喜歡數學的百分比約為80%C.男生比女生喜歡數學的可能性大D.男生中不喜歡數學的百分比約為40%3.考察棉花種子經過處理與生病之間的關系,得到如表中的數據:生病 棉花種子 合計處理 未處理得病 32 101 133不得病 61 213 274合計 93 314 407依據小概率值α=0.1的獨立性檢驗,根據以上數據可得出( )A.種子經過處理與生病有關B.種子經過處理與生病無關C.種子經過處理決定生病D.種子經過處理與生病有關的犯錯誤的概率不超過0.14.某次國際會議為了搞好對外宣傳工作,會務組選聘了50名記者擔任對外翻譯工作,在如表所示的2×2列聯表中,d=________.性別 外語 合計會 不會男 a b 20女 6 d合計 18 50§8.3 列聯表與獨立性檢驗知識梳理實數 分類變量 實數問題1 吸煙患肺癌的人數;不吸煙患肺癌的人數;吸煙不患肺癌的人數;不吸煙不患肺癌的人數.吸煙 肺癌 合計不患肺癌者 患肺癌者不吸煙者 7 775 42 7 817吸煙者 2 099 49 2 148合計 9 874 91 9 965(1)0.54% (2)2.28%說明:吸煙者和不吸煙者患肺癌的可能性存在差異,吸煙者患肺癌的可能性大.知識梳理頻數 頻數 頻數 樣本容量例1 解 2×2列聯表如表所示:治療方法 治療效果 合計存活 死亡藥物治療 132 18 150常規治療 114 36 150合計 246 54 300跟蹤訓練1 16 16解析 依題意可得列聯表如下.性別 打籃球 合計經常 不經常男生 16 4 20女生 8 12 20合計 24 16 40故m=n=16.問題2 從圖形中可得出吸煙者患肺癌的可能性大.例2 解 等高堆積條形圖如圖所示.其中兩個淺色條的高分別代表鉛中毒病人組和對照組樣本中尿棕色素為陽性的頻率.由圖可以直觀地看出鉛中毒病人組與對照組的尿棕色素為陽性的頻率差異明顯,因此鉛中毒與尿棕色素為陽性有關系.跟蹤訓練2 解 2×2列聯表如表所示.防護服 皮膚炎 合計陽性例數 陰性例數穿新防護服 5 70 75穿舊防護服 10 18 28合計 15 88 103相應的等高堆積條形圖如圖所示.圖中兩個深色的高分別表示穿新、舊防護服樣本中呈陽性的頻率,從圖中可以看出,穿舊防護服呈陽性的頻率高于穿新防護服呈陽性的頻率.因此,可以認為新防護服對預防這種皮膚炎有效.問題3 假設H0表示{X=1}和{Y=1}沒有關系(通常稱H0為零假設).問題4 相互獨立.知識梳理1.卡方獨立性檢驗 獨立性檢驗2.例3 (1)解 ①年齡低于40歲的有1000×60%=600(人),完成2×2列聯表如表所示.年齡 頭盔 合計佩戴 未佩戴低于40歲 540 60 600不低于40歲 340 60 400合計 880 120 1 000②零假設為H0:遵守佩戴安全頭盔與年齡無關,由公式得χ2==≈5.682<6.635=x0.01,∴根據小概率值α=0.01的獨立性檢驗,沒有充分證據推斷H0不成立,因此可以認為H0成立,即認為遵守佩戴安全頭盔與年齡無關.(2)解 ①因為從這30名學生中隨機抽取1人,抽到肥胖學生的概率為,所以這30名學生中,肥胖學生的人數為30×=8,完善2×2列聯表如表所示.肥胖 碳酸飲料 合計常喝 不常喝肥胖者 6 2 8不肥胖者 4 18 22合計 10 20 30②零假設為H0:肥胖與常喝碳酸飲料無關,由公式得χ2=≈8.523>7.879=x0.005,依據小概率值α=0.005的獨立性檢驗,推斷H0不成立,即認為肥胖與常喝碳酸飲料有關.跟蹤訓練3 (1)解 ①設這100名學生中經常鍛煉的學生有x人,則=,解得x=50.列聯表完成如下.性別 鍛煉 合計經常 不經常男生 35 25 60女生 15 25 40合計 50 50 100②零假設為H0:該校學生是否經常鍛煉與性別因素無關.由①可知,χ2=≈4.167>2.706=x0.1,根據小概率值α=0.1的獨立性檢驗,我們推斷H0不成立,即該校學生是否經常鍛煉與性別因素有關.(2)解 ①2×2列聯表如表所示:教師年齡 對新課程教學模式 合計贊同 不贊同老教師 10 10 20青年教師 24 6 30合計 34 16 50②零假設為H0:對新課程教學模式的贊同情況與教師年齡無關.由公式得χ2=≈4.963<6.635=x0.01,根據小概率值α=0.01的獨立性檢驗,沒有充分證據推斷H0不成立,因此可以認為H0成立,即認為對新課程教學模式的贊同情況與教師年齡無關.隨堂演練1.B [①正確,A與B無關即A與B相互獨立;②不正確,χ2的值的大小只是用來檢驗A與B是否相互獨立;③不正確,例如借助三維柱形圖、二維條形圖等.]2.CD [由題圖知女生中喜歡數學的百分比約為20%,男生中不喜歡數學的百分比約為40%,男生比女生喜歡數學的可能性大,故A,B不正確,C,D正確.]3.B [χ2=≈0.164<2.706=x0.1,依據小概率值α=0.1的獨立性檢驗,認為種子經過處理與生病無關.]4.24解析 由題意得所以a=12,b=8,d=24. 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫