資源簡介 8.3 列聯表與獨立性檢驗(強基課梯度進階式教學)課時目標通過實例,理解2×2列聯表的統計意義;通過實例,了解獨立性檢驗及其應用. 1.分類變量與列聯表(1)分類變量用以區別不同的 或 的一種特殊的隨機變量,稱為分類變量.分類變量的取值可以用實數表示,例如,學生所在的班級可以用1,2,3等表示,男性、女性可以用1,0表示,等等. (2)2×2列聯表組別 甲(Y=0) 乙(Y=1) 合計A(X=0) a b B(X=1) c d 合計 這種形式的數據統計表稱為2×2列聯表.2×2列聯表給出了成對分類變量數據的交叉分類頻數.(3)等高堆積條形圖:將列聯表中的數據用高度相同的兩個條形圖表示出來,其中兩列的數據分別對應不同的顏色,這就是等高堆積條形圖.等高堆積條形圖可以展示列聯表數據的頻率特征,能夠直觀地反映出兩個分類變量間是否相互影響.2.獨立性檢驗(1)分類變量X和Y獨立:如果下面這些性質成立,{X=0}與{Y=0}獨立;{X=0}與{Y=1}獨立;{X=1}與{Y=0}獨立;{X=1}與{Y=1}獨立.我們就稱分類變量X和Y獨立.(2)獨立性檢驗①小概率值α的臨界值:忽略χ2的實際分布與該近似分布的誤差后,對于任何小概率值α,可以找到相應的正實數xα,使得P(χ2≥xα)=α,我們稱xα為α的臨界值,這個臨界值可作為判斷χ2大小的標準.概率值α越小,臨界值xα越大.②χ2的計算公式:χ2=.③獨立性檢驗:利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ2獨立性檢驗,讀作“卡方獨立性檢驗”,簡稱獨立性檢驗.④基于小概率值α的檢驗規則是:當χ2≥xα時,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α;當χ2⑤應用獨立性檢驗解決實際問題大致應包括的主要環節:(ⅰ)提出零假設H0:X和Y相互獨立,并給出在問題中的解釋.(ⅱ)根據抽樣數據整理出2×2列聯表,計算χ2的值,并與臨界值xα比較.(ⅲ)根據檢驗規則得出推斷結論.(ⅳ)在X和Y不獨立的情況下,根據需要,通過比較相應的頻率,分析X和Y間的影響規律.⑥獨立性檢驗中幾個常用的小概率值和相應的臨界值:α 0.1 0.05 0.01 0.005 0.001xα 2.706 3.841 6.635 7.879 10.828微點助解獨立性檢驗的基本思想與反證法的思想的相似之處:反證法 獨立性檢驗要證明結論A 要確認“兩個分類變量有關系”在A不成立的前提下進行推理 假設該結論不成立,即假設“兩個分類變量沒有關系”成立,在該假設下計算χ2[基點訓練]1.某飛機在一次飛行航程中遭遇惡劣氣候,55名男乘客中有24名暈機,34名女乘客中有8名暈機,在檢驗這些乘客暈機是否與性別有關時,采用的數據分析方法應是 ( )A.頻率分布直方圖 B.回歸分析C.獨立性檢驗 D.用樣本估計總體2.如表是一個2×2列聯表,則表中a,b的值分別為 ( )y1 y2 合計x1 a 21 73x2 22 25 47合計 b 46 120A.94,72 B.52,50C.52,74 D.74,523.對于獨立性檢驗,下列說法正確的是 ( )A.χ2獨立性檢驗的統計假設是各事件之間相互獨立B.χ2可以為負值C.χ2獨立性檢驗顯示“患慢性氣管炎和吸煙習慣有關”,這就是指“有吸煙習慣的人必定會患慢性氣管炎”D.2×2列聯表中的4個數據可以是任意正數4.為研究某新藥的療效,給100名患者服用此藥,跟蹤調查后得下表中的數據:無效 有效 合計男性患者 15 35 50女性患者 6 44 50合計 21 79 100零假設為H0:服用此藥的效果與患者的性別無關,則χ2≈ ,從而得出結論:有 %的把握認為“服用此藥的效果與患者的性別有關”. 題型(一) 分類變量與列聯表[例1] 網絡對現代人的生活影響較大,尤其是對青少年,為了解網絡對中學生學習成績的影響,某地區教育主管部門從轄區初中生中隨機抽取了1 000人調查,發現其中經常上網的有200人,這200人中有80人期末考試不及格,而另外800人中有120人不及格.利用圖形判斷學生經常上網與學習成績有關嗎 聽課記錄:[思維建模]判斷兩個分類變量是否有關系的兩種常用方法(1)利用數形結合思想,借助等高堆積條形圖來判斷兩個分類變量是否相關是判斷變量是否相關的常見方法.(2)一般地,在等高堆積條形圖中,與相差越大,兩個分類變量有關系的可能性就越大. [針對訓練]1.某生產線上,質量監督員甲在生產現場時,990件產品中有合格品982件,次品8件;不在生產現場時,510件產品中有合格品493件,次品17件.試利用列聯表和等高堆積條形圖判斷監督員甲在不在生產現場對產品質量好壞有無影響.題型(二) 獨立性檢驗[例2] 近年來,短視頻作為以視頻為載體的聚合平臺,社交屬性愈發突出,在用戶生活中覆蓋面越來越廣泛,針對短視頻的碎片化缺陷,將短視頻剪接成長視頻勢必成為一種新的技能.某機構在網上隨機對1 000人進行了一次市場調研,以決策是否開發將短視頻剪接成長視頻的APP,得到如下數據:青年人 中年人 老年人對短視頻剪接成長視頻的APP有需求 2a+4b 200 a對短視頻剪接成長視頻的APP無需求 a+b 150 4b其中的數據為統計的人數,已知被調研的青年人數為400.(1)求a,b的值;(2)根據小概率值α=0.001的獨立性檢驗,分析對短視頻剪接成長視頻的APP的需求,青年人與中老年人是否有差異 參考公式:χ2=,其中n=a+b+c+d.臨界值表:α 0.1 0.05 0.01 0.005 0.001xα 2.706 3.841 6.635 7.879 10.828聽課記錄: [思維建模] 解決獨立性檢驗問題的基本步驟 [針對訓練]2.為了解大家對養寵物的看法,某單位對本單位450名員工(其中女職工有150人)進行了調查,發現女職工中支持養寵物的人數占,從男職工與女職工中各隨機選取一名,至少有一名職工支持養寵物的概率為.(1)求該單位男職工支持養寵物的人數,并填寫下列2×2列聯表;單位:人支持養寵物 不支持養寵物 合計男職工女職工合計 450(2)依據α=0.05的獨立性檢驗分析,該單位職工是否支持養寵物與性別是否有關.附: χ2=,n=a+b+c+d.α 0.10 0.05 0.010 0.001xα 2.706 3.841 6.635 10.8288.3 列聯表與獨立性檢驗 課前環節1.(1)現象 性質 (2)a+b c+d a+c b+d a+b+c+d[基點訓練]1.選C 根據題意,結合題目中的數據,列出2×2列聯表,求出χ2,對照數表可得出概率結論,這種分析數據的方法是獨立性檢驗.2.選C a=73-21=52,b=a+22=52+22=74.3.選A 由獨立性檢驗的檢驗步驟可知,A正確;因為2×2列聯表中的數據均為正整數,故χ2不可能為負值,排除B;因為χ2獨立性檢驗顯示“患慢性氣管炎和吸煙習慣有關”,是指有一定的把握說他們相關,或者說有一定的出錯率,故排除C;因為2×2列聯表中的4個數據是對于某組特定數據的統計數據,故四個數據間有一定的關系,故排除D.4.解析:由公式計算得χ2≈4.882.因為χ2>3.841=x0.05,所以我們有95%的把握認為服用此藥的效果與患者的性別有關.答案:4.882 95 課堂環節[題型(一)][例1] 解:根據題目所給的數據得到如下2×2列聯表:成績 上網 合計經常上網 不經常上網不及格 80 120 200及格 120 680 800合計 200 800 1 000得到等高堆積條形圖如圖所示:比較圖中陰影部分,可以發現經常上網期末考試不及格的頻率明顯高于經常上網期末考試及格的頻率,因此可以認為經常上網與學習成績有關.[針對訓練]1.解:根據題目所給數據得如下2×2列聯表:合格品數 次品數 合計甲在生產現場 982 8 990甲不在生產現場 493 17 510合計 1 475 25 1 500所以ad-bc=982×17-8×493=12 750,|ad-bc|比較大,說明甲在不在生產現場與產品質量好壞有關系.相應的等高堆積條形圖如圖所示:圖中兩個陰影部分的高分別表示甲在生產現場和甲不在生產現場時樣本中次品數的頻率.從圖中可以看出,甲不在生產現場時樣本中次品數的頻率明顯高于甲在生產現場時樣本中次品數的頻率.因此可以認為質量監督員甲在不在生產現場與產品質量好壞有關系.[題型(二)][例2] 解:(1)由題意得解得a=b=50.(2)零假設為H0:對短視頻剪接成長視頻APP的需求,青年人與中老年人沒有差異.由已知得,如下2×2列聯表:青年人 中老年人 合計對短視頻剪接成長視頻的APP有需求 300 250 550對短視頻剪接成長視頻的APP無需求 100 350 450合計 400 600 1 000可得χ2=≈107.744>10.828,根據小概率值α=0.001的獨立性檢驗,我們推斷H0不成立,所以對短視頻剪接成長視頻的APP的需求,青年人與中老年人有差異.[針對訓練]2.解:(1)設男職工支持養寵物的概率為p,由題意得1-(1-p)=,解得p=,又男職工有450-150=300(人),所以男職工中支持養寵物的人數為300×=75.女職工中支持養寵物的人數為150×=50.2×2列聯表如下:單位:人支持養寵物 不支持養寵物 合計男職工 75 225 300女職工 50 100 150合計 125 325 450(2)零假設H0:該單位職工是否支持養寵物與性別無關.由(1)中的2×2列聯表,得χ2=≈3.462<3.841=x0.05,依據α=0.05的獨立性檢驗分析,沒有充分證據推斷H0不成立,因此可以認為H0成立,即該單位職工是否支持養寵物與性別無關.4 / 4(共66張PPT)8.3 列聯表與獨立性檢驗(強基課——梯度進階式教學)課時目標通過實例,理解2×2列聯表的統計意義;通過實例,了解獨立性檢驗及其應用.CONTENTS目錄123課前環節/預知教材·自主落實主干基礎課堂環節/題點研究·遷移應用融會貫通課時跟蹤檢測課前環節/預知教材·自主落實主干基礎1.分類變量與列聯表(1)分類變量用以區別不同的______或______的一種特殊的隨機變量,稱為分類變量.分類變量的取值可以用實數表示,例如,學生所在的班級可以用1,2,3等表示,男性、女性可以用1,0表示,等等.現象性質(2)2×2列聯表組別 甲(Y=0) 乙(Y=1) 合計A(X=0) a b__________B(X=1) c d__________合計 __________ _______________________________________a+bc+da+cb+da+b+c+d這種形式的數據統計表稱為2×2列聯表.2×2列聯表給出了成對分類變量數據的交叉分類頻數.(3)等高堆積條形圖:將列聯表中的數據用高度相同的兩個條形圖表示出來,其中兩列的數據分別對應不同的顏色,這就是等高堆積條形圖.等高堆積條形圖可以展示列聯表數據的頻率特征,能夠直觀地反映出兩個分類變量間是否相互影響.2.獨立性檢驗(1)分類變量X和Y獨立:如果下面這些性質成立,{X=0}與{Y=0}獨立;{X=0}與{Y=1}獨立;{X=1}與{Y=0}獨立;{X=1}與{Y=1}獨立.我們就稱分類變量X和Y獨立.(2)獨立性檢驗①小概率值α的臨界值:忽略χ2的實際分布與該近似分布的誤差后,對于任何小概率值α,可以找到相應的正實數xα,使得P(χ2≥xα)=α,我們稱xα為α的臨界值,這個臨界值可作為判斷χ2大小的標準.概率值α越小,臨界值xα越大.②χ2的計算公式:χ2=.③獨立性檢驗:利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ2獨立性檢驗,讀作“卡方獨立性檢驗”,簡稱獨立性檢驗.④基于小概率值α的檢驗規則是:當χ2≥xα時,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α;當χ2⑤應用獨立性檢驗解決實際問題大致應包括的主要環節:(ⅰ)提出零假設H0:X和Y相互獨立,并給出在問題中的解釋.(ⅱ)根據抽樣數據整理出2×2列聯表,計算χ2的值,并與臨界值xα比較.(ⅲ)根據檢驗規則得出推斷結論.(ⅳ)在X和Y不獨立的情況下,根據需要,通過比較相應的頻率,分析X和Y間的影響規律.⑥獨立性檢驗中幾個常用的小概率值和相應的臨界值:α 0.1 0.05 0.01 0.005 0.001xα 2.706 3.841 6.635 7.879 10.828微點助解 獨立性檢驗的基本思想與反證法的思想的相似之處:反證法 獨立性檢驗要證明結論A 要確認“兩個分類變量有關系”在A不成立的前提下進行推理 假設該結論不成立,即假設“兩個分類變量沒有關系”成立,在該假設下計算χ2基點訓練1.某飛機在一次飛行航程中遭遇惡劣氣候,55名男乘客中有24名暈機,34名女乘客中有8名暈機,在檢驗這些乘客暈機是否與性別有關時,采用的數據分析方法應是 ( )A.頻率分布直方圖 B.回歸分析C.獨立性檢驗 D.用樣本估計總體解析:根據題意,結合題目中的數據,列出2×2列聯表,求出χ2,對照數表可得出概率結論,這種分析數據的方法是獨立性檢驗.√2.如表是一個2×2列聯表,則表中a,b的值分別為 ( ) y1 y2 合計x1 a 21 73x2 22 25 47合計 b 46 120A.94,72 B.52,50C.52,74 D.74,52解析:a=73-21=52,b=a+22=52+22=74.√3.對于獨立性檢驗,下列說法正確的是 ( )A.χ2獨立性檢驗的統計假設是各事件之間相互獨立B.χ2可以為負值C.χ2獨立性檢驗顯示“患慢性氣管炎和吸煙習慣有關”,這就是指“有吸煙習慣的人必定會患慢性氣管炎”D.2×2列聯表中的4個數據可以是任意正數√解析:由獨立性檢驗的檢驗步驟可知,A正確;因為2×2列聯表中的數據均為正整數,故χ2不可能為負值,排除B;因為χ2獨立性檢驗顯示“患慢性氣管炎和吸煙習慣有關”,是指有一定的把握說他們相關,或者說有一定的出錯率,故排除C;因為2×2列聯表中的4個數據是對于某組特定數據的統計數據,故四個數據間有一定的關系,故排除D.4.為研究某新藥的療效,給100名患者服用此藥,跟蹤調查后得下表中的數據: 無效 有效 合計男性患者 15 35 50女性患者 6 44 50合計 21 79 100零假設為H0:服用此藥的效果與患者的性別無關,則χ2≈_______,從而得出結論:有_____%的把握認為“服用此藥的效果與患者的性別有關”. 解析:由公式計算得χ2≈4.882.因為χ2>3.841=x0.05,所以我們有95%的把握認為服用此藥的效果與患者的性別有關.4.88295課堂環節/題點研究·遷移應用融會貫通題型(一) 分類變量與列聯表[例1] 網絡對現代人的生活影響較大,尤其是對青少年,為了解網絡對中學生學習成績的影響,某地區教育主管部門從轄區初中生中隨機抽取了1 000人調查,發現其中經常上網的有200人,這200人中有80人期末考試不及格,而另外800人中有120人不及格.利用圖形判斷學生經常上網與學習成績有關嗎 解:根據題目所給的數據得到如下2×2列聯表:成績 上網 合計經常上網 不經常上網不及格 80 120 200及格 120 680 800合計 200 800 1 000得到等高堆積條形圖如圖所示:比較圖中陰影部分,可以發現經常上網期末考試不及格的頻率明顯高于經常上網期末考試及格的頻率,因此可以認為經常上網與學習成績有關.[思維建模]判斷兩個分類變量是否有關系的兩種常用方法(1)利用數形結合思想,借助等高堆積條形圖來判斷兩個分類變量是否相關是判斷變量是否相關的常見方法.(2)一般地,在等高堆積條形圖中,與相差越大,兩個分類變量有關系的可能性就越大.針對訓練1.某生產線上,質量監督員甲在生產現場時,990件產品中有合格品982件,次品8件;不在生產現場時,510件產品中有合格品493件,次品17件.試利用列聯表和等高堆積條形圖判斷監督員甲在不在生產現場對產品質量好壞有無影響.解:根據題目所給數據得如下2×2列聯表: 合格品數 次品數 合計甲在生產現場 982 8 990甲不在生產現場 493 17 510合計 1 475 25 1 500所以ad-bc=982×17-8×493=12 750,|ad-bc|比較大,說明甲在不在生產現場與產品質量好壞有關系.相應的等高堆積條形圖如圖所示:圖中兩個陰影部分的高分別表示甲在生產現場和甲不在生產現場時樣本中次品數的頻率.從圖中可以看出,甲不在生產現場時樣本中次品數的頻率明顯高于甲在生產現場時樣本中次品數的頻率.因此可以認為質量監督員甲在不在生產現場與產品質量好壞有關系.題型(二) 獨立性檢驗[例2] 近年來,短視頻作為以視頻為載體的聚合平臺,社交屬性愈發突出,在用戶生活中覆蓋面越來越廣泛,針對短視頻的碎片化缺陷,將短視頻剪接成長視頻勢必成為一種新的技能.某機構在網上隨機對1 000人進行了一次市場調研,以決策是否開發將短視頻剪接成長視頻的APP,得到如下數據: 青年人 中年人 老年人對短視頻剪接成長視頻的APP有需求 2a+4b 200 a對短視頻剪接成長視頻的APP無需求 a+b 150 4b其中的數據為統計的人數,已知被調研的青年人數為400.(1)求a,b的值;解:由題意得解得a=b=50.(2)根據小概率值α=0.001的獨立性檢驗,分析對短視頻剪接成長視頻的APP的需求,青年人與中老年人是否有差異 參考公式:χ2=,其中n=a+b+c+d.臨界值表:α 0.1 0.05 0.01 0.005 0.001xα 2.706 3.841 6.635 7.879 10.828解:零假設為H0:對短視頻剪接成長視頻APP的需求,青年人與中老年人沒有差異.由已知得,如下2×2列聯表: 青年人 中老年人 合計對短視頻剪接成長視頻的APP有需求 300 250 550對短視頻剪接成長視頻的APP無需求 100 350 450合計 400 600 1 000可得χ2=≈107.744>10.828,根據小概率值α=0.001的獨立性檢驗,我們推斷H0不成立,所以對短視頻剪接成長視頻的APP的需求,青年人與中老年人有差異. [思維建模] 解決獨立性檢驗問題的基本步驟針對訓練2.為了解大家對養寵物的看法,某單位對本單位450名員工(其中女職工有150人)進行了調查,發現女職工中支持養寵物的人數占,從男職工與女職工中各隨機選取一名,至少有一名職工支持養寵物的概率為.(1)求該單位男職工支持養寵物的人數,并填寫下列2×2列聯表; 支持養寵物 不支持養寵物 合計男職工 女職工 合計 450單位:人解:設男職工支持養寵物的概率為p,由題意得1-(1-p)=,解得p=,又男職工有450-150=300(人),所以男職工中支持養寵物的人數為300×=75.女職工中支持養寵物的人數為150×=50.2×2列聯表如下:單位:人 支持養寵物 不支持養寵物 合計男職工 75 225 300女職工 50 100 150合計 125 325 450(2)依據α=0.05的獨立性檢驗分析,該單位職工是否支持養寵物與性別是否有關.附: χ2=,n=a+b+c+d.α 0.10 0.05 0.010 0.001xα 2.706 3.841 6.635 10.828解:零假設H0:該單位職工是否支持養寵物與性別無關.由(1)中的2×2列聯表,得χ2=≈3.462<3.841=x0.05,依據α=0.05的獨立性檢驗分析,沒有充分證據推斷H0不成立,因此可以認為H0成立,即該單位職工是否支持養寵物與性別無關.課時跟蹤檢測134567821.觀察如圖所示的等高堆積條形圖,其中最有把握認為兩個分類變量x,y之間有關系的是 ( )√13456782解析:在等高堆積條形圖中,x1,x2所占比例相差越大,分類變量x,y有關系的把握越大,故答案為D.156782342.某村莊對該村內50名老年人、年輕人每年是否體檢的情況進行了調查,統計數據如表所示:單位:名 每年體檢 每年未體檢 合計老年人 a 7 c年輕人 6 b d合計 e f 5015678234已知抽取的老年人、年輕人各25名,則對列聯表中數據的分析錯誤的是 ( )A.a=18 B.b=19C.c+d=50 D.e-f=2解析:由題意得,a+7=c=25,6+b=d=25,c+d=50,a+6=e,7+b=f,e+f=50,所以a=18,b=19,e=24, f=26,所以e-f=-2.故選D.√156783423.在研究打鼾與患心臟病之間的關系中,通過收集數據、整理分析數據得到“打鼾與患心臟病有關”的結論,并且在犯錯誤的概率不超過0.01的前提下認為這個結論是成立的.下列說法正確的是 ( )A.100個心臟病患者中至少有99人打鼾B.1個人患心臟病,則這個人有99%的概率打鼾C.100個心臟病患者中一定有打鼾的人D.100個心臟病患者中可能一個打鼾的人都沒有√15678342解析:這是獨立性檢驗,在犯錯誤的概率不超過0.01的前提下認為“打鼾與患心臟病有關”.這只是一個概率,即打鼾與患心臟病有關的可能性為99%.根據概率的意義可知,答案應選D.156783424.[多選]某學校對“學生性別和喜歡短視頻APP是否有關”進行了一次調查,其中被調查的男、女生人數相同,男生喜歡短視頻APP的人數占男生人數的,女生喜歡短視頻APP的人數占女生人數的,若有95%的把握認為是否喜歡短視頻APP和性別有關,則被調查的男生人數可能為( )附:χ2=,其中n=a+b+c+d.15678342A.50 B.45C.40 D.35√α 0.100 0.050 0.025 0.010 0.005 0.001xα 2.706 3.841 5.024 6.635 7.879 10.828√15678342解析:設男生有x人,則女生也有x人,2×2列聯表如下: 喜歡短視頻APP 不喜歡短視頻APP 合計男生 x x x女生 x x x合計 x x 2x單位:人15678342由題意得χ2==x>3.841,解得x>40.330 5,易知x>0且x是5的倍數,結合選項可知被調查的男生人數為45或50.故選AB.156783425.獨立性檢驗所采用的思路是:要研究X和Y兩個分類變量彼此相關,首先假設這兩個分類變量彼此_________,在此假設下構造隨機變量χ2.如果χ2的觀測值較大,那么在一定程度上說明假設_________. 解析:獨立性檢驗的前提是假設兩個分類變量無關系,然后通過隨機變量χ2的值來判斷假設是否成立.無關系 不成立156783426.某大學餐飲中心對全校一年級新生的飲食習慣進行抽樣調查,調查結果如下:南方學生喜歡甜品的有60人,不喜歡甜品的有20人;北方學生喜歡甜品的有10人,不喜歡甜品的有10人.那么至少有_____%的把握認為“南方學生和北方學生在選用甜品的飲食習慣方面有差異”. 附:χ2=,其中n=a+b+c+d.95α 0.1 0.05 0.01 0.005xα 2.706 3.841 6.635 7.87915678342解析:由題意得,2×2列聯表如下: 喜歡甜品 不喜歡甜品 合計南方學生 60 20 80北方學生 10 10 20合計 70 30 100χ2=≈4.762>3.841,所以至少有95%的把握認為“南方學生和北方學生在選用甜品的飲食習慣方面有差異”.單位:人7.某調查機構為了解國慶節通過短視頻APP、微信或微博表達對祖國祝福的人們是否存在年齡差異,通過不同途徑調查了數千個表達了祝福的人,并從參與者中隨機選出200人,經統計,這200人中通過微信或微博表達對祖國祝福的有160人.將這160人按年齡(單位:歲)分組:第1組[15,25),第2組[25,35),第3組[35,45),第4組[45,55),第5組[55,65],得到的頻率分布直方圖如圖所示.15678342(1)求a的值并估計這160人的平均年齡(同一組中的數據用該組區間的中點值作代表);解:由10×(0.01+0.015+a+0.03+0.01)=1,解得a=0.035,這160人的平均年齡為20×10×0.01+30×10×0.015+40×10×0.035+50×10×0.03+60×10×0.01=41.5(歲).15678342(2)若把年齡在第1,2,3組的人稱為青年人,年齡在第4,5組的人稱為中年人,已知選出的200人中通過短視頻APP表達對祖國祝福的中年人有26人,依據α=0.010的獨立性檢驗,能否認為是否通過微信或微博表達對祖國的祝福與年齡有關 附:χ2=,n=a+b+c+d.15678342α 0.050 0.025 0.010 0.005 0.001xα 3.841 5.024 6.635 7.879 10.828解:題圖中,前3組的人數為10×(0.01+0.015+0.035)×160=96.由題可得,2×2列聯表如下:單位:人15678342 通過短視頻APP表達祝福 通過微信或微博表達祝福 合計青年人 14 96 110中年人 26 64 90合計 40 160 20015678342零假設H0:是否通過微信或微博表達對祖國的祝福與年齡無關.χ2=≈8.081>6.635=x0.010,所以根據小概率值α=0.010的獨立性檢驗,有充分證據推斷H0不成立,即認為是否通過微信或微博表達對祖國的祝福與年齡有關,此推斷犯錯誤的概率不大于0.010.156783428.某校組織學生觀看“天宮課堂”,并對其中1 000名學生進行了一次“飛天宇航夢”的調查,得到如下兩個等高堆積條形圖,其中被調查的男、女生比例為3∶2.15678342(1)求m,n的值;解:由題意得,被調查的學生中,男生有600人,女生有400人,所以男生中有“飛天宇航夢”的人數為600×0.7=420,無“飛天宇航夢”的人數為600×0.3=180,女生中有“飛天宇航夢”的人數為400×0.6=240,無“飛天宇航夢”的人數為400×0.4=160,所以m==,n==.15678342(2)完成以下表格,根據小概率值α=0.001的獨立性檢驗,能否認為“學生性別和是否有‘飛天宇航夢’有關” 有“飛天宇航夢” 無“飛天宇航夢” 合計男生 女生 合計 單位:人15678342解:2×2列聯表如下: 有“飛天宇航夢” 無“飛天宇航夢” 合計男生 420 180 600女生 240 160 400合計 660 340 1 000單位:人15678342零假設H0:學生性別和是否有“飛天宇航夢”無關.χ2==≈10.695<10.828=x0.001,所以根據小概率值α=0.001的獨立性檢驗,沒有充分證據推斷H0不成立,因此可以認為H0成立,即認為“學生性別和是否有‘飛天宇航夢’無關”.15678342(3)在抽取的樣本女生中,按有無“飛天宇航夢”用分層隨機抽樣的方法抽取5人,若從這5人中隨機抽取3人進一步調查,求抽到有“飛天宇航夢”的女生人數X的分布列及數學期望.附: χ2=,其中n=a+b+c+d.α 0.15 0.10 0.05 0.025 0.010 0.005 0.001xα 2.072 2.706 3.841 5.024 6.635 7.879 10.82815678342解:由題意得,在抽取的5名女生中,有3名有“飛天宇航夢”,有2名無“飛天宇航夢”.X的可能取值為1,2,3,P(X=1)==,P(X=2)==,P(X=3)==,15678342所以X的分布列為X 1 2 3PE(X)=1×+2×+3×=.課時跟蹤檢測(二十六) 列聯表與獨立性檢驗1.觀察如圖所示的等高堆積條形圖,其中最有把握認為兩個分類變量x,y之間有關系的是 ( )2.某村莊對該村內50名老年人、年輕人每年是否體檢的情況進行了調查,統計數據如表所示:單位:名每年體檢 每年未體檢 合計老年人 a 7 c年輕人 6 b d合計 e f 50已知抽取的老年人、年輕人各25名,則對列聯表中數據的分析錯誤的是 ( )A.a=18 B.b=19C.c+d=50 D.e-f=23.在研究打鼾與患心臟病之間的關系中,通過收集數據、整理分析數據得到“打鼾與患心臟病有關”的結論,并且在犯錯誤的概率不超過0.01的前提下認為這個結論是成立的.下列說法正確的是 ( )A.100個心臟病患者中至少有99人打鼾B.1個人患心臟病,則這個人有99%的概率打鼾C.100個心臟病患者中一定有打鼾的人D.100個心臟病患者中可能一個打鼾的人都沒有4.[多選]某學校對“學生性別和喜歡短視頻APP是否有關”進行了一次調查,其中被調查的男、女生人數相同,男生喜歡短視頻APP的人數占男生人數的,女生喜歡短視頻APP的人數占女生人數的,若有95%的把握認為是否喜歡短視頻APP和性別有關,則被調查的男生人數可能為 ( )附:χ2=,其中n=a+b+c+d.α 0.100 0.050 0.025 0.010 0.005 0.001xα 2.706 3.841 5.024 6.635 7.879 10.828A.50 B.45C.40 D.355.獨立性檢驗所采用的思路是:要研究X和Y兩個分類變量彼此相關,首先假設這兩個分類變量彼此 ,在此假設下構造隨機變量χ2.如果χ2的觀測值較大,那么在一定程度上說明假設 . 6.某大學餐飲中心對全校一年級新生的飲食習慣進行抽樣調查,調查結果如下:南方學生喜歡甜品的有60人,不喜歡甜品的有20人;北方學生喜歡甜品的有10人,不喜歡甜品的有10人.那么至少有 %的把握認為“南方學生和北方學生在選用甜品的飲食習慣方面有差異”. 附:χ2=,其中n=a+b+c+d.α 0.1 0.05 0.01 0.005xα 2.706 3.841 6.635 7.8797.某調查機構為了解國慶節通過短視頻APP、微信或微博表達對祖國祝福的人們是否存在年齡差異,通過不同途徑調查了數千個表達了祝福的人,并從參與者中隨機選出200人,經統計,這200人中通過微信或微博表達對祖國祝福的有160人.將這160人按年齡(單位:歲)分組:第1組[15,25),第2組[25,35),第3組[35,45),第4組[45,55),第5組[55,65],得到的頻率分布直方圖如圖所示.(1)求a的值并估計這160人的平均年齡(同一組中的數據用該組區間的中點值作代表);(2)若把年齡在第1,2,3組的人稱為青年人,年齡在第4,5組的人稱為中年人,已知選出的200人中通過短視頻APP表達對祖國祝福的中年人有26人,依據α=0.010的獨立性檢驗,能否認為是否通過微信或微博表達對祖國的祝福與年齡有關 附:χ2=,n=a+b+c+d.α 0.050 0.025 0.010 0.005 0.001xα 3.841 5.024 6.635 7.879 10.8288.某校組織學生觀看“天宮課堂”,并對其中1 000名學生進行了一次“飛天宇航夢”的調查,得到如下兩個等高堆積條形圖,其中被調查的男、女生比例為3∶2.(1)求m,n的值;(2)完成以下表格,根據小概率值α=0.001的獨立性檢驗,能否認為“學生性別和是否有‘飛天宇航夢’有關” 單位:人有“飛天宇航夢” 無“飛天宇航夢” 合計男生女生合計(3)在抽取的樣本女生中,按有無“飛天宇航夢”用分層隨機抽樣的方法抽取5人,若從這5人中隨機抽取3人進一步調查,求抽到有“飛天宇航夢”的女生人數X的分布列及數學期望.附: χ2=,其中n=a+b+c+d.α 0.15 0.10 0.05 0.025 0.010 0.005 0.001xα 2.072 2.706 3.841 5.024 6.635 7.879 10.828課時跟蹤檢測(二十六)1.選D 在等高堆積條形圖中,x1,x2所占比例相差越大,分類變量x,y有關系的把握越大,故答案為D.2.選D 由題意得,a+7=c=25,6+b=d=25,c+d=50,a+6=e,7+b=f,e+f=50,所以a=18,b=19,e=24, f=26,所以e-f=-2.故選D.3.選D 這是獨立性檢驗,在犯錯誤的概率不超過0.01的前提下認為“打鼾與患心臟病有關”.這只是一個概率,即打鼾與患心臟病有關的可能性為99%.根據概率的意義可知,答案應選D.4.選AB 設男生有x人,則女生也有x人,2×2列聯表如下:單位:人喜歡短 視頻APP 不喜歡短 視頻APP 合計男生 x x x女生 x x x合計 x x 2x由題意得χ2==x>3.841,解得x>40.330 5,易知x>0且x是5的倍數,結合選項可知被調查的男生人數為45或50.故選AB.5.解析:獨立性檢驗的前提是假設兩個分類變量無關系,然后通過隨機變量χ2的值來判斷假設是否成立.答案:無關系 不成立6.解析:由題意得,2×2列聯表如下:單位:人喜歡甜品 不喜歡甜品 合計南方學生 60 20 80北方學生 10 10 20合計 70 30 100χ2=≈4.762>3.841,所以至少有95%的把握認為“南方學生和北方學生在選用甜品的飲食習慣方面有差異”.答案:957.解:(1)由10×(0.01+0.015+a+0.03+0.01)=1,解得a=0.035,這160人的平均年齡為20×10×0.01+30×10×0.015+40×10×0.035+50×10×0.03+60×10×0.01=41.5(歲).(2)題圖中,前3組的人數為10×(0.01+0.015+0.035)×160=96.由題可得,2×2列聯表如下:單位:人通過短視頻APP表達祝福 通過微信或微博表達祝福 合計青年人 14 96 110中年人 26 64 90合計 40 160 200零假設H0:是否通過微信或微博表達對祖國的祝福與年齡無關.χ2=≈8.081>6.635=x0.010,所以根據小概率值α=0.010的獨立性檢驗,有充分證據推斷H0不成立,即認為是否通過微信或微博表達對祖國的祝福與年齡有關,此推斷犯錯誤的概率不大于0.010.8.解:(1)由題意得,被調查的學生中,男生有600人,女生有400人,所以男生中有“飛天宇航夢”的人數為600×0.7=420,無“飛天宇航夢”的人數為600×0.3=180,女生中有“飛天宇航夢”的人數為400×0.6=240,無“飛天宇航夢”的人數為400×0.4=160,所以m==,n==.(2)2×2列聯表如下:單位:人有“飛天 宇航夢” 無“飛天 宇航夢” 合計男生 420 180 600女生 240 160 400合計 660 340 1 000零假設H0:學生性別和是否有“飛天宇航夢”無關.χ2==≈10.695<10.828=x0.001,所以根據小概率值α=0.001的獨立性檢驗,沒有充分證據推斷H0不成立,因此可以認為H0成立,即認為“學生性別和是否有‘飛天宇航夢’無關”.(3)由題意得,在抽取的5名女生中,有3名有“飛天宇航夢”,有2名無“飛天宇航夢”.X的可能取值為1,2,3,P(X=1)==,P(X=2)==,P(X=3)==,所以X的分布列為X 1 2 3PE(X)=1×+2×+3×=.3 / 3 展開更多...... 收起↑ 資源列表 8.3 列聯表與獨立性檢驗.docx 8.3 列聯表與獨立性檢驗.pptx 課時跟蹤檢測(二十六) 列聯表與獨立性檢驗.docx 縮略圖、資源來源于二一教育資源庫