資源簡介 專題8.5 列聯表與獨立性檢驗(重難點題型精講)1.分類變量為了表述方便,我們經常會使用一種特殊的隨機變量,以區別不同的現象或性質,這類隨機變量稱為分類變量.分類變量的取值可以用實數表示.2.2×2列聯表假設兩個分類變量X和Y,它們的可能取值分別為{,}和{,},其2×2列聯表為2×2列聯表給出了成對分類變量數據的交叉分類頻數.3.等高堆積條形圖常用等高堆積條形圖展示列聯表數據的頻率特征(如圖),由此反映出兩個分類變量間是否相互影響.(1)等高堆積條形圖中有兩個高度相同的矩形,每一個矩形中都有兩種顏色,觀察下方顏色區域的高度,如果兩個高度相差比較明顯(即和相差很大),就判定兩個分類變量之間有關系.(2)利用等高堆積條形圖雖可以比較各個部分之間的差異,明確展現兩個分類變量的關系,但不能知道兩個分類變量有關系的概率大小.4.獨立性檢驗(1)假定通過簡單隨機抽樣得到了X和Y的抽樣數據列聯表,如下表所示.則.(2)利用的取值推斷分類變量X和Y是否獨立的方法稱為獨立性檢驗,讀作“卡方獨立性檢驗”,簡稱獨立性檢驗.(3)獨立性檢驗中幾個常用的小概率值和相應的臨界值.【題型1 列聯表的應用】【方法點撥】利用列聯表直接計算和,如果兩者相差很大,就判斷兩個分類變量之間有關系的可能性較大.【例1】(2023·全國·高二專題練習)假設有兩個分類變量與的列聯表如下表:對于以下數據,對同一樣本能說明與有關系的可能性最大的一組為( )A.,,, B.,,,C.,,, D.,,,【解題思路】計算每個選項中的,比較大小后可得出結論.【解答過程】對于兩個分類變量與而言,的值越大,說明與有關系的可能性最大,對于A選項,,對于B選項,,對于C選項,,對于D選項,,顯然D中最大,故選:D.【變式1-1】(2022春·福建廈門·高二階段練習)在一次獨立性檢驗中,得出列聯表如圖:且最后發現,兩個分類變量A和B沒有任何關系,則a的可能值是( )A 合計B 200 800 1000180 a 180+a合計 380 800+a 1180+aA.200 B.720 C.100 D.180【解題思路】把列聯表中所給的數據代入求觀測值的公式,建立不等式,代入驗證可知a的可能值.【解答過程】解:因為兩個分類變量A和B沒有任何關系,所以 ,代入驗證可知 .故選:B.【變式1-2】(2022·高二單元測試)假設兩個分類變量和,他們的取值分別為和,其樣本頻數列聯表如下:總計總計對于以下數據,對同一樣本說明與有關的可能性最大的一組是( )A.,,, B.,,,C.,,, D.,,,【解題思路】依據越大,說明與有關的可能性越大,即可判定.【解答過程】一般地,越大,說明與有關的可能性越大.選項A中,;選項B中,;選項C中,;選項D中,.故選:B.【變式1-3】(2022·全國·高三專題練習)假設有兩個分類變量和的列聯表如下:注:的觀測值.對于同一樣本,以下數據能說明和有關系的可能性最大的一組是( )A. B. C. D.【解題思路】根據獨立性檢驗的方法和列聯表,即可得解.【解答過程】根據獨立性檢驗的方法和列聯表可得,當與相差越大,則分類變量和有關系的可能性越大,即相差越大,與相差越大.由各選項可得A滿足條件,故選A.【題型2 等高堆積條形圖的應用】【方法點撥】可以從等高堆積條形圖中直觀判斷列聯表數據的頻率特征,這種直觀判斷的不足之處在于不能直接給出推斷“兩個分類變量有關系”犯錯誤的概率.【例2】(2022春·吉林·高二階段練習)為了解戶籍性別對生育二胎選擇傾向的影響,某地從育齡人群中隨機抽取了容量為100的調查樣本,其中城鎮戶籍與農村戶籍各50人,男性40人,女性60人,繪制不同群體中傾向選擇生育二胎與選擇不生育二胎的人數比例圖(如圖所示),其中陰影部分表示傾向選擇生育二胎的對應比例,則關于樣本下列敘述中正確的是( )A.是否傾向選擇生育二胎與戶籍無關B.是否傾向選擇生育二胎與性別有關C.傾向選擇生育二胎的人員中,男性人數與女性人數相同D.傾向選擇不生育二胎的人員中,農村戶籍人數少于城鎮戶籍人數【解題思路】結合所給比例圖,依次分析判斷4個選項即可.【解答過程】對于A,城鎮戶籍中選擇生育二胎,農村戶籍中選擇生育二胎,相差較大,則是否傾向選擇生育二胎與戶籍有關,A錯誤;對于B,男性和女性中均有選擇生育二胎,則是否傾向選擇生育二胎與性別無關,B錯誤;對于C,由于男性和女性中均有選擇生育二胎,但樣本中男性40人,女性60人,則傾向選擇生育二胎的人員中,男性人數與女性人數不同,C錯誤;對于D,傾向選擇不生育二胎的人員中,農村戶籍有人,城鎮戶籍有人,農村戶籍人數少于城鎮戶籍人數,D正確.故選:D.【變式2-1】(2022春·全國·高二期末)觀察下面頻率等高條形圖,其中兩個分類變量x,y之間的隨機變量的觀測值最小的是( )A. B.C. D.【解題思路】直接由等高條形圖中所占比例相差越小,隨機變量的觀測值越小判斷即可.【解答過程】等高的條形圖中所占比例相差越小,隨機變量的觀測值越小.故選:B.【變式2-2】(2023·全國·高二專題練習)觀察下列各圖,其中兩個分類變量x,y之間關系最強的是( )A. B.C. D.【解題思路】由等高條形圖的定義和性質依次分析,即得解【解答過程】觀察等高條形圖發現與相差很大,就判斷兩個分類變量之量關系最強.故選:D.【變式2-3】(2023·高二課時練習)為考查A,B兩種藥物預防某疾病的效果,進行動物實驗,分別得到如下等高條形圖:根據圖中信息,在下列各項中,說法最佳的一項是( )A.藥物B的預防效果優于藥物A的預防效果B.藥物A的預防效果優于藥物B的預防效果C.藥物A,B對該疾病均有顯著的預防效果D.藥物A,B對該疾病均沒有預防效果【解題思路】根據等高條形圖中的數據即可得出選項.【解答過程】根據兩個表中的等高條形圖知,藥物A實驗顯示不服藥與服藥時患病差異較藥物B實驗顯示明顯大,所以藥物A的預防效果優于藥物B的預防效果,故選:B.【題型3 獨立性檢驗的應用】【方法點撥】可以利用獨立性檢驗來推斷兩個分類變量是否有關系,并且能較精確地給出這種判斷的可靠程度.具體做法:(1)根據實際問題需要的可信程度(或容許犯錯誤概率的上界)確定臨界值;(2)利用公式,由觀測數據計算得到的值;(3)對照臨界值表,即可得出結論.【例3】(2023·江西上饒·統考一模)新型冠狀病毒感染,主要是由新型冠狀病毒引起的,典型癥狀包括干咳、發熱、四肢無力等,部分人群會伴有流鼻涕、拉肚子等癥狀.病人痊愈的時間個體差異也是比較大的,新型冠狀病毒一般2-6周左右能恢復.某興趣小組為進一步了解新型冠狀病毒恢復所需時間,隨機抽取了200名已痊愈的新型冠狀病毒患者(其中有男性100名,女性100名)進行調查,得到數據如下表所示:痊愈周數 性別 1周 2周 3周 4周 5周 6周 大于6周男性 4 50 24 12 6 2 2女性 2 40 22 16 10 6 4若新型冠狀病毒患者在3周內(含3周)痊愈,則稱患者“痊愈快”,否則稱患者“痊愈慢”.(1)分別估計男、女新型冠狀病毒患者“痊愈快”的概率?(2)完成下面列聯表,并判斷是否有95%的把握認為患者性別與痊愈快慢有關?痊愈快慢 性別 痊愈快 痊愈慢 總計男性女性總計附:.0.050 0.010 0.001k 3.841 6.635 10.828【解題思路】(1)根據表中數據的統計,結合古典概型的概率公式即可求解,(2)根據數據統計完成二聯表,即可計算,進行判斷.【解答過程】(1)由表中數據可知:男性患者在三周以及以內康復的人有 ,女性患者在三周以及以內康復的人有 ,故男性新型冠狀病毒患者“痊愈快”的概率為,女性新型冠狀病毒患者“痊愈快”的概率為(2)二聯表如下表:痊愈快慢 性別 痊愈快 痊愈慢 總計男性 78 22 100女性 64 36 100總計 142 58 200故故有95%的把握認為患者性別與痊愈快慢有關.【變式3-1】(2023春·河南安陽·高三階段練習)2021年7月24日中共中央辦公廳、國務院辦公廳印發《關于進一步減輕義務教育階段學生作業負擔和校外培訓負擔的意見》(以下簡稱“雙減”),各省、市精心組織實施,強化目標管理,治理校外培訓行為.為了調查人們對“雙減”的滿意程度,抽取了男、女各25人對“雙減”的滿意度進行調查,統計數據如表所示.滿意 非常滿意 合計男性 18 7 25女性 6 19 25合計 24 26 50(1)根據上表,如果隨機抽查1人,那么抽到此人對“雙減”滿意的概率是多少?抽到此人對“雙減”非常滿意且是女性的概率是多少?(2)能否有的把握認為性別和滿意度有關?附:,.0.050 0.010 0.001k 3.841 6.635 10.828【解題思路】(1)根據古典概型的概率公式即可求得答案;(2)計算的值,與臨界值表進行比較,可得結論.【解答過程】(1)隨機抽查1人,抽到滿意的概率是;抽到非常滿意且是女性的概率是;(2)根據列聯表,可得,∴有99.9%的把握認為性別和滿意度有關.【變式3-2】(2023·內蒙古·模擬預測)國際足聯世界杯( ),簡稱“世界杯”,是由全世界國家級別球隊參與,象征足球界最高榮譽,并具有最大知名度和影響力的足球賽事.年卡塔爾世界杯共有支球隊參加比賽,共有場比賽.某社區隨機調查了街道內男、女球迷各名,統計了他們觀看世界杯球賽直播的場次,得到下面的列聯表:少于場比賽 不少于場比賽 總計男球迷女球迷總計(1)求的值,并完成上述列聯表;(2)若一名球迷觀看世界杯球賽直播的場次不少于場比賽,則稱該球迷為“資深球迷”,請判斷能否有的把握認為該社區的一名球迷是否為“資深球迷”與性別有關.參考公式:,其中.參考數據:【解題思路】(1)根據球迷總人數可構造方程求得的值,進而補全列聯表;(2)由列聯表數據可計算得到,對比臨界值表可得結論.【解答過程】(1)由題意得:,解得:;補全列聯表如下:少于場比賽 不少于場比賽 總計男球迷女球迷總計(2)由(1)得:,有的把握認為該社區的一名球迷是否為“資深球迷”與性別有關.【變式3-3】(2023春·湖南·高三階段練習)人們曾經相信,藝術家將是最后被AⅠ所取代的職業,但技術的進步已經將這一信念敲出了裂痕,這可能是AⅠ第一次引起人類的恐慌,由noval AⅠ,DALL-E2等軟件創作出來的給畫作品風格各異,乍看之下,已與人類繪畫作品無異,AⅠ會取代人類畫師嗎?某機構隨機對60人進行了一次調查,統計發現認為會取代的有42人,30歲以下認為不會取代的有12人,占30歲以下調查人數的.(1)根據以上數據完成如下2×2列聯表:年齡 理解情況 總計會取代 不會取代30歲以下 1230歲及以上總計 42 60(2)依據小概率值的獨立性檢驗,能否認為年齡與理解情況有關?并說明原因.0.10 0.05 0.010 0.005 0.0012.706 3.841 6.635 7.879 10.828參考公式:,其中.【解題思路】(1)根據題設中的數據即可求解;(2)代入卡方公式求出值與表對比即可求解.【解答過程】(1)完成2×2列聯表如下:年齡 理解情況 總計會取代 不會取代30歲以下 18 12 3030歲及以上 24 16 30總計 42 18 60(2)設為:年齡與理解情況相互獨立,即年齡與理解情況無關,由題意,,所以根據小概率的獨立性檢驗,我們推斷成立.即認為年齡與理解情況無關,此推斷犯錯誤的概率不大于0.010.【題型4 獨立性檢驗與統計知識的綜合應用】【方法點撥】獨立性檢驗與統計知識結合在一起考查是一個很好的結合點,解題的關鍵是正確從圖表中得到相關數據.【例4】(2023·全國·模擬預測)某省級綜合醫院共有1000名醫護員工參加防疫知識和技能競賽,其中男性450人,為了解該醫院醫護員工在防疫知識和技能競賽中的情況,現按性別采用分層抽樣的方法從中抽取100名醫護員工的成績(單位:分)作為樣本進行統計,成績均分布在400~700分之間,根據統計結果繪制的醫護員工成績的頻率分布直方圖如圖所示,將成績不低于600分的醫護員工稱為優秀防疫員工(1)求a的值,并估計該醫院醫護員工成績的平均數、中位數(同一組中的數據用該組區間的中點值作代表);(2)若樣本中優秀防疫員工有女性10人,完成下列2×2列聯表,并根據小概率值的獨立性檢驗,能否認為該醫院醫護員工的性別與是否為優秀防疫員工有關聯?優秀防疫員工 非優秀防疫員工 合計男女合計(3)采用分層抽樣的方法從樣本中成績在,的醫護員工中抽取8人,再從這8人中隨機抽取3人,記被抽取的3名醫護員工中優秀防疫員工的人數為隨機變量X,求X的分布列及數學期望.附:,其中.0.10 0.05 0.010 0.005 0.0012.706 3.841 6.635 7.879 10.828【解題思路】(1)首先根據頻率和為1求出值,再求出成績平均數,再根據中位數概念求出中位數即可;(2)進行零假設,補全2×2列聯表,計算計算的值并與臨界值比較即可得到結論;(3)求出分層抽樣的各層人數,計算概率得到分布列,則得到其期望.【解答過程】(1)第一步:根據頻率之和為1求a的值由題意知,解得.第二步:根據平均數與中位數的定義求解,估計該醫院醫護員工成績的平均數,.因為,所以估計中位數為550.(2)第一步:寫出零假設零假設為:性別與是否為優秀防疫員工獨立,即性別與是否為優秀防疫員工無關聯.第二步:補全2×2列聯表由題可知,樣本中男性有人,女性有人,優秀防疫員工有(人),其中女性10人,得出以下2×2列聯表:優秀防疫員工 非優秀防疫員工 合計男 15 30 45女 10 45 55合計 25 75 100第三步:計算的值并與臨界值比較根據列聯表中的數據,得到,第四步:得出結論所以根據小概率值的獨立性檢驗,我們沒有充分證據推斷不成立,故認為性別與是否為優秀防疫員工無關聯.(3)第一步:利用分層抽樣的知識求抽取的8人中成績在與中的人數由題意及頻率分布直方圖可得,從成績在的醫護員工中抽取3人,從成績在的醫護員工中抽取5人,第二步:寫出隨機變量X的所有可能取值所以X的所有可能取值為0,1,2,3.第三步:分別求出X取每個值的概率,得分布列,,,,所以隨機變量X的分布列為P 0 1 2 3X第四步:計算數學期望.【變式4-1】(2023·高二單元測試)相關統計數據顯示,中國經常參與體育鍛煉的人數比例為37.2%,城鄉居民達到《國民體質測定標準》合格以上的人數比例達到90%以上.某市一健身連鎖機構對其會員進行了統計,制作成如下兩個統計圖,圖1為會員年齡分布圖(年齡為整數),圖2為會員一個月內到健身房次數分布扇形圖.若將會員按年齡分為“年輕人”(20歲-39歲)和“非年輕人”(19歲及以下或40歲及以上)兩類,將一個月內到健身房鍛煉16次及以上的會員稱為”健身達人”,15次及以下的會員稱為“健身愛好者”,且已知在“健身達人”中有是“年輕人”.(1)現從該健身連鎖機構會員中隨機抽取一個容量為100的樣本,根據圖的數據,補全下方2×2列聯表,并判斷是否有95%的把握認為“健身達人”與年齡有關?年輕人 非年輕人 合計健身達人健身愛好者合計附:0.10 0.05 0.025 0.010 0.005 0.0012.706 3.841 5.024 6.635 7.879 10.828(2)將(1)中相應的頻率作為概率,該健身連鎖機構隨機選取3名會員進行回訪,設3名會員中既是“年輕人”又是“健身達人”的人數為隨機變量X,求X的分布列和數學期望.【解題思路】(1)根據條件完善列聯表,然后算出即可;(2)隨機變量X滿足二項分布,然后根據二項分布進行求概率和期望【解答過程】(1)根據年輕人標準結合圖1可得年輕人占比為80%,則年輕人人數為10080%=80,則非年輕人為20人,根據圖2表格得健身達人所占比60%,所以其人數為10060%=60,根據其中年輕人占比,所以健身達人中年輕人人數為,則非年輕人為10人;健身愛好者人數為100-60=40,再通過總共年輕人合計為80人,則健身愛好者中年輕人人數為80-50=30,根據非年輕人總共為20人,則健身愛好者中非年輕人人數為20-10=10,所以列聯表為年輕人 非年輕人 合計健身達人 50 10 60健身愛好者 30 10 40合計 80 20 100,所以沒有95%的把握認為“健身達人”與年齡有關.(2)由(1)知,既是年輕人又是健身達人的概率為,則隨機變量X滿足二項分布,,,,,故X的分布列:X 0 1 2 3P則的數學期望為.【變式4-2】(2023春·河南安陽·高三階段練習)某超市為改善某產品的銷售狀況并制訂銷售策略,統計了過去100天該產品的日銷售收入(單位:萬元)并分成六組制成如圖所示的頻率分布直方圖.(1)求a的值并估計過去100天該產品的日銷售收入的平均值;(同一區間數據以中點值作代表)(2)該超市過去100天中有30天將該商品降價銷售,在該商品降價的30天中有18天該產品的日銷售收入不低于0.6萬元,判斷能否有97.5%的把握認為該商品的日銷售收入不低于0.6萬元與該日是否降價有關.附:,其中.【解題思路】(1)由頻率分布直方圖總面積為1列方程求a,由定義求均值;(2)作出列聯表,求得,根據表格比較判斷即可.【解答過程】(1)依題意有,得.;(2)依題意作列聯表:降價 非降價 總計不低于萬元 18 12 30低于萬元 12 58 70總計 30 70 100,因為,所以有的把握認為該商品的日銷售收入不低于萬元與該日是否降價有關.【變式4-3】(2023秋·浙江嘉興·高三期末)為積極響應“反詐”宣傳教育活動的要求,某企業特舉辦了一次“反詐”知識競賽,規定:滿分為100分,60分及以上為合格.該企業從甲 乙兩個車間中各抽取了100位職工的競賽成績作為樣本.對甲車間100位職工的成績進行統計后,得到了如圖所示的成績頻率分布直方圖.(1)估算甲車間職工此次“反詐”知識競賽的合格率;(2)若將頻率視為概率,以樣本估計總體.從甲車間職工中,采用有放回的隨機抽樣方法抽取3次,每次抽1人,每次抽取的結果相互獨立,記被抽取的3人次中成績合格的人數為.求隨機變量的分布列;(3)若乙車間參加此次知識競賽的合格率為,請根據所給數據,完成下面的列聯表,并根據列聯表判斷是否有的把握認為此次職工“反計”知識競賽的成績與其所在車間有關 2×2列聯表甲車間 乙車間 合計合格人數不合格人數合計附參考公式:①,其中.②獨立性檢驗臨界值表【解題思路】(1)根據頻率分布直方圖的性質,可得答案;(2)根據二項分布的分布列的解題步驟,可得答案;(3)由題意,補全列聯表,利用獨立性檢驗的解題步驟,可得答案.【解答過程】(1)根據頻率分布直方圖可求得甲車間此次參加“反詐”知識競賽的合格率,即.(2)由題意可知,由于每次抽取的結果是相互獨立的,故,,所以,,故隨機變量的分布列為0 1 2 3(3)根據題中統計數據可填寫列聯表如下,甲車間 乙車間 合計合格人數 80 60 140不合格人數 20 40 60合計 100 100 200,所以有的把握認為“此次職工‘反計’知識競賽的成績與職工所在車間有關系”.專題8.5 列聯表與獨立性檢驗(重難點題型精講)1.分類變量為了表述方便,我們經常會使用一種特殊的隨機變量,以區別不同的現象或性質,這類隨機變量稱為分類變量.分類變量的取值可以用實數表示.2.2×2列聯表假設兩個分類變量X和Y,它們的可能取值分別為{,}和{,},其2×2列聯表為2×2列聯表給出了成對分類變量數據的交叉分類頻數.3.等高堆積條形圖常用等高堆積條形圖展示列聯表數據的頻率特征(如圖),由此反映出兩個分類變量間是否相互影響.(1)等高堆積條形圖中有兩個高度相同的矩形,每一個矩形中都有兩種顏色,觀察下方顏色區域的高度,如果兩個高度相差比較明顯(即和相差很大),就判定兩個分類變量之間有關系.(2)利用等高堆積條形圖雖可以比較各個部分之間的差異,明確展現兩個分類變量的關系,但不能知道兩個分類變量有關系的概率大小.4.獨立性檢驗(1)假定通過簡單隨機抽樣得到了X和Y的抽樣數據列聯表,如下表所示.則.(2)利用的取值推斷分類變量X和Y是否獨立的方法稱為獨立性檢驗,讀作“卡方獨立性檢驗”,簡稱獨立性檢驗.(3)獨立性檢驗中幾個常用的小概率值和相應的臨界值.【題型1 列聯表的應用】【方法點撥】利用列聯表直接計算和,如果兩者相差很大,就判斷兩個分類變量之間有關系的可能性較大.【例1】(2023·全國·高二專題練習)假設有兩個分類變量與的列聯表如下表:對于以下數據,對同一樣本能說明與有關系的可能性最大的一組為( )A.,,, B.,,,C.,,, D.,,,【變式1-1】(2022春·福建廈門·高二階段練習)在一次獨立性檢驗中,得出列聯表如圖:且最后發現,兩個分類變量A和B沒有任何關系,則a的可能值是( )A 合計B 200 800 1000180 a 180+a合計 380 800+a 1180+aA.200 B.720 C.100 D.180單元測試)假設兩個分類變量和,他們的取值分別為和,其樣本頻數列聯表如下:總計總計對于以下數據,對同一樣本說明與有關的可能性最大的一組是( )A.,,, B.,,,C.,,, D.,,,【變式1-3】(2022·全國·高三專題練習)假設有兩個分類變量和的列聯表如下:注:的觀測值.對于同一樣本,以下數據能說明和有關系的可能性最大的一組是( )A. B. C. D.【題型2 等高堆積條形圖的應用】【方法點撥】可以從等高堆積條形圖中直觀判斷列聯表數據的頻率特征,這種直觀判斷的不足之處在于不能直接給出推斷“兩個分類變量有關系”犯錯誤的概率.【例2】(2022春·吉林·高二階段練習)為了解戶籍性別對生育二胎選擇傾向的影響,某地從育齡人群中隨機抽取了容量為100的調查樣本,其中城鎮戶籍與農村戶籍各50人,男性40人,女性60人,繪制不同群體中傾向選擇生育二胎與選擇不生育二胎的人數比例圖(如圖所示),其中陰影部分表示傾向選擇生育二胎的對應比例,則關于樣本下列敘述中正確的是( )A.是否傾向選擇生育二胎與戶籍無關B.是否傾向選擇生育二胎與性別有關C.傾向選擇生育二胎的人員中,男性人數與女性人數相同D.傾向選擇不生育二胎的人員中,農村戶籍人數少于城鎮戶籍人數【變式2-1】(2022春·全國·高二期末)觀察下面頻率等高條形圖,其中兩個分類變量x,y之間的隨機變量的觀測值最小的是( )A. B.C. D.【變式2-2】(2023·全國·高二專題練習)觀察下列各圖,其中兩個分類變量x,y之間關系最強的是( )A. B.C. D.【變式2-3】(2023·高二課時練習)為考查A,B兩種藥物預防某疾病的效果,進行動物實驗,分別得到如下等高條形圖:根據圖中信息,在下列各項中,說法最佳的一項是( )A.藥物B的預防效果優于藥物A的預防效果B.藥物A的預防效果優于藥物B的預防效果C.藥物A,B對該疾病均有顯著的預防效果D.藥物A,B對該疾病均沒有預防效果【題型3 獨立性檢驗的應用】【方法點撥】可以利用獨立性檢驗來推斷兩個分類變量是否有關系,并且能較精確地給出這種判斷的可靠程度.具體做法:(1)根據實際問題需要的可信程度(或容許犯錯誤概率的上界)確定臨界值;(2)利用公式,由觀測數據計算得到的值;(3)對照臨界值表,即可得出結論.【例3】(2023·江西上饒·統考一模)新型冠狀病毒感染,主要是由新型冠狀病毒引起的,典型癥狀包括干咳、發熱、四肢無力等,部分人群會伴有流鼻涕、拉肚子等癥狀.病人痊愈的時間個體差異也是比較大的,新型冠狀病毒一般2-6周左右能恢復.某興趣小組為進一步了解新型冠狀病毒恢復所需時間,隨機抽取了200名已痊愈的新型冠狀病毒患者(其中有男性100名,女性100名)進行調查,得到數據如下表所示:痊愈周數 性別 1周 2周 3周 4周 5周 6周 大于6周男性 4 50 24 12 6 2 2女性 2 40 22 16 10 6 4若新型冠狀病毒患者在3周內(含3周)痊愈,則稱患者“痊愈快”,否則稱患者“痊愈慢”.(1)分別估計男、女新型冠狀病毒患者“痊愈快”的概率?(2)完成下面列聯表,并判斷是否有95%的把握認為患者性別與痊愈快慢有關?痊愈快慢 性別 痊愈快 痊愈慢 總計男性女性總計附:.0.050 0.010 0.001k 3.841 6.635 10.828【變式3-1】(2023春·河南安陽·高三階段練習)2021年7月24日中共中央辦公廳、國務院辦公廳印發《關于進一步減輕義務教育階段學生作業負擔和校外培訓負擔的意見》(以下簡稱“雙減”),各省、市精心組織實施,強化目標管理,治理校外培訓行為.為了調查人們對“雙減”的滿意程度,抽取了男、女各25人對“雙減”的滿意度進行調查,統計數據如表所示.滿意 非常滿意 合計男性 18 7 25女性 6 19 25合計 24 26 50(1)根據上表,如果隨機抽查1人,那么抽到此人對“雙減”滿意的概率是多少?抽到此人對“雙減”非常滿意且是女性的概率是多少?(2)能否有的把握認為性別和滿意度有關?附:,.0.050 0.010 0.001k 3.841 6.635 10.828【變式3-2】(2023·內蒙古·模擬預測)國際足聯世界杯( ),簡稱“世界杯”,是由全世界國家級別球隊參與,象征足球界最高榮譽,并具有最大知名度和影響力的足球賽事.年卡塔爾世界杯共有支球隊參加比賽,共有場比賽.某社區隨機調查了街道內男、女球迷各名,統計了他們觀看世界杯球賽直播的場次,得到下面的列聯表:少于場比賽 不少于場比賽 總計男球迷女球迷總計(1)求的值,并完成上述列聯表;(2)若一名球迷觀看世界杯球賽直播的場次不少于場比賽,則稱該球迷為“資深球迷”,請判斷能否有的把握認為該社區的一名球迷是否為“資深球迷”與性別有關.參考公式:,其中.參考數據:【變式3-3】(2023春·湖南·高三階段練習)人們曾經相信,藝術家將是最后被AⅠ所取代的職業,但技術的進步已經將這一信念敲出了裂痕,這可能是AⅠ第一次引起人類的恐慌,由noval AⅠ,DALL-E2等軟件創作出來的給畫作品風格各異,乍看之下,已與人類繪畫作品無異,AⅠ會取代人類畫師嗎?某機構隨機對60人進行了一次調查,統計發現認為會取代的有42人,30歲以下認為不會取代的有12人,占30歲以下調查人數的.(1)根據以上數據完成如下2×2列聯表:年齡 理解情況 總計會取代 不會取代30歲以下 1230歲及以上總計 42 60(2)依據小概率值的獨立性檢驗,能否認為年齡與理解情況有關?并說明原因.0.10 0.05 0.010 0.005 0.0012.706 3.841 6.635 7.879 10.828參考公式:,其中.【題型4 獨立性檢驗與統計知識的綜合應用】【方法點撥】獨立性檢驗與統計知識結合在一起考查是一個很好的結合點,解題的關鍵是正確從圖表中得到相關數據.【例4】(2023·全國·模擬預測)某省級綜合醫院共有1000名醫護員工參加防疫知識和技能競賽,其中男性450人,為了解該醫院醫護員工在防疫知識和技能競賽中的情況,現按性別采用分層抽樣的方法從中抽取100名醫護員工的成績(單位:分)作為樣本進行統計,成績均分布在400~700分之間,根據統計結果繪制的醫護員工成績的頻率分布直方圖如圖所示,將成績不低于600分的醫護員工稱為優秀防疫員工(1)求a的值,并估計該醫院醫護員工成績的平均數、中位數(同一組中的數據用該組區間的中點值作代表);(2)若樣本中優秀防疫員工有女性10人,完成下列2×2列聯表,并根據小概率值的獨立性檢驗,能否認為該醫院醫護員工的性別與是否為優秀防疫員工有關聯?優秀防疫員工 非優秀防疫員工 合計男女合計(3)采用分層抽樣的方法從樣本中成績在,的醫護員工中抽取8人,再從這8人中隨機抽取3人,記被抽取的3名醫護員工中優秀防疫員工的人數為隨機變量X,求X的分布列及數學期望.附:,其中.0.10 0.05 0.010 0.005 0.0012.706 3.841 6.635 7.879 10.828【變式4-1】(2023·高二單元測試)相關統計數據顯示,中國經常參與體育鍛煉的人數比例為37.2%,城鄉居民達到《國民體質測定標準》合格以上的人數比例達到90%以上.某市一健身連鎖機構對其會員進行了統計,制作成如下兩個統計圖,圖1為會員年齡分布圖(年齡為整數),圖2為會員一個月內到健身房次數分布扇形圖.若將會員按年齡分為“年輕人”(20歲-39歲)和“非年輕人”(19歲及以下或40歲及以上)兩類,將一個月內到健身房鍛煉16次及以上的會員稱為”健身達人”,15次及以下的會員稱為“健身愛好者”,且已知在“健身達人”中有是“年輕人”.(1)現從該健身連鎖機構會員中隨機抽取一個容量為100的樣本,根據圖的數據,補全下方2×2列聯表,并判斷是否有95%的把握認為“健身達人”與年齡有關?年輕人 非年輕人 合計健身達人健身愛好者合計附:0.10 0.05 0.025 0.010 0.005 0.0012.706 3.841 5.024 6.635 7.879 10.828(2)將(1)中相應的頻率作為概率,該健身連鎖機構隨機選取3名會員進行回訪,設3名會員中既是“年輕人”又是“健身達人”的人數為隨機變量X,求X的分布列和數學期望.【變式4-2】(2023春·河南安陽·高三階段練習)某超市為改善某產品的銷售狀況并制訂銷售策略,統計了過去100天該產品的日銷售收入(單位:萬元)并分成六組制成如圖所示的頻率分布直方圖.(1)求a的值并估計過去100天該產品的日銷售收入的平均值;(同一區間數據以中點值作代表)(2)該超市過去100天中有30天將該商品降價銷售,在該商品降價的30天中有18天該產品的日銷售收入不低于0.6萬元,判斷能否有97.5%的把握認為該商品的日銷售收入不低于0.6萬元與該日是否降價有關.附:,其中.【變式4-3】(2023秋·浙江嘉興·高三期末)為積極響應“反詐”宣傳教育活動的要求,某企業特舉辦了一次“反詐”知識競賽,規定:滿分為100分,60分及以上為合格.該企業從甲 乙兩個車間中各抽取了100位職工的競賽成績作為樣本.對甲車間100位職工的成績進行統計后,得到了如圖所示的成績頻率分布直方圖.(1)估算甲車間職工此次“反詐”知識競賽的合格率;(2)若將頻率視為概率,以樣本估計總體.從甲車間職工中,采用有放回的隨機抽樣方法抽取3次,每次抽1人,每次抽取的結果相互獨立,記被抽取的3人次中成績合格的人數為.求隨機變量的分布列;(3)若乙車間參加此次知識競賽的合格率為,請根據所給數據,完成下面的列聯表,并根據列聯表判斷是否有的把握認為此次職工“反計”知識競賽的成績與其所在車間有關 2×2列聯表甲車間 乙車間 合計合格人數不合格人數合計附參考公式:①,其中.②獨立性檢驗臨界值表 展開更多...... 收起↑ 資源列表 高中數學培優講義練習(人教A版2019選擇性必修三)專題8.5 列聯表與獨立性檢驗(重難點題型精講) Word版含解析.docx 高中數學培優講義練習(人教A版2019選擇性必修三)專題8.5 列聯表與獨立性檢驗(重難點題型精講)(學生版).docx 縮略圖、資源來源于二一教育資源庫