中文字幕精品无码一区二区,成全视频在线播放观看方法,大伊人青草狠狠久久,亚洲一区影音先锋色资源

高中數學(人教B版)選擇性必修二同步講義第4章第07講獨立性檢驗(學生版+解析)

資源下載
  1. 二一教育資源

高中數學(人教B版)選擇性必修二同步講義第4章第07講獨立性檢驗(學生版+解析)

資源簡介

第07講 獨立性檢驗
課程標準 學習目標
1.通過實例,理解2×2列聯表的統計意義. 2.通過實例,了解2×2列聯表獨立性檢驗及其應用. 1.理解獨立性檢驗的基本概念、原理和步驟; 2.學生應能夠運用所學的獨立性檢驗知識解決實際問題; 3.通過學習獨立性檢驗,培養數據處理和分析的能力.
知識點01 2×2列聯表
1.2×2列聯表的概念:
將隨機事件A,B的樣本數據整理成如下的表格
A 總計
B a b a+b
c d c+d
總計 a+c b+d a+b+c+d
上面這個表格中,核心的數據是中間的4個格子,所以這樣的表格通常稱為2×2列聯表
2.列聯表的統計意義:
記na+b+c+d,則由上表可知:
(1)事件A發生的概率可估計為P(A);
(2)事件B發生的概率可估計為P(B);
(3)事件AB發生的概率可估計為P(AB).
其他事件的概率類似可求.
【解讀】(1)2×2列聯表主要用于研究兩個事件之間是相互獨立的還是存在某種關聯性,它適用于分析兩個事件之間的關系;
(2)因為P(A),P(B),P(AB)都是根據樣本數據得到的估計值,而估計是有誤差的,因此直接用P(AB)P(A)P(B)是否不成立來判斷A與B是否獨立是不合理的.
【即學即練1】
1.為調查乘客暈車情況,在某一次行程中,70名男乘客中有25名暈車,30名女乘客中有5名暈車.在檢驗這些乘客暈車是否與性別相關時,常采用的數據分析方法是(  )
                                                                
A.回歸分析 B.獨立性檢驗
C.頻率分布直方圖 D.用樣本估計總體
【答案】C
【解析】根據題意,結合題目中的數據,可列2×2列聯表,
求觀測值χ2,對照臨界值得出概率結論;這種數據分析的方法是獨立性檢驗.
2.下表是一個2×2列聯表:
y1 y2 總計
x1 a 21 73
x2 2 25 27
總計 b 46 100
則表中a、b處的值分別為(   )
A.94,96 B.52,70 
C.52,54 D.54,52
【答案】D
【解析】由得
知識點02 獨立性檢驗
1.χ2(讀作“卡方”)統計量:是統計中一個非常有用的統計量,它的表達式是
χ2.
2.獨立性檢驗:任意給定一個α(稱為顯著性水平,通常取為0.05,0.01等),可以找到滿足條件P(χ2≥k)α的數k(稱為顯著性水平α對應的分位數).χ2是一個隨機變量,其分布能夠求出,上面的概率是可以計算的.因此,如果根據樣本數據算出χ2的值后,發現χ2≥k不成立,就稱在犯錯誤的概率不超過α的前提下,可以認為A與B不獨立(也稱為A與B有關);或說有1-α的把握認為A與B有關.若χ2【解讀】A與B獨立時,也稱為A與B無關.當χ2【即學即練2】已知P(χ2≥6.635)0.01,P(χ2≥10.828)0.001.在檢驗喜歡某項體育運動與性別是否有關的過程中,某研究員搜集數據并計算得到χ27.235,則根據小概率值α________的χ2獨立性檢驗,分析喜歡該項體育運動與性別有關.
【答案】 0.01
【解析】 因為6.635<7.235<10.828,所以根據小概率值α0.01的χ2獨立性檢驗,分析喜歡該項體育運動與性別有關.
題型01 利用列聯表分析兩變量的關系
【典例1】在對人們飲食習慣的一次調查中,共調查了124人,其中六十歲以上的70人,六十歲以下的54人.六十歲以上的人中有43人的飲食以蔬菜為主,另外27人則以肉類為主;六十歲以下的人中有21人飲食以蔬菜為主,另外33人則以肉類為主.請根據以上數據作出飲食習慣與年齡的列聯表,并利用與判斷二者是否有關系.
【解析】 2×2列聯表如下:
年齡在六十歲以上 年齡在六十歲以下 總計
飲食以蔬菜為主 43 21 64
飲食以肉類為主 27 33 80
總計 70 54 124
將表中數據代入公式得0.671 875.0.45.
顯然二者數據具有較為明顯的差距,據此可以在某種程度上認為飲食習慣與年齡有關系.
【變式1】假設有兩個分類變量X與Y,它們的可能取值分別為{x1,x2}和{y1,y2},其2×2列聯表為:
y1 y2
x1 10 18
x2 m 26
則當m取下面何值時,X與Y的關系最弱(   )
A.8 B.9
C.14 D.19
【答案】D 
【解析】由10×2618m,解得m≈14.4,所以當m14時,X與Y的關系最弱.
【變式2】下面是2×2列聯表.
A B
B1 B2 總計
A1 33 21 54
A2 a 13 46
總計 b 34 100
(1)表中a,b處的值應為多少?
(2)若用頻率估計概率,則P(A1),P(B1),P(A1B1)分別是多少?
(3)表中的數據能說明A1與B1相互獨立嗎?
【解析】(1)a46-1333,
b33+a33+3366.
(2)P(A1),P(B1),P(A1B1).
(3)因為P(A1)·P(B1)×≈P(A1B1),所以表中的數據能說明A1與B1相互獨立.
【變式3】在一次對人們飲食習慣的調查中,共調查了124人,其中80歲以上的有70人,80歲以下的有54人.80歲以上的人中,有43人飲食以蔬菜為主,另外27人則以肉類為主;80歲以下的人中,有21人飲食以蔬菜為主,另外33人則以肉類為主.請根據以上數據作出飲食習慣與年齡的列聯表,并判斷二者是否有關系.
【解析】將數據整理成如下2×2列聯表.
年齡 飲食習慣
以蔬菜為主 以肉類為主 總計
80歲以上 43 27 70
80歲以下 21 33 54
總計 64 80 124
計算得≈0.614,
≈0.389.
顯然二者數據有較為明顯的差距,可以判斷年齡對飲食習慣有影響,據此可以在某種程度上認為飲食習慣與年齡有關系.
題型02 2×2列聯表的性質及應用
【典例2】(2025高三·全國·專題練習)下面是列聯表:
合計
21 73
22 25 47
合計 46 120
則表中,的值分別為( )
A.94,72 B.52,70 C.52,74 D.74.52
【答案】D
【分析】根據聯表計算求參即可.
【詳解】因為.所以.又,所以.
.
【變式1】(22-23高二下·寧夏固原·期中)下面是一個列聯表,則表中處的值分別為( )
總計
25 73
21
總計 49
A.98,28 B.28,98 C.48,45 D.45,48
【答案】D
【分析】根據列聯表求解.
【詳解】解:由個列聯表知:

解得,
【變式2】(24-25高三·上海·課堂例題)某村莊對該村內70名村民每年是否體檢的情況進行了調查,統計數據如下表所示:
每年體檢(人) 每年未體檢(人) 合計(人)
老年人 7
年輕人 6
合計 70
已知抽取的村民中老年人、年輕人各25名,則對列聯表數據的分析錯誤的是( )
A. B. C. D.
【答案】A
【分析】根據題意先得出的值,進而再得的值,進而可知的值.
【詳解】因為抽取的村民中,老年人有25名,年輕人有25名,所以,
所以,A、B對;
所以,則對;
則錯.
故選:.
【變式3】(2024上·江西新余·高二統考期末)某地政府為解除空巢老人日常護理和社會照料的困境,大力培育發展養老護理服務市場.從年開始新建社區養老機構,下表為該地區近年新建社區養老機構的數量對照表.
年份 2017 2018 2019 2020 2021 2022 2023
年份代碼 1 2 3 4 5 6 7
新建社區養老機構
(1)若該地區參與社區養老的老人的年齡近似服從正態分布,其中年齡的有人,試估計該地參與社區養老的老人有多少?(結果按四舍五入取整數)
(2)已知變量與之間的樣本相關系數,請求出關于的線性回歸方程,并據此估計年時,該地區新建社區養老機構的數量.(結果按四舍五入取整數)
參考公式與數據:①,.;
②若隨機變量,則,,;
③,.
【答案】(1)約為人
(2)回歸方程為;約為個.
【分析】(1)利用原則求出的值,即可求得該地參與社區養老的老人人數為;
(2)計算出的值,可求出的值,可求得的值,利用參考數據可求得的值,由此可得出回歸直線方程,然后將代入回歸直線方程可得結果.
【詳解】(1)解:由題意可知,,,則,,
所以,

所以,估計該地參與社區養老的老人人數為.
(2)解:由表格中的數據可得,
所以,,
由已知條件可得,
所以,,
所以,,
又因為,
顯然,解得,則,
所以,關于的回歸直線方程為,
當時,.
估計年時,該地區新建社區養老機構的數量約為個.
【變式3】某高校有10 000名學生,其中女生3 000名,男生7 000名.為調查愛好體育運動是否與性別有關,用分層抽樣的方法抽取120名學生,制成獨立性檢驗的2×2列聯表,如表,則a-b________.(用數字作答)
男 女 合計
愛好體育運動 a 9 ####
不愛好體育運動 28 b ####
合計 #### #### 120
【答案】19
【解析】 根據分層抽樣原理,計算抽取男生120×84(人),
女生120×36(人),
所以a84-28580(人),b36-927(人),
所以a-b580-2729(人).
題型03 卡方的計算
【典例3】(23-24高二下·福建漳州·期中)為加強素質教育,使學生各方面全面發展,某學校對學生文化課與體育課的成績進行了調查統計,結果如下:附:,其中.
體育課不及格 體育課及格 合計
文化課及格 57 221 278
文化課不及格 16 43 59
合計 73 264 337
在對體育課成績與文化課成績進行獨立性檢驗時,根據以上數據可得到的值為( )
A.38.214 B.1.255 C.0.0037 D.2.058
【答案】C
【分析】由卡方公式計算即可.
【詳解】,
【變式1】(24-25高三·上海·隨堂練習)研究兩個事件A、B之間的關系時,根據數據信息列出如下的列聯表,則以下計算公式中正確的是( )
B B 總計
A
A
總計 n
A. B.
C. D.
【答案】A
【分析】根據獨立性檢驗計算公式代入即可得到答案;
【詳解】根據獨立性檢驗計算,
.
【變式2】(23-24高二下·廣東肇慶·期末)已知某獨立性檢驗中,由計算出,若將列聯表中的數據分別變成,計算出的,則( )
A. B. C. D.
【答案】C
【分析】根據卡方公式代入計算可得.
【詳解】因為,
所以.
【變式3】(23-24高二下·甘肅白銀·期末)有甲、乙兩種過濾水中重金屬的設備,為了檢驗使用這兩種設備與過濾后水中重金屬含量的關系,各過濾了15瓶受重金屬污染的相同水體,調查得出以下數據:
重金屬含量高 重金屬含量低
設備甲 6 9
設備乙 1 14
根據以上數據,則( )
A. B. C. D.
【答案】A
【分析】先完成列聯表,然后根據公式求解即可.
【詳解】由題意得到如下2×2列聯表:
重金屬含量高 重金屬含量低 合計
設備甲 6 9 15
設備乙 1 14 15
合計 7 23 30
所以.
【變式4】(23-24高二上·江西九江·期末)假設有兩個變量和,它們的取值分別為和,其列聯表為( )
根據以下選項中的數據計算的值,其中最大的一組為( )
A.
B.
C.
D.
【答案】D
【分析】計算出四個選項中,比較大小即可得解.
【詳解】對于A,,
對于B,,
對于C,,
對于D,,
顯然最大,故C正確.
.
題型04 由χ2進行獨立性檢驗
【典例4】(2025高三·全國·專題練習)為了判斷高三年級學生是否選修文科與性別的關系,現隨機抽取70名學生,得到如下列聯表:
理科 文科
男 13 10
女 7 20
0.05 0.025
3.841 5.024
根據表中數據,得到.則認為選修文科與性別有關系出錯的可能性不大于 .
【答案】0.05
【分析】根據觀測值以及獨立性檢驗的基本思想即可得出結果.
【詳解】因為,這表明小概率事件發生.
根據假設檢驗的基本原理,應該斷定“是否選修文科與性別之間有關系”不成立,
并且這種判斷出錯的可能性不大于0.05.
故答案為:0.05.
【變式1】(24-25高三·上海·課堂例題)在獨立性檢驗中,為了調查變量與變量的關系,經過計算得到,表示的意義是 (填序號).
①有的把握認為變量與變量沒有關系;
②有的把握認為變量與變量有關系;
③有的把握認為變量與變量有關系;
④有的把握認為變量與變量沒有關系.
【答案】③④
【分析】由獨立性檢驗中觀測值和臨界值的意義,即可得出正確的答案.
【詳解】在獨立性檢驗中,由
表示的意義是:有的把握認為變量與變量沒有關系,所以④正確;
即有的把握認為變量與變量有關系,所以③正確.
故答案為:③④
【變式2】(23-24高二下·遼寧葫蘆島·期末)一部年代創業劇《乘風踏浪》,讓遼寧葫蘆島成為許多人心馳神往的旅游度假目的地.為了更好地了解游客需求,優化自身服務,提高游客滿意度,隨機對1200位游客進行了滿意度調查,結果如下表:
男性 女性 合計
滿意 5800 540 1100
不滿意 40 80 100
合計 800 800 1200
根據列聯表中的數據,經計算得到 (精確到0.001);依據數據可作出的判斷是 .
附:.
0.1 0.05 0.01
2.706 3.841 6.635
【答案】 滿意度與性別有關聯,推斷犯錯誤的概率不大于0.05(或:有的把握認為滿意度與性別有關).
【分析】代入的計算公式,再和臨界值比較,得到結論.
【詳解】,
所以滿意度與性別有關聯,推斷犯錯誤的概率不大于(或:有的把握認為滿意度與性別有關)
故答案為:;滿意度與性別有關聯,推斷犯錯誤的概率不大于(或:有的把握認為滿意度與性別有關)
【變式3】(24-25高三上·上海·單元測試)某市政府調查市民收入增減與旅游需求的關系時,采用獨立性檢驗法抽查了7000人,計算發現,根據這一數據,市政府斷言市民收入增減與旅游需求有關的可信度是 %.參考數據:
P 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 2.072 2.706 3.841 5.024 6.635 7.879 10.828
【答案】97.5
【分析】根據獨立性檢驗知識,對照表格中的數據分析即可.
【詳解】由,
可知市政府斷言市民收入增減與旅游需求有關的可信度是97.5%,
故答案為:97.5
【變式4】(2024高三·全國·專題練習)一醫療團隊為研究某地的一種地方性疾病與當地居民的衛生習慣(衛生習慣分為良好和不夠良好兩類)的關系,在已患該疾病的病例中隨機調查了100例(稱為病例組),同時在未患該疾病的人群中隨機調查了100人(稱為對照組),得到如下數據:
不夠良好 良好
病例組 40 80
對照組 10 90
能否有99%的把握認為患該疾病群體與未患該疾病群體的衛生習慣有差異?
附,
0.070 0.010 0.001
k 3.841 6.635 10.828
【答案】答案見解析
【分析】由所給數據結合公式求出的值,將其與臨界值比較大小可得答案.
【詳解】由已知,,
又,,
所以有99%的把握認為患該疾病群體與未患該疾病群體的衛生習慣有差異.
題型05 利用獨立性檢驗思想解決實際問題
【典例5】(2025高三·全國·專題練習) 2022年北京冬奧組委發布的《北京2022年冬奧會和冬殘奧會經濟遺產報告(2022)》顯示,北京冬奧會已簽約45家贊助企業,冬奧會贊助成為一項跨度時間較長的營銷方式.為了解該45家贊助企業每天銷售額與每天線上銷售時間之間的相關關系,某平臺對45家贊助企業進行跟蹤調查,其中每天線上銷售時間不少于8小時的企業有20家,余下的企業中,每天的銷售額不足30萬元的企業占,統計后得到如下列聯表:
銷售額不少于30萬元 銷售額不足30萬元 合計
線上銷售時間不少于8小時 17 20
線上銷售時間不足8小時
合計 45
請完成上面的列聯表,并依據的獨立性檢驗,能否認為贊助企業每天的銷售額與每天線上銷售時間有關?
附:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
參考公式:,其中.
【答案】列聯表見解析,有關
【分析】由題意確定列聯表,求得,對比數據即可求解.
【詳解】由題意分析可得,簽約企業共45家,線上銷售時間不少于8小時的企業有20家,
那么線上銷售時間少于8小時的企業有25家,每天的銷售額不足30萬元的企業占,
共有.
完成列聯表如下:
銷售額不少于30萬元 銷售額不足30萬元 合計
線上銷售時間不少于8小時 17 3 20
線上銷售時間不足8小時 10 15 25
合計 27 18 45
所以.
對應的參數為6.635.而,
所以可判斷贊助企業每天的銷售額與每天線上銷售時間有關.
【變式1】(2025高三·全國·專題練習)為研究某種疫苗的效果,現對名志愿者進行了實驗,得到如下數據:
未感染病毒 感染病毒 合計
接種疫苗
未接種疫苗
合計
根據小概率值的獨立性檢驗,分析疫苗是否有效?
參考公式:,其中.
參考數據:.
【答案】疫苗有效,此推斷犯錯誤的概率不大于
【分析】由列聯表計算公式算出隨機變量的值,根據參考數據判斷疫苗是否有效.
【詳解】零假設為:接種疫苗與未接種疫苗與感染病毒無關,即疫苗無效.
根據列聯表可得.
因為當假設不成立時,,
所以根據小概率值的獨立性檢驗,我們推斷不不成立,
即疫苗有效,此推斷犯錯誤的概率不大于.
【變式2】(2024·河南信陽·二模)某社區對安全衛生進行問卷調查,請居民對社區安全衛生服務給出評價(問卷中設置僅有滿意、不滿意).現隨機抽取了90名居民,調查情況如下表:
男居民 女居民 合計
滿意 25 80
不滿意 a 2a
合計 90
(1)利用分層抽樣的方法從對安全衛生服務評價為不滿意的居民中隨機抽取6人,再從這6人中隨機抽取2人,求這2人中男、女居民各有1人的概率;
(2)試通過計算判斷能否在犯錯誤的概率不超過0.05的情況下認為男居民與女居民對社區安全衛生服務的評價有差異
附:.
合計 45 45 90
用分層抽樣抽取6人,則男居民應抽取2人,女居民應抽取4人,
所以所抽取的2人中男、女居民各有1人的概率為;
(2)由,
所以在犯錯的概率不超過0.05的前提下,
可以認為男居民與女居民對社區安全衛生服務的評價有差異.
【變式3】(24-25高三上·湖南·期中)電動車的安全問題越來越引起廣大消費者的關注,目前電動車的電池有石墨烯電池與鉛酸電池兩種.某公司為了了解消費者對兩種電池的電動車的偏好,在社會上隨機調查了700名市民,其中被調查的女性市民中偏好鉛酸電池電動車的占,得到以下的2-2列聯表:
偏好石墨烯電池電動車 偏好鉛酸電池電動車 合計
男性市民 200 100
女性市民
合計 700
(1)根據以上數據,完成2×2列聯表,依據小概率的獨立性檢驗,能否認為市民對這兩種電池的電動車的偏好與性別有關;
(2)采用分層抽樣的方法從偏好石墨烯電池電動車的市民中隨機抽取7人,再從這7名市民中抽取2人進行座談,求在有女性市民參加座談的條件下,恰有一名女性市民參加座談的概率;
(3)用頻率估計概率,在所有參加調查的市民中按男性和女性進行分層抽樣,隨機抽取5名市民,再從這5名市民中隨機抽取2人進行座談,記2名參加座談的市民中來自偏好石墨烯電池電動車的男性市民的人數為X,求X的分布列和數學期望.
參考公式:,其中.
參考數據:
0.100 0.070 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
合計 280 220 700
零假設:市民對這兩種電池的電動車的偏好與市民的性別無關,
根據列聯表中的數據可以求得

由于,
根據小概率值的獨立性檢驗,我們推斷不不成立,
即認為市民對這兩種電池的電動車的偏好與市民的性別有關.
(2)因為偏好石墨烯電池電動車的市民中,男性市民與女性市民的比為,
所以



故X的分布列如下:
X 0 1 2
P
.
題型06 獨立性檢驗中的參數與最值問題
【典例6】(24-25高二下·全國·課后作業)為了更好地開展多媒體化教學,杭州市某小學對“文理學科教師與喜歡用平板教學”是否有關做了一次研究調查,其中被調查的文科、理科教師人數相同,理科教師喜歡用平板教學的人數占理科教師總人數的80%,文科教師喜歡用平板教學的人數占文科教師總人數的40%,若有95%的把握認為是否喜歡用平板教學和文理學科有關,則調查人數中理科教師人數最少可能是( )
附:,其中.
0.05 0.010
3.841 6.635
A.8 B.12 C.15 D.20
【答案】D
【分析】利用獨立性檢驗列聯表及觀測值可解得答案.
【詳解】由題意被調查的文理科教師人數相同,設理科教師的人數為,由題意可列出列聯表:
理科教師 文科教師 合計
喜歡用平板教學
不喜歡用平板教學
合計

由于有的把握認為是否喜歡用平板教學和文理學科有關,
所以,
解得,因為,
故的可能取值為:12,13,14,15,16,17,18,19,
即理科教師的人數可以是:12,13,14,15,16,17,18,19,且考慮到喜歡用平板的人數占理科教師總人數的,故人數為15人時,有實際意義.
【變式1】(23-24高二下·浙江·期中)為了考查一種新疫苗預防某X疾病的效果,研究人員對一地區某種動物進行試驗,從該試驗群中隨機進行了抽查,已知抽查的接種疫苗的動物數量是沒接種疫苗的2倍,接種且發病占接種的,沒接種且發病的占沒接種的,若本次抽查得出“在犯錯誤的概率不超過0.05的前提下認為接種該疫苗與預防某X疾病有關”的結論,則被抽查的沒接種動物至少有( )只
0.10 0.05 0.01 0.005 0.001
2.706 3.841 5.635 7.879 10.828
A.35 B.36 C.37 D.38
【答案】C
【分析】根據題意列出二聯表,即可由卡方公式求解即可.
【詳解】設沒接種只數為k,依題意,得2×2列聯表如下:
發病 沒發病 合計
接種 2k
沒接種 k
合計 3k
則的觀測值為:,因為本次調查得出“在犯錯誤的概率不超過0.05的前提下認為喜愛足球與性別有關的結論,
于是,即,即
∴,∴

【變式2】(23-24高二下·吉林長春·期中)2020年2月,全國掀起了“停課不停學”的熱潮,各地教師通過網絡直播 微課推送等多種方式來指導學生線上學習.為了調查學生對網絡課程的熱愛程度,研究人員隨機調查了相同數量的男 女學生,發現有80%的男生喜歡網絡課程,有40%的女生不喜歡網絡課程,在犯錯誤的概率大于0.001且不超過0.01的前提下認為是否喜歡網絡課程與性別有關,則被調查的男 女學生總數量可能為( )
附:,其中.
0.1 0.05 0.01 0.001
2.706 3.841 6.635 10.828
A.130 B.190 C.240 D.270
【答案】C
【分析】設男、女學生的人數都為,可得列聯表,由獨立性檢驗算出,結合觀測值和選項可得答案.
【詳解】依題意,設男、女學生的人數都為,則男、女學生的總人數為,可得列聯表如下,
喜歡網絡課程 不喜歡網絡課程 總計
男生
女生
總計
故,
由題意可得,
所以,結合選項可知,只有B符合題意.
.
【變式3】(23-24高二下·廣東中山·期末)某市舉行了首屆閱讀大會,為調查市民對閱讀大會的滿意度,相關部門隨機抽取男女市民各名,每位市民對大會給出滿意或不滿意的評價,得到下面列聯表:
滿意 不滿意
男市民
女市民
當,時,若在的情況下,我們沒有充分的證據推斷男、女市民對大會的評價有差異,則的最小值為 .
附:,其中.
【答案】
【分析】根據定義算出的表達式,由題意得,結合可得出的最小值.
【詳解】由題意得,
并令,即,
近似解得,即,注意到,
故的最小值為.
故答案為:.
一、單選題
1.(23-24高二下·陜西咸陽·階段練習)下列關于獨立性檢驗的說法正確的是( )
A.獨立性檢驗是對兩個變量是否具有線性相關關系的一種檢驗
B.獨立性檢驗可以確定兩個變量之間是否具有某種關系
C.利用獨立性檢驗推斷吸煙與患肺病的關聯中,若有的把握認為吸煙與患肺病有關系時,我們則可以說在100個吸煙的人中,有99人患肺病
D.在一個列聯表中,由計算得的值,則的值越大,判斷兩個變量間有關聯的把握就越大
【答案】A
【分析】根據獨立性檢驗的意義分別判斷各選項.
【詳解】獨立性檢驗是通過卡方計算來判斷兩個變量存在關聯的可能性的一種方法,并非檢驗二者是否是線性相關,故A錯誤;
獨立性檢驗并不能確定兩個變量相關,故B錯誤;
是指“抽煙”和“患肺病”存在關聯的可能性大小,并非抽煙人中患肺病的發病率,故C錯誤;
根據卡方計算的定義可知,在一個列聯表中,由計算得的值,則的值越大,判斷兩個變量間有關聯的把握就越大,對于D正確.
故選:D.
2.(23-24高二·全國·單元測試)假設有兩個分類變量與的列聯表如下表:
對于以下數據,對同一樣本能說明與有關系的可能性最大的一組為( )
A.,,, B.,,,
C.,,, D.,,,
【答案】A
【分析】計算每個選項中的,比較大小后可得出結論.
【詳解】對于兩個分類變量與而言,的值越大,說明與有關系的可能性最大,
對于A選項,,
對于B選項,,
對于C選項,,
對于D選項,,
顯然D中最大,
.
3.(23-24高二下·福建寧德·階段練習)利用獨立性檢驗的方法調查高中生性別與愛好某項運動是否有關,通過隨機調查200名高中生是否愛好某項運動,利用2×2列聯表,由計算可得,參照下表:得到的正確結論是( )參考數據:臨界值表
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
A.有99%以上的把握認為“愛好該項運動與性別無關”
B.有99%以上的把握認為“愛好該項運動與性別有關”
C.在犯錯誤的概率不超過0.5%的前提下,認為“愛好該項運動與性別有關”
D.在犯錯誤的概率不超過0.5%的前提下,認為“愛好該項運動與性別無關”
【答案】C
【分析】根據與臨界值比較即可求解.
【詳解】因為,,
所以有99%以上的把握認為“愛好該項運動與性別有關”.
故選:B.
4.(23-24高二下·福建龍巖·階段練習)假設有兩個分類變量與,它們的可能取值分別為和,其列聯表為:則當取下面何值時,與的關系最弱( )
10 18
26
A.8 B.9 C.14 D.19
【答案】D
【分析】利用分類變量的相關性進行計算求解.
【詳解】在兩個分類變量的列聯表中,當的值越小時,認為兩個分類變量有關的可能性越小.
令,得,解得,
所以當時,與的關系最弱,故A,B,D均不符合題意.

5.(21-22高二上·全國·課后作業)有甲、乙兩個班級進行數學考試,按照大于等于85分為優秀,85分以下為非優秀統計成績,得到如下所示的列聯表:
優秀 非優秀 總計
甲班 10 b
乙班 c 30
總計 105
已知在全部105人中隨機抽取1人,成績優秀的概率為,則下列說法正確的是(  )
A.列聯表中c的值為30,b的值為35
B.列聯表中c的值為15,b的值為70
C.根據列聯表中的數據,若按95%的可靠性要求,能認為“成績與班級有關系”
D.根據列聯表中的數據,若按95%的可靠性要求,不能認為“成績與班級有關系”
【答案】D
【分析】根據卡方的計算即可與臨界值比較求解.
【詳解】由題意知,105人中隨機抽取1人,成績優秀的概率為,故成績優秀的學生數是,成績非優秀的學生數是,所以,
故二聯表為
優秀 非優秀 總計
甲班 10 45 55
乙班 20 30 70
總計 30 75 105
選項A、B錯誤.根據列聯表中的數據,得到χ2,因此有95%的把握認為“成績與班級有關系”,選項C正確.
6.(21-22高二上·全國·課后作業)兩個分類變量X和Y,值域分別為和,其樣本頻數分別是,,.若X與Y有關系的可信程度不小于,則c等于(  )
A.3 B.7 C.5 D.6
【答案】A
【分析】根據列聯表,以及獨立檢驗隨機變量的臨界值參考表,計算對應的值,驗證時,是否恰好滿足即可.
【詳解】根據隨機變量的列聯表,
總計
10 21 31
c d 35
總計 66
以及獨立檢驗隨機變量的臨界值參考表:
0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
故的觀測值
當時,,當時,,
當時,,當時,,
故只有A選項對應的X與Y有關系的可信程度不小于.
.
7.(24-25高三·上海·課堂例題)為了調查各參賽人員對主辦方的滿意程度,研究人員隨機抽取了700名參賽運動員進行調查,所得數據如下表所示,現有如下說法:①在參與調查的700名運動員中任取1人,抽到對主辦方表示滿意的男性運動員的概率為;②在犯錯誤的概率不超過的前提下可以認為“是否對主辦方表示滿意與運動員的性別有關”;③沒有的把握認為“是否對主辦方表示滿意與運動員的性別有關”;則正確命題的個數為( )
男性運動員(人) 女性運動員(人)
對主辦方表示滿意 200 220
對主辦方表示不滿意 70 30
注:
0.800 0.070 0.010 0.001
2.706 3.841 6.635 10.828
A.0 B.1 C.2 D.3
【答案】C
【分析】命題①,根據條件,利用古典概率公式,求出概率,即可判斷命題①的正誤;根據表中數據,求出,即可判斷出命題②和③的正誤,即可求解.
【詳解】因為對主辦方表示滿意的男性運動員的人數為,
所以在參與調查的700名運動員中任取1人,抽到對主辦方表示滿意的男性運動員的概率為,所以命題①錯誤,
又因為,所以命題②錯誤,命題③正確,
.
8.(23-24高二下·河南鄭州·期末)某校乒乓球社團為了解喜歡乒乓球運動是否與性別有關,隨機抽取了若干人進行調查.已知抽查的男生 女生人數均為,其中男生喜愛乒乓球運動的人數占男生人數的,女生喜愛乒乓球運動的人數占女生人數的.若本次調查得出“有的把握認為喜愛乒乓球運動與性別有關”的結論,則的最小值為( )
附:參考公式及數據:.
0.10 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.20 B.21 C.22 D.23
【答案】A
【分析】依題意,作出列聯表,計算的值,依題意,須使的值不小于小概率對應的,求解不等式即得.
【詳解】依題意,作出列聯表:
男生 女生 合計
喜愛乒乓球運動
不喜愛乒乓球運動
合計
則,
因本次調查得出“有的把握認為喜愛乒乓球運動與性別有關”的結論,故得,
解得,因,故的最小值為23.
.
二、多選題
9.(23-24高二下·吉林白山·期末)暑假結束后,為了解假期中學生鍛煉身體情況,學生處對所有在校學生做問卷調查,并隨機抽取了180人的調查問卷,其中男生比女生少20人,并將調查結果繪制得到等高堆積條形圖.已知,其中,,在被調查者中,下列說法正確的是( )
A.男生中不經常鍛煉的人數比女生中經常鍛煉的人數多
B.男生中經常鍛煉的人數比女生中經常鍛煉的人多8人
C.經常鍛煉者中男生的頻率是不經常鍛煉者中男全的頻率的1.6倍左右
D.在犯錯誤的概率不大于0.01的條件下,可以認為假期是否經常鍛煉與性別有關
【答案】CCD
【分析】根據男生比女生少20人,建立等式求出男生、女生的人數,建立列聯表,利用列聯表中的信息解決ABC,利用獨立性檢驗來解決D選項.
【詳解】解:設男生人數為,則女生人數為,
由題得,
解得,即在被調查者中,男 女生人數為80,100,可得到如下列聯表,
性別 鍛煉情況 合計
經常鍛煉 不經常鍛煉
男 48 32 80
女 40 80 100
合計 88 92 180
由表可知,A顯然錯誤,
男生中經常鍛煉的人數比女生中經常鍛煉的人數多B正確;
在經常鍛煉者中是男生的頻率為,在不經常鍛煉者中是男生的頻率為C正確;
零假設:假期是否經常鍛煉與性別無關,
則,根據小概率值的獨立性檢驗,我們推斷不不成立,
即認為假期是否經常鍛煉與性別有關,此推斷犯錯誤概率不大于0.01,D正確,
CD.
10.(23-24高二下·重慶·期末)為考察某種藥物預防疾病的效果,進行動物實驗,得到如下藥物結果與動物實驗的數據:
患病 未患病
服用藥 10 45
沒服用藥 20 30
由上述數據得出下列結論,其中正確的是( )
附:;
0.05 0.025 0.010 0.005
3.841 5.024 6.635 7.879
A.根據小概率值的獨立性檢驗,推斷服用藥物是有效的,此推斷犯錯誤的概率不超過0.025
B.根據小概率值的獨立性檢驗,推斷服用藥物是有效的,此推斷犯錯誤的概率不超過0.01
C.該藥物的預防有效率超過
D.若將所有試驗數據都擴大到原來的10倍,根據小概率值的獨立性檢驗,推斷服用藥物是有效的,此推斷犯錯誤的概率不超過0.005
【答案】AD
【分析】根據題意計算出的值,逐項分析即可.
【詳解】根據列聯表
患病 未患病 合計
服用藥 10 45 55
沒服用藥 20 30 70
合計 30 75 105
計算,
對于A,因為,所以根據小概率值的獨立性檢驗,推斷服用藥物是有效的,此推斷犯錯誤的概率不超過0.025,A正確;
對于B,因為根據小概率值的獨立性檢驗,推斷服用藥物是無效的,此推斷犯錯誤的概率不超過0.01,B錯誤;
對于C,可推斷該藥物的預防有效率超過,C錯誤;
對于D,若將所有試驗數據都擴大到原來的10倍,則根據小概率值的獨立性檢驗,推斷服用藥物是有效的,此推斷犯錯誤的概率不超過0.005,D正確;
D.
11.(24-25高三上·廣東深圳·階段練習)某中學為更好地開展素質教育,現對外出研學課程是否和性別有關做了一項調查,其中被調查的男生和女生人數相同,且男生中選修外出研學課程的人數占男生總人數的,女生中選修外出研學課程的人數占女生總人數的.如果依據的獨立性檢驗認為選修外出研學課程與性別有關,但依據的獨立性檢驗認為選修外出研學課程與性別無關,則調查人數中男生可能有( )
附:
,其中.
A.170人 B.225人
C.300人 D.375人
【答案】CC
【分析】設男生人數為,根據題意用表示出女生人數、男生中“選修外出研學課程”人數、女生中“選修外出研學課程”人數,進而表示出表格中其它人數,利用公式計算出,由得到的范圍,進而得到男生人數的范圍,選出符合題意的選項.
【詳解】設男生人數為,根據題意可得列聯表如下:
男生 女生 合計
選修外出研學課程
不選修外出研學課程
合計
則,
依據依據的獨立性檢驗認為選修外出研學課程與性別有關,但依據的獨立性檢驗認為選修外出研學課程與性別無關,
則,
解得,則.
C.
三、填空題
12.(24-25高三·上海·隨堂練習)隨著工業化以及城市車輛的增加,城市的空氣污染越來越嚴重,空氣質量指數API一直居高不下,對人體的呼吸系統造成了的嚴重的影響.現調查了某市700名居民的工作場所和呼吸系統健康狀況,得到列聯表如下,則 .(結果精確到0.001)
室外工作 室內工作 總計
有呼吸系統疾病 170
無呼吸系統疾病 100
總計 200
【答案】3.968
【分析】由題意,根據列聯表中所給數據補全列表,將數據代入公式得,計算即可得到答案.
【詳解】補全列聯表
室外工作 室內工作 總計
有呼吸系統疾病 170 200 370
無呼吸系統疾病 70 100 170
總計 200 300 700
.
故答案為:3.968.
13.(23-24高二下·河南信陽·期末)為了研究高三學生的性別和身高是否大于170cm的關聯性,調查了高三學生200名,得到如下列聯表:
性別 身高 合計
低于170cm 不低于170cm
女 80 20 100
男 30 70 100
合計 110 90 200
根據列聯表的數據,計算得 ;依據小概率值 的獨立性檢驗,認為“高三學生的性別和身高有關聯”.
附:臨界值表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
14.(23-24高三上·寧夏銀川·階段練習)有甲、乙兩個班級共計105 人進行數學考試,按照大于等于85分為優秀,85分以下為非優秀統計成績,得到如下所示的列聯表:
優秀 非優秀 總計
甲班 10 b
乙班 c 30
附: 其中.
0.10 0.05 0.025 0.010 0.0005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
已知在全部 105人中隨機抽取1人,成績優秀的概率為 ,則下列說法正確的是
①列聯表中c的值為30,b的值為35;
②列聯表中c的值為20,b的值為 45;
③根據列聯表中的數據,若按的可靠性要求,能認為“成績與班級有關系”;
④根據列聯表中的數據,若按的可靠性要求,不能認為“成績與班級有關系”.
【答案】②③
【分析】由成績優秀的概率,可求的成績優秀的人數,進而求出非優秀人數,得到的值,計算的觀測值,對照題目中的表格,即可得到結論.
【詳解】由題意,在全部的105人中隨機抽取1人,成績優秀的概率為,
所以成績優秀的人數為人,非優秀的人數為人,
所以,故①錯誤,②正確;
則,
若按的可靠性要求,能認為“成績與班級有關系”,故③正確,④錯誤.
故答案為:②③.
【點睛】關鍵點睛:熟練掌握的計算方法是本題解決的關鍵.
四、解答題
15.(24-25高三·上海·課堂例題)為了調查商戶每天銷售額與每天線上銷售時間之間的相關關系,隨機選取45家商戶進行跟蹤調查,其中每日線上銷售時間不少于6小時的商戶有19家,余下的商戶中,每天的銷售額不足3萬元的占,統計后得到如下列聯表:
銷售額不少于3萬元(戶) 銷售額不足3萬元(戶) 合計
線上銷售時間不少于6小時 4 19
線上銷售時間不足6小時
合計 45
請完成上面的列聯表,并判斷是否有的把握認為“商戶每天銷售額與商戶每天線上銷售時間有關.”
參考公式:,其中.
0.70 0.40 0.25 0.15 0.010 0.05 0.025 0.010
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635
16.(23-24高二下·青海西寧·期末)某學校高三年級有學生1000人,經調查,其中770人經常參加體育鍛煉(稱為A類同學),另外270人不經常參加體育鍛煉(稱為B類同學).現用按比例分配的分層抽樣方法(按A類 B類分兩層)從該年級的學生中共抽查100人,如果以身高達到作為達標的標準,對抽取的100人,得到以下列聯表(單位:人):
身高達標 身高不達標 總計
經常參加體育鍛煉 40
不經常參加體育鍛煉 15
總計 100
(1)完成上表;
(2)依據的獨立性檢驗,能否認為經常參加體育鍛煉與身高達標有關系?
注:.
附表:
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
【答案】(1)表格見解析;
(2)無關聯.
【分析】(1)根據題目含義填寫表格即可,
(2)利用列聯表結合卡方計算求解即可.
【詳解】(1)填寫列聯表(單位:人)如下:
身高達標 身高不達標 總計
經常參加體育鍛煉 40 35 75
不經常參加體育鍛煉 10 15 25
總計 70 70 100
(2)零假設為:經常參加體育鍛煉與身高達標無關聯.
由列聯表中的數據,
.
根據的獨立性檢驗,沒有充分證據證明不不成立,即認為經常參加體育鍛煉與身高達標無關聯.
17.(24-25高三上·上海·期中)學校為了解學生對“公序良俗”的認知情況,設計了一份調查表,題目分為必答題和選答題.其中必答題是①、②、③共三道題,選答題為④、⑤、⑥、⑦、⑧、⑨、⑩共七道題,被調查者在選答題中自主選擇其中道題目回答即可.現從④、⑥、⑧、⑩四個題目中至少選答一道的學生中隨機抽取名學生進行調查,他們選答④、⑥、⑧、⑩的題目數及人數統計如表:
選答④、⑥、⑧、⑩的題目數 1道 2道 3道 4道
人數
(1)現規定:同時選答④、⑥、⑧、⑩的學生為“公序良俗”達人.學校還調查了這位學生的性別情況,研究男女生中“公序良俗”達人的大概比例,得到的數據如下表:
性別 “公序良俗”達人 非“公序良俗”達人 總計
男性
女性
總計
請完成上述列聯表,并根據小概率值的獨立性檢驗,分析“公序良俗”達人與性別是否有關.
(2)從這名學生中任選名,記表示這名學生選答④、⑥、⑧、⑩的題目數之差的絕對值,求隨機變量的分布和數學期望.
參考公式:,其中.附表見上圖.
【答案】(1)列聯表見解析,有關;
(2)分布列見解析,.
【分析】(1)根據題意,補全列聯表,求得,結合附表,即可得到結論;
(2)根據題意,得到隨機變量的可能有0,1,2,3,求得相應的概率,列出分布列,結合期望的公式,即可求解.
【詳解】(1)這100位學生中,“公序良俗”達人有20人,由此補全列聯表如下:
性別 “公序良俗”達人 非“公序良俗”達人 總計
男性 13 30 43
女性 7 70 57
總計 20 80 100
零假設:“公序良俗”達人與性別無關,
可得,
所以根據小概率值的獨立性檢驗,我們可推斷不不成立,即認為“公序良俗”達人與性別有關.
(2)由題意,隨機變量的可能有,,,,
可得,



所以的分布列如下:
0 1 2 3
所以數學期望.
18.(23-24高三下·湖南長沙·期中)新型冠狀病毒疫情已經嚴重影響了我們正常的學習、工作和生活.某市為了遏制病毒的傳播,利用各種宣傳工具向市民宣傳防治病毒傳播的科學知識.某校為了解學生對新型冠狀病毒的防護認識,對該校學生開展防疫知識有獎競賽活動,并從女生和男生中各隨機抽取30人,統計答題成績分別制成如下頻數分布表和頻率分布直方圖.規定:成績在80分及以上的同學成為“防疫標兵”.
名女生成績頻數分布表:
成績
頻數 10 10 6 4
附:
0.100 0.070 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
(1)根據以上數據,完成以下列聯表,并判斷是否有%的把握認為“防疫標兵”與性別有關;
男生 女生 合計
防疫標兵      
非防疫標兵      
合計      
(2)以樣本估計總體,以頻率估計概率,現從該校女生中隨機抽取人,其中“防疫標兵”的人數為,求隨機變量的分布列與數學期望.
【答案】(1)表格見解析,有%的把握認為“防疫標兵”與性別有關
(2)分布列見解析,
【分析】(1)分別分析男女生樣本中 “防疫標兵”和“非防疫標兵”人數,完成列聯表,再計算的數值,并與參考數值作比較得出結論;
(2)從該校女生中隨機抽取4人,則“防疫標兵”的人數,服從二項分布,分別求出概率從而得到分布列,
X的可能取值為.
,,,,.
所以隨機變量的分布列為
X 0 1 2 3 4
P
數學期望為.
19.(2024·吉林長春·一模)某醫學研究團隊經過研究初步得出檢測某種疾病的患病與否和某項醫學指標有關,利用該指標制定一個檢測標準,需要確定臨界值,將該指標大于的人判定為陽性(患病),小于或等于的人判定為陰性(未患病).此檢測標準的漏診率是將患病者判定為陰性的概率;誤診率是將未患病者判定為陽性的概率.
(1)隨機抽取男女各700人進行檢驗,采用臨界值進行判定時,誤判共10人(漏診與誤診之和),其中2男8女,寫出列聯表,依據小概率值的獨立性檢驗,能否認為誤判與性別有關?
(2)經過大量調查,得到如下的患病者和未患病者該指標的頻率分布表:
指標 [95,100] (100,105] (105,110] (110,115] (115,120] (120,125] (125,130]
患病者頻率 0.01 0.06 0.17 0.18 0.2 0.2 0.18
指標 [70,75]
未患病者頻率 0.19 0.2 0.2 0.18 0.17 0.05 0.01
假設數據在組內均勻分布,以事件發生的頻率作為相應事件發生的概率.若漏診率和誤診率同時控制在以內(小于等于),求臨界值的范圍;
(3)在(2)條件下,求出誤判率(漏診率與誤診率之和)最小時的臨界值及對應的誤診率和漏診率.
附:
0.100 0.070 0.010 0.001
2.706 3.841 6.635 10.828
女性人數 8 492 700
總計 10 990 1000
由上表,,
故可以認為,依據小概率值的獨立性檢驗,沒有充分的證據證明零假設不不成立,即認為誤判與性別無關;
(2)因漏診率小于等于,由頻率分布表可知,臨界值應在內,
依題意,有;
又因誤診率小于等于,由頻率分布表可知,臨界值應在內,
依題意,有.
綜上,臨界值的范圍為;
(3)由(2)已得,設誤判率為,
當時,,
當時,

所以當時,誤判率最小,
相應的誤診率為,漏診率為:.
【點睛】關鍵點點睛:本題證據要考查獨立性檢驗、百分位數的應用,屬于較難題.
解決通過統計圖表求百分位數的問題,需要正確理解相關概念的具體含義,結合統計表或分布圖表,列出相應的方程或不等式求解.
21世紀教育網(www.21cnjy.com)第07講 獨立性檢驗
課程標準 學習目標
1.通過實例,理解2×2列聯表的統計意義. 2.通過實例,了解2×2列聯表獨立性檢驗及其應用. 1.理解獨立性檢驗的基本概念、原理和步驟; 2.學生應能夠運用所學的獨立性檢驗知識解決實際問題; 3.通過學習獨立性檢驗,培養數據處理和分析的能力.
知識點01 2×2列聯表
1.2×2列聯表的概念:
將隨機事件A,B的樣本數據整理成如下的表格
A 總計
B a b a+b
c d c+d
總計 a+c b+d a+b+c+d
上面這個表格中,核心的數據是中間的4個格子,所以這樣的表格通常稱為2×2列聯表
2.列聯表的統計意義:
記na+b+c+d,則由上表可知:
(1)事件A發生的概率可估計為P(A);
(2)事件B發生的概率可估計為P(B);
(3)事件AB發生的概率可估計為P(AB).
其他事件的概率類似可求.
【解讀】(1)2×2列聯表主要用于研究兩個事件之間是相互獨立的還是存在某種關聯性,它適用于分析兩個事件之間的關系;
(2)因為P(A),P(B),P(AB)都是根據樣本數據得到的估計值,而估計是有誤差的,因此直接用P(AB)P(A)P(B)是否不成立來判斷A與B是否獨立是不合理的.
【即學即練1】
1.為調查乘客暈車情況,在某一次行程中,70名男乘客中有25名暈車,30名女乘客中有5名暈車.在檢驗這些乘客暈車是否與性別相關時,常采用的數據分析方法是(  )
                                                                
A.回歸分析 B.獨立性檢驗
C.頻率分布直方圖 D.用樣本估計總體
2.下表是一個2×2列聯表:
y1 y2 總計
x1 a 21 73
x2 2 25 27
總計 b 46 100
則表中a、b處的值分別為(   )
A.94,96 B.52,70 
C.52,54 D.54,52
知識點02 獨立性檢驗
1.χ2(讀作“卡方”)統計量:是統計中一個非常有用的統計量,它的表達式是
χ2.
2.獨立性檢驗:任意給定一個α(稱為顯著性水平,通常取為0.05,0.01等),可以找到滿足條件P(χ2≥k)α的數k(稱為顯著性水平α對應的分位數).χ2是一個隨機變量,其分布能夠求出,上面的概率是可以計算的.因此,如果根據樣本數據算出χ2的值后,發現χ2≥k不成立,就稱在犯錯誤的概率不超過α的前提下,可以認為A與B不獨立(也稱為A與B有關);或說有1-α的把握認為A與B有關.若χ2【解讀】A與B獨立時,也稱為A與B無關.當χ2【即學即練2】已知P(χ2≥6.635)0.01,P(χ2≥10.828)0.001.在檢驗喜歡某項體育運動與性別是否有關的過程中,某研究員搜集數據并計算得到χ27.235,則根據小概率值α________的χ2獨立性檢驗,分析喜歡該項體育運動與性別有關.
題型01 利用列聯表分析兩變量的關系
【典例1】在對人們飲食習慣的一次調查中,共調查了124人,其中六十歲以上的70人,六十歲以下的54人.六十歲以上的人中有43人的飲食以蔬菜為主,另外27人則以肉類為主;六十歲以下的人中有21人飲食以蔬菜為主,另外33人則以肉類為主.請根據以上數據作出飲食習慣與年齡的列聯表,并利用與判斷二者是否有關系.
【變式1】假設有兩個分類變量X與Y,它們的可能取值分別為{x1,x2}和{y1,y2},其2×2列聯表為:
y1 y2
x1 10 18
x2 m 26
則當m取下面何值時,X與Y的關系最弱(   )
A.8 B.9
C.14 D.19
【變式2】下面是2×2列聯表.
A B
B1 B2 總計
A1 33 21 54
A2 a 13 46
總計 b 34 100
(1)表中a,b處的值應為多少?
(2)若用頻率估計概率,則P(A1),P(B1),P(A1B1)分別是多少?
(3)表中的數據能說明A1與B1相互獨立嗎?
【變式3】在一次對人們飲食習慣的調查中,共調查了124人,其中80歲以上的有70人,80歲以下的有54人.80歲以上的人中,有43人飲食以蔬菜為主,另外27人則以肉類為主;80歲以下的人中,有21人飲食以蔬菜為主,另外33人則以肉類為主.請根據以上數據作出飲食習慣與年齡的列聯表,并判斷二者是否有關系.
題型02 2×2列聯表的性質及應用
【典例2】(2025高三·全國·專題練習)下面是列聯表:
合計
21 73
22 25 47
合計 46 120
則表中,的值分別為( )
A.94,72 B.52,70 C.52,74 D.74.52
【變式1】(22-23高二下·寧夏固原·期中)下面是一個列聯表,則表中處的值分別為( )
總計
25 73
21
總計 49
A.98,28 B.28,98 C.48,45 D.45,48
【變式2】(24-25高三·上海·課堂例題)某村莊對該村內70名村民每年是否體檢的情況進行了調查,統計數據如下表所示:
每年體檢(人) 每年未體檢(人) 合計(人)
老年人 7
年輕人 6
合計 70
已知抽取的村民中老年人、年輕人各25名,則對列聯表數據的分析錯誤的是( )
A. B. C. D.
【變式3】(2024上·江西新余·高二統考期末)某地政府為解除空巢老人日常護理和社會照料的困境,大力培育發展養老護理服務市場.從年開始新建社區養老機構,下表為該地區近年新建社區養老機構的數量對照表.
年份 2017 2018 2019 2020 2021 2022 2023
年份代碼 1 2 3 4 5 6 7
新建社區養老機構
(1)若該地區參與社區養老的老人的年齡近似服從正態分布,其中年齡的有人,試估計該地參與社區養老的老人有多少?(結果按四舍五入取整數)
(2)已知變量與之間的樣本相關系數,請求出關于的線性回歸方程,并據此估計年時,該地區新建社區養老機構的數量.(結果按四舍五入取整數)
參考公式與數據:①,.;
②若隨機變量,則,,;
③,.
【變式3】某高校有10 000名學生,其中女生3 000名,男生7 000名.為調查愛好體育運動是否與性別有關,用分層抽樣的方法抽取120名學生,制成獨立性檢驗的2×2列聯表,如表,則a-b________.(用數字作答)
男 女 合計
愛好體育運動 a 9 ####
不愛好體育運動 28 b ####
合計 #### #### 120
題型03 卡方的計算
【典例3】(23-24高二下·福建漳州·期中)為加強素質教育,使學生各方面全面發展,某學校對學生文化課與體育課的成績進行了調查統計,結果如下:附:,其中.
體育課不及格 體育課及格 合計
文化課及格 57 221 278
文化課不及格 16 43 59
合計 73 264 337
在對體育課成績與文化課成績進行獨立性檢驗時,根據以上數據可得到的值為( )
A.38.214 B.1.255 C.0.0037 D.2.058
【變式1】(24-25高三·上海·隨堂練習)研究兩個事件A、B之間的關系時,根據數據信息列出如下的列聯表,則以下計算公式中正確的是( )
B B 總計
A
A
總計 n
A. B.
C. D.
【變式2】(23-24高二下·廣東肇慶·期末)已知某獨立性檢驗中,由計算出,若將列聯表中的數據分別變成,計算出的,則( )
A. B. C. D.
【變式3】(23-24高二下·甘肅白銀·期末)有甲、乙兩種過濾水中重金屬的設備,為了檢驗使用這兩種設備與過濾后水中重金屬含量的關系,各過濾了15瓶受重金屬污染的相同水體,調查得出以下數據:
重金屬含量高 重金屬含量低
設備甲 6 9
設備乙 1 14
根據以上數據,則( )
A. B. C. D.
【變式4】(23-24高二上·江西九江·期末)假設有兩個變量和,它們的取值分別為和,其列聯表為( )
根據以下選項中的數據計算的值,其中最大的一組為( )
A.
B.
C.
D.
題型04 由χ2進行獨立性檢驗
【典例4】(2025高三·全國·專題練習)為了判斷高三年級學生是否選修文科與性別的關系,現隨機抽取70名學生,得到如下列聯表:
理科 文科
男 13 10
女 7 20
0.05 0.025
3.841 5.024
根據表中數據,得到.則認為選修文科與性別有關系出錯的可能性不大于 .
【變式1】(24-25高三·上海·課堂例題)在獨立性檢驗中,為了調查變量與變量的關系,經過計算得到,表示的意義是 (填序號).
①有的把握認為變量與變量沒有關系;
②有的把握認為變量與變量有關系;
③有的把握認為變量與變量有關系;
④有的把握認為變量與變量沒有關系.
【變式2】(23-24高二下·遼寧葫蘆島·期末)一部年代創業劇《乘風踏浪》,讓遼寧葫蘆島成為許多人心馳神往的旅游度假目的地.為了更好地了解游客需求,優化自身服務,提高游客滿意度,隨機對1200位游客進行了滿意度調查,結果如下表:
男性 女性 合計
滿意 5800 540 1100
不滿意 40 80 100
合計 800 800 1200
根據列聯表中的數據,經計算得到 (精確到0.001);依據數據可作出的判斷是 .
附:.
0.1 0.05 0.01
2.706 3.841 6.635
【變式3】(24-25高三上·上海·單元測試)某市政府調查市民收入增減與旅游需求的關系時,采用獨立性檢驗法抽查了7000人,計算發現,根據這一數據,市政府斷言市民收入增減與旅游需求有關的可信度是 %.參考數據:
P 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 2.072 2.706 3.841 5.024 6.635 7.879 10.828
【變式4】(2024高三·全國·專題練習)一醫療團隊為研究某地的一種地方性疾病與當地居民的衛生習慣(衛生習慣分為良好和不夠良好兩類)的關系,在已患該疾病的病例中隨機調查了100例(稱為病例組),同時在未患該疾病的人群中隨機調查了100人(稱為對照組),得到如下數據:
不夠良好 良好
病例組 40 80
對照組 10 90
能否有99%的把握認為患該疾病群體與未患該疾病群體的衛生習慣有差異?
附,
0.070 0.010 0.001
k 3.841 6.635 10.828
題型05 利用獨立性檢驗思想解決實際問題
【典例5】(2025高三·全國·專題練習) 2022年北京冬奧組委發布的《北京2022年冬奧會和冬殘奧會經濟遺產報告(2022)》顯示,北京冬奧會已簽約45家贊助企業,冬奧會贊助成為一項跨度時間較長的營銷方式.為了解該45家贊助企業每天銷售額與每天線上銷售時間之間的相關關系,某平臺對45家贊助企業進行跟蹤調查,其中每天線上銷售時間不少于8小時的企業有20家,余下的企業中,每天的銷售額不足30萬元的企業占,統計后得到如下列聯表:
銷售額不少于30萬元 銷售額不足30萬元 合計
線上銷售時間不少于8小時 17 20
線上銷售時間不足8小時
合計 45
請完成上面的列聯表,并依據的獨立性檢驗,能否認為贊助企業每天的銷售額與每天線上銷售時間有關?
附:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
參考公式:,其中.
【變式1】(2025高三·全國·專題練習)為研究某種疫苗的效果,現對名志愿者進行了實驗,得到如下數據:
未感染病毒 感染病毒 合計
接種疫苗
未接種疫苗
合計
根據小概率值的獨立性檢驗,分析疫苗是否有效?
參考公式:,其中.
參考數據:.
【變式2】(2024·河南信陽·二模)某社區對安全衛生進行問卷調查,請居民對社區安全衛生服務給出評價(問卷中設置僅有滿意、不滿意).現隨機抽取了90名居民,調查情況如下表:
男居民 女居民 合計
滿意 25 80
不滿意 a 2a
合計 90
(1)利用分層抽樣的方法從對安全衛生服務評價為不滿意的居民中隨機抽取6人,再從這6人中隨機抽取2人,求這2人中男、女居民各有1人的概率;
(2)試通過計算判斷能否在犯錯誤的概率不超過0.05的情況下認為男居民與女居民對社區安全衛生服務的評價有差異
附:.
【變式3】(24-25高三上·湖南·期中)電動車的安全問題越來越引起廣大消費者的關注,目前電動車的電池有石墨烯電池與鉛酸電池兩種.某公司為了了解消費者對兩種電池的電動車的偏好,在社會上隨機調查了700名市民,其中被調查的女性市民中偏好鉛酸電池電動車的占,得到以下的2-2列聯表:
偏好石墨烯電池電動車 偏好鉛酸電池電動車 合計
男性市民 200 100
女性市民
合計 700
(1)根據以上數據,完成2×2列聯表,依據小概率的獨立性檢驗,能否認為市民對這兩種電池的電動車的偏好與性別有關;
(2)采用分層抽樣的方法從偏好石墨烯電池電動車的市民中隨機抽取7人,再從這7名市民中抽取2人進行座談,求在有女性市民參加座談的條件下,恰有一名女性市民參加座談的概率;
(3)用頻率估計概率,在所有參加調查的市民中按男性和女性進行分層抽樣,隨機抽取5名市民,再從這5名市民中隨機抽取2人進行座談,記2名參加座談的市民中來自偏好石墨烯電池電動車的男性市民的人數為X,求X的分布列和數學期望.
參考公式:,其中.
參考數據:
0.100 0.070 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
題型06 獨立性檢驗中的參數與最值問題
【典例6】(24-25高二下·全國·課后作業)為了更好地開展多媒體化教學,杭州市某小學對“文理學科教師與喜歡用平板教學”是否有關做了一次研究調查,其中被調查的文科、理科教師人數相同,理科教師喜歡用平板教學的人數占理科教師總人數的80%,文科教師喜歡用平板教學的人數占文科教師總人數的40%,若有95%的把握認為是否喜歡用平板教學和文理學科有關,則調查人數中理科教師人數最少可能是( )
附:,其中.
0.05 0.010
3.841 6.635
A.8 B.12 C.15 D.20
【變式1】(23-24高二下·浙江·期中)為了考查一種新疫苗預防某X疾病的效果,研究人員對一地區某種動物進行試驗,從該試驗群中隨機進行了抽查,已知抽查的接種疫苗的動物數量是沒接種疫苗的2倍,接種且發病占接種的,沒接種且發病的占沒接種的,若本次抽查得出“在犯錯誤的概率不超過0.05的前提下認為接種該疫苗與預防某X疾病有關”的結論,則被抽查的沒接種動物至少有( )只
0.10 0.05 0.01 0.005 0.001
2.706 3.841 5.635 7.879 10.828
A.35 B.36 C.37 D.38
【變式2】(23-24高二下·吉林長春·期中)2020年2月,全國掀起了“停課不停學”的熱潮,各地教師通過網絡直播 微課推送等多種方式來指導學生線上學習.為了調查學生對網絡課程的熱愛程度,研究人員隨機調查了相同數量的男 女學生,發現有80%的男生喜歡網絡課程,有40%的女生不喜歡網絡課程,在犯錯誤的概率大于0.001且不超過0.01的前提下認為是否喜歡網絡課程與性別有關,則被調查的男 女學生總數量可能為( )
附:,其中.
0.1 0.05 0.01 0.001
2.706 3.841 6.635 10.828
A.130 B.190 C.240 D.270
【變式3】(23-24高二下·廣東中山·期末)某市舉行了首屆閱讀大會,為調查市民對閱讀大會的滿意度,相關部門隨機抽取男女市民各名,每位市民對大會給出滿意或不滿意的評價,得到下面列聯表:
滿意 不滿意
男市民
女市民
當,時,若在的情況下,我們沒有充分的證據推斷男、女市民對大會的評價有差異,則的最小值為 .
附:,其中.
一、單選題
1.(23-24高二下·陜西咸陽·階段練習)下列關于獨立性檢驗的說法正確的是( )
A.獨立性檢驗是對兩個變量是否具有線性相關關系的一種檢驗
B.獨立性檢驗可以確定兩個變量之間是否具有某種關系
C.利用獨立性檢驗推斷吸煙與患肺病的關聯中,若有的把握認為吸煙與患肺病有關系時,我們則可以說在100個吸煙的人中,有99人患肺病
D.在一個列聯表中,由計算得的值,則的值越大,判斷兩個變量間有關聯的把握就越大
2.(23-24高二·全國·單元測試)假設有兩個分類變量與的列聯表如下表:
對于以下數據,對同一樣本能說明與有關系的可能性最大的一組為( )
A.,,, B.,,,
C.,,, D.,,,
3.(23-24高二下·福建寧德·階段練習)利用獨立性檢驗的方法調查高中生性別與愛好某項運動是否有關,通過隨機調查200名高中生是否愛好某項運動,利用2×2列聯表,由計算可得,參照下表:得到的正確結論是( )參考數據:臨界值表
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
A.有99%以上的把握認為“愛好該項運動與性別無關”
B.有99%以上的把握認為“愛好該項運動與性別有關”
C.在犯錯誤的概率不超過0.5%的前提下,認為“愛好該項運動與性別有關”
D.在犯錯誤的概率不超過0.5%的前提下,認為“愛好該項運動與性別無關”
4.(23-24高二下·福建龍巖·階段練習)假設有兩個分類變量與,它們的可能取值分別為和,其列聯表為:則當取下面何值時,與的關系最弱( )
10 18
26
A.8 B.9 C.14 D.19
5.(21-22高二上·全國·課后作業)有甲、乙兩個班級進行數學考試,按照大于等于85分為優秀,85分以下為非優秀統計成績,得到如下所示的列聯表:
優秀 非優秀 總計
甲班 10 b
乙班 c 30
總計 105
已知在全部105人中隨機抽取1人,成績優秀的概率為,則下列說法正確的是(  )
A.列聯表中c的值為30,b的值為35
B.列聯表中c的值為15,b的值為70
C.根據列聯表中的數據,若按95%的可靠性要求,能認為“成績與班級有關系”
D.根據列聯表中的數據,若按95%的可靠性要求,不能認為“成績與班級有關系”
6.(21-22高二上·全國·課后作業)兩個分類變量X和Y,值域分別為和,其樣本頻數分別是,,.若X與Y有關系的可信程度不小于,則c等于(  )
A.3 B.7 C.5 D.6
7.(24-25高三·上海·課堂例題)為了調查各參賽人員對主辦方的滿意程度,研究人員隨機抽取了700名參賽運動員進行調查,所得數據如下表所示,現有如下說法:①在參與調查的700名運動員中任取1人,抽到對主辦方表示滿意的男性運動員的概率為;②在犯錯誤的概率不超過的前提下可以認為“是否對主辦方表示滿意與運動員的性別有關”;③沒有的把握認為“是否對主辦方表示滿意與運動員的性別有關”;則正確命題的個數為( )
男性運動員(人) 女性運動員(人)
對主辦方表示滿意 200 220
對主辦方表示不滿意 70 30
注:
0.800 0.070 0.010 0.001
2.706 3.841 6.635 10.828
A.0 B.1 C.2 D.3
8.(23-24高二下·河南鄭州·期末)某校乒乓球社團為了解喜歡乒乓球運動是否與性別有關,隨機抽取了若干人進行調查.已知抽查的男生 女生人數均為,其中男生喜愛乒乓球運動的人數占男生人數的,女生喜愛乒乓球運動的人數占女生人數的.若本次調查得出“有的把握認為喜愛乒乓球運動與性別有關”的結論,則的最小值為( )
附:參考公式及數據:.
0.10 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.20 B.21 C.22 D.23
二、多選題
9.(23-24高二下·吉林白山·期末)暑假結束后,為了解假期中學生鍛煉身體情況,學生處對所有在校學生做問卷調查,并隨機抽取了180人的調查問卷,其中男生比女生少20人,并將調查結果繪制得到等高堆積條形圖.已知,其中,,在被調查者中,下列說法正確的是( )
A.男生中不經常鍛煉的人數比女生中經常鍛煉的人數多
B.男生中經常鍛煉的人數比女生中經常鍛煉的人多8人
C.經常鍛煉者中男生的頻率是不經常鍛煉者中男全的頻率的1.6倍左右
D.在犯錯誤的概率不大于0.01的條件下,可以認為假期是否經常鍛煉與性別有關
10.(23-24高二下·重慶·期末)為考察某種藥物預防疾病的效果,進行動物實驗,得到如下藥物結果與動物實驗的數據:
患病 未患病
服用藥 10 45
沒服用藥 20 30
由上述數據得出下列結論,其中正確的是( )
附:;
0.05 0.025 0.010 0.005
3.841 5.024 6.635 7.879
A.根據小概率值的獨立性檢驗,推斷服用藥物是有效的,此推斷犯錯誤的概率不超過0.025
B.根據小概率值的獨立性檢驗,推斷服用藥物是有效的,此推斷犯錯誤的概率不超過0.01
C.該藥物的預防有效率超過
D.若將所有試驗數據都擴大到原來的10倍,根據小概率值的獨立性檢驗,推斷服用藥物是有效的,此推斷犯錯誤的概率不超過0.005
11.(24-25高三上·廣東深圳·階段練習)某中學為更好地開展素質教育,現對外出研學課程是否和性別有關做了一項調查,其中被調查的男生和女生人數相同,且男生中選修外出研學課程的人數占男生總人數的,女生中選修外出研學課程的人數占女生總人數的.如果依據的獨立性檢驗認為選修外出研學課程與性別有關,但依據的獨立性檢驗認為選修外出研學課程與性別無關,則調查人數中男生可能有( )
附:
,其中.
A.170人 B.225人
C.300人 D.375人
三、填空題
12.(24-25高三·上海·隨堂練習)隨著工業化以及城市車輛的增加,城市的空氣污染越來越嚴重,空氣質量指數API一直居高不下,對人體的呼吸系統造成了的嚴重的影響.現調查了某市700名居民的工作場所和呼吸系統健康狀況,得到列聯表如下,則 .(結果精確到0.001)
室外工作 室內工作 總計
有呼吸系統疾病 170
無呼吸系統疾病 100
總計 200
13.(23-24高二下·河南信陽·期末)為了研究高三學生的性別和身高是否大于170cm的關聯性,調查了高三學生200名,得到如下列聯表:
性別 身高 合計
低于170cm 不低于170cm
女 80 20 100
男 30 70 100
合計 110 90 200
根據列聯表的數據,計算得 ;依據小概率值 的獨立性檢驗,認為“高三學生的性別和身高有關聯”.
附:臨界值表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
14.(23-24高三上·寧夏銀川·階段練習)有甲、乙兩個班級共計105 人進行數學考試,按照大于等于85分為優秀,85分以下為非優秀統計成績,得到如下所示的列聯表:
優秀 非優秀 總計
甲班 10 b
乙班 c 30
附: 其中.
0.10 0.05 0.025 0.010 0.0005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
已知在全部 105人中隨機抽取1人,成績優秀的概率為 ,則下列說法正確的是
①列聯表中c的值為30,b的值為35;
②列聯表中c的值為20,b的值為 45;
③根據列聯表中的數據,若按的可靠性要求,能認為“成績與班級有關系”;
④根據列聯表中的數據,若按的可靠性要求,不能認為“成績與班級有關系”.
四、解答題
15.(24-25高三·上海·課堂例題)為了調查商戶每天銷售額與每天線上銷售時間之間的相關關系,隨機選取45家商戶進行跟蹤調查,其中每日線上銷售時間不少于6小時的商戶有19家,余下的商戶中,每天的銷售額不足3萬元的占,統計后得到如下列聯表:
銷售額不少于3萬元(戶) 銷售額不足3萬元(戶) 合計
線上銷售時間不少于6小時 4 19
線上銷售時間不足6小時
合計 45
請完成上面的列聯表,并判斷是否有的把握認為“商戶每天銷售額與商戶每天線上銷售時間有關.”
參考公式:,其中.
0.70 0.40 0.25 0.15 0.010 0.05 0.025 0.010
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635
16.(23-24高二下·青海西寧·期末)某學校高三年級有學生1000人,經調查,其中770人經常參加體育鍛煉(稱為A類同學),另外270人不經常參加體育鍛煉(稱為B類同學).現用按比例分配的分層抽樣方法(按A類 B類分兩層)從該年級的學生中共抽查100人,如果以身高達到作為達標的標準,對抽取的100人,得到以下列聯表(單位:人):
身高達標 身高不達標 總計
經常參加體育鍛煉 40
不經常參加體育鍛煉 15
總計 100
(1)完成上表;
(2)依據的獨立性檢驗,能否認為經常參加體育鍛煉與身高達標有關系?
注:.
附表:
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
17.(24-25高三上·上海·期中)學校為了解學生對“公序良俗”的認知情況,設計了一份調查表,題目分為必答題和選答題.其中必答題是①、②、③共三道題,選答題為④、⑤、⑥、⑦、⑧、⑨、⑩共七道題,被調查者在選答題中自主選擇其中道題目回答即可.現從④、⑥、⑧、⑩四個題目中至少選答一道的學生中隨機抽取名學生進行調查,他們選答④、⑥、⑧、⑩的題目數及人數統計如表:
選答④、⑥、⑧、⑩的題目數 1道 2道 3道 4道
人數
(1)現規定:同時選答④、⑥、⑧、⑩的學生為“公序良俗”達人.學校還調查了這位學生的性別情況,研究男女生中“公序良俗”達人的大概比例,得到的數據如下表:
性別 “公序良俗”達人 非“公序良俗”達人 總計
男性
女性
總計
請完成上述列聯表,并根據小概率值的獨立性檢驗,分析“公序良俗”達人與性別是否有關.
(2)從這名學生中任選名,記表示這名學生選答④、⑥、⑧、⑩的題目數之差的絕對值,求隨機變量的分布和數學期望.
參考公式:,其中.附表見上圖.
18.(23-24高三下·湖南長沙·期中)新型冠狀病毒疫情已經嚴重影響了我們正常的學習、工作和生活.某市為了遏制病毒的傳播,利用各種宣傳工具向市民宣傳防治病毒傳播的科學知識.某校為了解學生對新型冠狀病毒的防護認識,對該校學生開展防疫知識有獎競賽活動,并從女生和男生中各隨機抽取30人,統計答題成績分別制成如下頻數分布表和頻率分布直方圖.規定:成績在80分及以上的同學成為“防疫標兵”.
名女生成績頻數分布表:
成績
頻數 10 10 6 4
附:
0.100 0.070 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
(1)根據以上數據,完成以下列聯表,并判斷是否有%的把握認為“防疫標兵”與性別有關;
男生 女生 合計
防疫標兵      
非防疫標兵      
合計      
(2)以樣本估計總體,以頻率估計概率,現從該校女生中隨機抽取人,其中“防疫標兵”的人數為,求隨機變量的分布列與數學期望.
19.(2024·吉林長春·一模)某醫學研究團隊經過研究初步得出檢測某種疾病的患病與否和某項醫學指標有關,利用該指標制定一個檢測標準,需要確定臨界值,將該指標大于的人判定為陽性(患病),小于或等于的人判定為陰性(未患病).此檢測標準的漏診率是將患病者判定為陰性的概率;誤診率是將未患病者判定為陽性的概率.
(1)隨機抽取男女各700人進行檢驗,采用臨界值進行判定時,誤判共10人(漏診與誤診之和),其中2男8女,寫出列聯表,依據小概率值的獨立性檢驗,能否認為誤判與性別有關?
(2)經過大量調查,得到如下的患病者和未患病者該指標的頻率分布表:
指標 [95,100] (100,105] (105,110] (110,115] (115,120] (120,125] (125,130]
患病者頻率 0.01 0.06 0.17 0.18 0.2 0.2 0.18
指標 [70,75]
未患病者頻率 0.19 0.2 0.2 0.18 0.17 0.05 0.01
假設數據在組內均勻分布,以事件發生的頻率作為相應事件發生的概率.若漏診率和誤診率同時控制在以內(小于等于),求臨界值的范圍;
(3)在(2)條件下,求出誤判率(漏診率與誤診率之和)最小時的臨界值及對應的誤診率和漏診率.
附:
0.100 0.070 0.010 0.001
2.706 3.841 6.635 10.828
21世紀教育網(www.21cnjy.com)

展開更多......

收起↑

資源列表

<pre id="tfb94"><li id="tfb94"></li></pre>

<bdo id="tfb94"><rt id="tfb94"></rt></bdo>
  • <menu id="tfb94"><dl id="tfb94"></dl></menu><i id="tfb94"><acronym id="tfb94"><sub id="tfb94"></sub></acronym></i>

    1. 主站蜘蛛池模板: 桓仁| 南和县| 陇川县| 无为县| 始兴县| 即墨市| 安阳市| 衡水市| 齐河县| 阜城县| 富民县| 通榆县| 舟曲县| 鄂托克旗| 肥乡县| 屯昌县| 伊吾县| 邯郸县| 湖州市| 绩溪县| 汕头市| 稻城县| 南涧| 涿州市| 望都县| 葫芦岛市| 抚州市| 平和县| 嵊泗县| 托克逊县| 米林县| 都匀市| 清丰县| 定日县| 喀什市| 通许县| 沅陵县| 远安县| 信丰县| 长海县| 二连浩特市|