中文字幕精品无码一区二区,成全视频在线播放观看方法,大伊人青草狠狠久久,亚洲一区影音先锋色资源

新教材適用2023_2024學(xué)年高中數(shù)學(xué)第8章 成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析 學(xué)案(4份打包)

資源下載
  1. 二一教育資源

新教材適用2023_2024學(xué)年高中數(shù)學(xué)第8章 成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析 學(xué)案(4份打包)

資源簡(jiǎn)介

8.1 成對(duì)數(shù)據(jù)的統(tǒng)計(jì)相關(guān)性
學(xué)習(xí)目標(biāo)
1.結(jié)合實(shí)例了解樣本相關(guān)系數(shù)的統(tǒng)計(jì)含義.
2.了解樣本相關(guān)系數(shù)與“標(biāo)準(zhǔn)化”成對(duì)數(shù)據(jù)向量夾角的關(guān)系.
3.結(jié)合實(shí)例,會(huì)通過(guò)相關(guān)系數(shù)比較多組成對(duì)數(shù)據(jù)的相關(guān)性.
核心素養(yǎng)
1.通過(guò)畫(huà)散點(diǎn)圖來(lái)判斷變量的相關(guān)關(guān)系,提升數(shù)據(jù)分析素養(yǎng).
2.通過(guò)樣本相關(guān)系數(shù)的計(jì)算,培養(yǎng)數(shù)學(xué)運(yùn)算及邏輯推理素養(yǎng).
知識(shí)點(diǎn) 1 變量的相關(guān)關(guān)系
(1)兩個(gè)變量的關(guān)系
分類(lèi) 函數(shù)關(guān)系 相關(guān)關(guān)系
特征 兩變量有_確定__的關(guān)系 兩個(gè)變量有關(guān)系,但又沒(méi)有確切到可由其中一個(gè)去_精確地決定__另一個(gè)的程度
(2)散點(diǎn)圖:將樣本中的每一個(gè)序號(hào)下的成對(duì)數(shù)據(jù)用_直角坐標(biāo)系__中的點(diǎn)表示出來(lái)得到的統(tǒng)計(jì)圖.
(3)正相關(guān)與負(fù)相關(guān)
正相關(guān) 負(fù)相關(guān)
當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值也呈現(xiàn)_增加的趨勢(shì)__ 當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值呈現(xiàn)_減少的趨勢(shì)__
(4)線性相關(guān):如果兩個(gè)變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點(diǎn)落在_一條直線__附近,則稱(chēng)這兩個(gè)變量線性相關(guān).
想一想:正相關(guān)與負(fù)相關(guān)是對(duì)所有具有相關(guān)關(guān)系的兩個(gè)變量而言的,對(duì)嗎?
提示:不對(duì),正相關(guān)與負(fù)相關(guān)是針對(duì)線性相關(guān)關(guān)系而言的.
練一練:
下列兩個(gè)變量之間的關(guān)系是相關(guān)關(guān)系的是( D )
A.正方體的棱長(zhǎng)和體積
B.單位圓中角的弧度數(shù)和所對(duì)弧長(zhǎng)
C.當(dāng)畝產(chǎn)量為常數(shù)時(shí),土地面積和總產(chǎn)量
D.日照時(shí)間與水稻的畝產(chǎn)量
[解析] 選項(xiàng)A,B,C中兩個(gè)變量之間是函數(shù)關(guān)系,選項(xiàng)D中兩個(gè)變量之間是相關(guān)關(guān)系.
知識(shí)點(diǎn) 2 樣本的相關(guān)系數(shù)
(1)相關(guān)系數(shù):統(tǒng)計(jì)學(xué)里一般用r==來(lái)衡量y與x的_線性相關(guān)性的強(qiáng)弱__,這里的r稱(chēng)為樣本相關(guān)系數(shù)(簡(jiǎn)稱(chēng)相關(guān)系數(shù)).
(2)相關(guān)系數(shù)的性質(zhì)
1 _r>0__時(shí),成對(duì)數(shù)據(jù)正相關(guān);_r<0__時(shí),成對(duì)數(shù)據(jù)負(fù)相關(guān),-1≤r≤1.
2 |r|越小,兩個(gè)變量之間的線性相關(guān)程度越_弱__,|r|越大,兩個(gè)變量之間的線性相關(guān)程度越_強(qiáng)__.
3 |r|=1時(shí),成對(duì)數(shù)據(jù)構(gòu)成的點(diǎn)都在_一條確定的直線__上.
練一練:
對(duì)四組不同數(shù)據(jù)進(jìn)行統(tǒng)計(jì),獲得如圖所示的散點(diǎn)圖,對(duì)它們的樣本相關(guān)系數(shù)進(jìn)行比較,正確的是( A )
①樣本相關(guān)系數(shù)r1
②樣本相關(guān)系數(shù)r2
③樣本相關(guān)系數(shù)r3
④樣本相關(guān)系數(shù)r4
A.r2C.r4[解析] 由給出的四組數(shù)據(jù)的散點(diǎn)圖可以看出,圖①和圖③中的成對(duì)數(shù)據(jù)是正相關(guān)的,樣本相關(guān)系數(shù)大于0,圖②和圖④中的成對(duì)數(shù)據(jù)是負(fù)相關(guān)的,樣本相關(guān)系數(shù)小于0,圖①和圖②中的點(diǎn)相對(duì)更加集中于一條直線附近,所以相關(guān)性更強(qiáng),所以r1接近于1,r2接近于-1,由此可得r2題|型|探|究
題型一 相關(guān)關(guān)系的判斷
典例1 (多選)下列選項(xiàng)中,兩變量間具有相關(guān)關(guān)系的是( ACD )
A.一個(gè)人的身高與他(她)的體重之間的關(guān)系
B.曲線上的點(diǎn)與該點(diǎn)的坐標(biāo)之間的關(guān)系
C.蘋(píng)果的產(chǎn)量與氣候之間的關(guān)系
D.森林中的同一種樹(shù)木,其橫斷面直徑與高度之間的關(guān)系
[分析] 直接利用相關(guān)關(guān)系的定義逐一判斷即可.
[解析] 選項(xiàng)A,一般地,人的身高與體重是一種相關(guān)關(guān)系;選項(xiàng)B,曲線上的點(diǎn)與該點(diǎn)的坐標(biāo)是一種確定的對(duì)應(yīng)關(guān)系,不是相關(guān)關(guān)系;選項(xiàng)C,蘋(píng)果的產(chǎn)量與氣候之間的關(guān)系是一種相關(guān)關(guān)系;選項(xiàng)D,森林中的同一種樹(shù)木,其橫斷面直徑與高度之間的關(guān)系是相關(guān)關(guān)系.
[規(guī)律方法] 對(duì)相關(guān)關(guān)系的理解
(1)相關(guān)關(guān)系與函數(shù)關(guān)系是兩種不同的變量關(guān)系,函數(shù)關(guān)系是一種確定性關(guān)系,可以用一個(gè)變量確切地表示另一個(gè)變量;相關(guān)關(guān)系是一種非確定性關(guān)系,兩個(gè)變量雖然有關(guān)系,但又沒(méi)有確切到可由其中一個(gè)去精確地決定另一個(gè)的程度.
(2)根據(jù)變量變化趨勢(shì)可將相關(guān)關(guān)系分為正相關(guān)和負(fù)相關(guān);根據(jù)變量分布特征可將相關(guān)關(guān)系分為線性相關(guān)和非線性相關(guān)(曲線相關(guān)).
對(duì)點(diǎn)訓(xùn)練 下列五組變量:
①勻速行駛的汽車(chē)行駛的路程和行駛的時(shí)間;②學(xué)生的平均日學(xué)習(xí)時(shí)間和平均學(xué)習(xí)成績(jī);③某人每日吸煙量和其身體健康情況;④正方形的邊長(zhǎng)和面積;⑤汽車(chē)的重量和百公里耗油量.
其中兩個(gè)變量正相關(guān)的是( C )
A.①③ B.②④
C.②⑤ D.④⑤
[解析] ①④中兩個(gè)變量是確定的函數(shù)關(guān)系,③中兩個(gè)變量負(fù)相關(guān),只有②⑤中兩個(gè)變量正相關(guān).
題型二 由散點(diǎn)圖判斷相關(guān)關(guān)系
典例2 如圖所示的散點(diǎn)圖分別反映的變量間的相關(guān)關(guān)系是( D )
A.正相關(guān),負(fù)相關(guān),不相關(guān)
B.負(fù)相關(guān),不相關(guān),正相關(guān)
C.負(fù)相關(guān),正相關(guān),不相關(guān)
D.正相關(guān),不相關(guān),負(fù)相關(guān)
[分析] 分別分析三個(gè)散點(diǎn)圖中的點(diǎn)的分布情況,可得第一個(gè)圖中兩個(gè)變量正相關(guān),第二個(gè)圖中兩個(gè)變量不相關(guān),第三個(gè)圖中兩個(gè)變量負(fù)相關(guān).
[解析] 對(duì)于圖(1),圖中的點(diǎn)成帶狀分布,且從左到右上升,兩個(gè)變量正相關(guān);對(duì)于圖(2),圖中的點(diǎn)雜亂無(wú)章,沒(méi)有明顯的規(guī)律,兩個(gè)變量不相關(guān);對(duì)于圖(3),圖中的點(diǎn)成帶狀分布,且從左到右下降,兩個(gè)變量負(fù)相關(guān).故選D.
[規(guī)律方法] 判斷兩個(gè)變量具有相關(guān)關(guān)系的方法
(1)根據(jù)直觀感覺(jué)或生活經(jīng)驗(yàn)等判斷;(2)根據(jù)成對(duì)數(shù)據(jù)的變化趨勢(shì)判斷;(3)根據(jù)散點(diǎn)圖判斷:若散點(diǎn)圖中各點(diǎn)分布在一條直線或曲線附近,則變量具有相關(guān)關(guān)系.
由散點(diǎn)圖判斷兩個(gè)變量正、負(fù)相關(guān)的方法
如果散點(diǎn)圖中的點(diǎn)落在從左下角到右上角的區(qū)域,兩個(gè)變量正相關(guān);如果散點(diǎn)圖中的點(diǎn)落在從左上角到右下角的區(qū)域,兩個(gè)變量負(fù)相關(guān).
由散點(diǎn)圖判斷線性相關(guān)程度強(qiáng)弱的方法
在散點(diǎn)圖中,散點(diǎn)在某條直線附近越集中,兩個(gè)變量的線性相關(guān)程度越強(qiáng);散點(diǎn)在某條直線附近越分散,兩個(gè)變量的線性相關(guān)程度越弱.
對(duì)點(diǎn)訓(xùn)練 (1)對(duì)變量x,y由觀測(cè)數(shù)據(jù)(xi,yi)(i=1,2,…,10),得散點(diǎn)圖①;對(duì)變量u,v由觀測(cè)數(shù)據(jù)(ui,vi)(i=1,2,…,10),得散點(diǎn)圖②.由這兩個(gè)散點(diǎn)圖可以判斷( C )
A.變量x與y正相關(guān),u與v正相關(guān)
B.變量x與y正相關(guān),u與v負(fù)相關(guān)
C.變量x與y負(fù)相關(guān),u與v正相關(guān)
D.變量x與y負(fù)相關(guān),u與v負(fù)相關(guān)
[解析] 由圖①可以看出,散點(diǎn)圖在從左上角到右下角的帶狀區(qū)域內(nèi),所以變量x與y負(fù)相關(guān);由圖②可知,散點(diǎn)圖在從左下角到右上角的帶狀區(qū)域內(nèi),所以變量u與v正相關(guān).
(2)下列散點(diǎn)圖中,兩個(gè)變量線性相關(guān)程度最強(qiáng)的是( A )
[解析] 對(duì)于A選項(xiàng),散點(diǎn)圖中的點(diǎn)成帶狀分布,且集中分布在一條直線附近,所以兩個(gè)變量具有較強(qiáng)的線性相關(guān)關(guān)系;對(duì)于B,C,D選項(xiàng),散點(diǎn)圖中的點(diǎn)成片狀分布,兩個(gè)變量的線性相關(guān)程度較弱或不具有線性相關(guān)關(guān)系.故選A.
題型三 樣本相關(guān)系數(shù)
典例3 (1)對(duì)于樣本相關(guān)系數(shù)r來(lái)說(shuō),下列說(shuō)法正確的是( C )
A.|r|≤1,|r|越接近0,相關(guān)程度越強(qiáng);|r|越接近1,相關(guān)程度越弱
B.|r|≥1,|r|越接近1,相關(guān)程度越強(qiáng);|r|越大,相關(guān)程度越弱
C.|r|≤1,|r|越接近1,相關(guān)程度越強(qiáng);|r|越接近0,相關(guān)程度越弱
D.|r|≥1,|r|越接近1,相關(guān)程度越弱;|r|越大,相關(guān)程度越強(qiáng)
[解析] 用樣本相關(guān)系數(shù)r可以衡量?jī)蓚€(gè)變量之間線性相關(guān)程度的強(qiáng)弱,|r|≤1,|r|越接近1,表示兩個(gè)變量之間的線性相關(guān)程度越強(qiáng);|r|越接近0,表示兩個(gè)變量之間的線性相關(guān)程度越弱.故選C.
(2)為了對(duì)2023年某校月考成績(jī)進(jìn)行分析,在60分以上的全體同學(xué)中隨機(jī)抽取8位,他們的數(shù)學(xué)、物理成績(jī)對(duì)應(yīng)如下表:
學(xué)生編號(hào) 1 2 3 4 5 6 7 8
數(shù)學(xué)成績(jī)x 68 72 78 81 85 88 91 93
物理成績(jī)y 70 66 81 83 79 80 92 89
用變量y與x的樣本相關(guān)系數(shù)r(精確到0.01)說(shuō)明物理成績(jī)y與數(shù)學(xué)成績(jī)x的線性相關(guān)程度的強(qiáng)弱,并說(shuō)明它們的變化趨勢(shì)特征.
參考數(shù)據(jù):iyi=52 957,≈545.82.
[分析] 分別計(jì)算出,,然后求出樣本相關(guān)系數(shù)r,用樣本相關(guān)系數(shù)說(shuō)明物理成績(jī)與數(shù)學(xué)成績(jī)的相關(guān)程度.
[解析] (2)==82,
==80,
r=≈=≈0.87>0.
所以物理成績(jī)y與數(shù)學(xué)成績(jī)x的線性相關(guān)程度較強(qiáng),且呈正相關(guān),它們的變化趨勢(shì)相同.
[規(guī)律方法] 在統(tǒng)計(jì)中常用樣本相關(guān)系數(shù)r來(lái)衡量?jī)蓚€(gè)變量間線性相關(guān)程度的強(qiáng)弱.r的范圍為[-1,1],r為正時(shí),兩個(gè)變量正相關(guān);r為負(fù)時(shí),兩個(gè)變量負(fù)相關(guān);|r|越接近1,兩個(gè)變量間線性相關(guān)程度越強(qiáng);r越接近0,兩個(gè)變量間線性相關(guān)程度越弱.
對(duì)點(diǎn)訓(xùn)練 為了解某地區(qū)足球特色學(xué)校的發(fā)展?fàn)顩r,某調(diào)查小組得到統(tǒng)計(jì)數(shù)據(jù)如下表:
年份x 2014 2015 2016 2017 2018
足球特色學(xué)校y(百個(gè)) 0.30 0.60 1.00 1.40 1.70
根據(jù)上表數(shù)據(jù),計(jì)算y與x的樣本相關(guān)系數(shù)r,并說(shuō)明y與x的線性相關(guān)程度的強(qiáng)弱.
參考公式和數(shù)據(jù):
r=,
(xi-)(yi-)≈3.6,
(xi-)2=10,(yi-)2=1.3,
≈3.605 6.
[解析] 由題意得r==≈≈0.998.
∵r=0.998非常接近1,∴y與x線性相關(guān)程度很強(qiáng).
易|錯(cuò)|警|示
概念不清致誤
典例4 在一組成對(duì)樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散點(diǎn)圖中,若所有樣本點(diǎn)(xi,yi)(i=1,2,…,n)都在直線y=x+1上,則這組樣本數(shù)據(jù)的樣本相關(guān)系數(shù)為( D )
A.-1 B.0
C. D.1
[錯(cuò)解] ∵所有樣本點(diǎn)都在直線y=x+1上,x的系數(shù)為,故選C.
[正解] 因?yàn)樗袠颖军c(diǎn)(xi,yi)(i=1,2,…,n)都在直線y=x+1上,且x,y的變化趨勢(shì)相同,所以樣本相關(guān)系數(shù)為1.
1.有以下五組變量:
①某商品的銷(xiāo)售價(jià)格與銷(xiāo)售量;
②學(xué)生的學(xué)籍號(hào)與學(xué)生的數(shù)學(xué)成績(jī);
③堅(jiān)持每天吃早餐的人數(shù)與患胃病的人數(shù);
④氣溫與冷飲銷(xiāo)售量;
⑤電瓶車(chē)的重量和行駛每千米的耗電量.
其中兩個(gè)變量成正相關(guān)的是( D )
A.①③ B.②④
C.②⑤ D.④⑤
[解析] 對(duì)于①,一般情況下,某商品的銷(xiāo)售價(jià)格與銷(xiāo)售量成負(fù)相關(guān)關(guān)系;對(duì)于②,學(xué)生的學(xué)籍號(hào)與學(xué)生的數(shù)學(xué)成績(jī)沒(méi)有相關(guān)關(guān)系;對(duì)于③,一般情況下,堅(jiān)持每天吃早餐的人數(shù)與患胃病的人數(shù)成負(fù)相關(guān)關(guān)系;對(duì)于④,一般情況下,氣溫與冷飲銷(xiāo)售量成正相關(guān)關(guān)系;對(duì)于⑤,一般情況下,電瓶車(chē)的重量和行駛每千米的耗電量成正相關(guān)關(guān)系.綜上所述,其中兩個(gè)變量成正相關(guān)的序號(hào)是④⑤.
2.兩個(gè)變量負(fù)相關(guān)時(shí),散點(diǎn)圖的特征是( D )
A.點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi)
B.點(diǎn)散布在某帶形區(qū)域內(nèi)
C.點(diǎn)散布在某圓形區(qū)域內(nèi)
D.點(diǎn)散布在從左上角到右下角的區(qū)域內(nèi)
[解析] 有負(fù)相關(guān)關(guān)系的各點(diǎn)整體呈遞減趨勢(shì),因此點(diǎn)應(yīng)散布在從左上角到右下角的區(qū)域內(nèi).
3.已知兩個(gè)變量的3對(duì)觀測(cè)數(shù)據(jù)(0,1),(1,0),(2,-0.9),則它們的樣本相關(guān)系數(shù)的大小可能是( A )
A.-0.98 B.0
C.0.02 D.0.97
[解析] 由3對(duì)觀測(cè)數(shù)據(jù)可知兩個(gè)變量負(fù)相關(guān),所以樣本相關(guān)系數(shù)r<0.
4.某公司欲知詩(shī)詞日歷費(fèi)用x(十萬(wàn)元)與詩(shī)詞日歷銷(xiāo)售量y(千本)之間的關(guān)系,從其所發(fā)行的詩(shī)詞日歷中隨機(jī)抽取了10張,得到如下的資料:i=28,=303.4,i=75,y=598.5,iyi=237,則y與x的相關(guān)系數(shù)r為_(kāi)__0.3__.
[解析] 由題中數(shù)據(jù)可知
r==0.3.8.2 一元線性回歸模型及其應(yīng)用
學(xué)習(xí)目標(biāo)
1.結(jié)合具體實(shí)例,了解一元線性回歸模型的含義,了解模型參數(shù)的統(tǒng)計(jì)意義.了解最小二乘法原理.掌握一元線性回歸模型參數(shù)的最小二乘估計(jì)方法,會(huì)使用相關(guān)的統(tǒng)計(jì)軟件.
2.針對(duì)實(shí)際問(wèn)題,會(huì)用一元線性回歸模型進(jìn)行預(yù)測(cè).
3.了解隨機(jī)誤差、殘差、殘差圖的概念.
核心素養(yǎng)
1.通過(guò)對(duì)散點(diǎn)圖、線性回歸的分析,培養(yǎng)數(shù)據(jù)分析素養(yǎng).
2.借助回歸模型的建立,培養(yǎng)數(shù)學(xué)建模、數(shù)據(jù)分析及數(shù)學(xué)運(yùn)算素養(yǎng).
知識(shí)點(diǎn) 1 一元線性回歸模型
一元線性回歸模型的完整表達(dá)式為其中Y稱(chēng)為_(kāi)因變量__或 _響應(yīng)變量__,x稱(chēng)為自變量或_解釋__變量;a,b為模型的未知參數(shù),e是Y與bx+a之間的_隨機(jī)誤差__.
想一想:具有相關(guān)關(guān)系的兩個(gè)變量,其樣本點(diǎn)散布在某一條直線y=bx+a的附近,可以用一次函數(shù) y=bx+a來(lái)描述兩個(gè)變量之間的關(guān)系嗎?
提示:不能.
練一練:
下列說(shuō)法不正確的是( C )
A.在回歸模型中,變量間的關(guān)系是非確定性關(guān)系,因變量不能由自變量唯一確定
B.在函數(shù)模型中,變量間的關(guān)系是確定性關(guān)系,因變量由自變量唯一確定
C.在回歸模型中,變量x和y都是普通變量
D.在回歸模型中,回歸系數(shù)可能是正的也可能是負(fù)的
[解析] 在回歸模型中,x是解釋變量,y是響應(yīng)變量,當(dāng)解釋變量取值一定時(shí),響應(yīng)變量的取值帶有一定的隨機(jī)性.
知識(shí)點(diǎn) 2 最小二乘法與經(jīng)驗(yàn)回歸方程
(1)最小二乘法
=x+稱(chēng)為Y關(guān)于x的經(jīng)驗(yàn)回歸方程,也稱(chēng)經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱(chēng)為_(kāi)經(jīng)驗(yàn)回歸直線__.這種求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估計(jì).
(2)經(jīng)驗(yàn)回歸方程的系數(shù)計(jì)算公式
經(jīng)驗(yàn)回歸方程 的計(jì)算公式 的計(jì)算公式
= x+  = = =-
(3)經(jīng)驗(yàn)回歸方程的性質(zhì)
①經(jīng)驗(yàn)回歸方程一定過(guò)點(diǎn) (,)?。?br/>②一次函數(shù)=x+的單調(diào)性由的符號(hào)決定,函數(shù)遞增的充要條件是 >0??;
③的實(shí)際意義:當(dāng)x增大一個(gè)單位時(shí), 增大 個(gè)單位.
練一練:
如果記錄了x,y的幾組數(shù)據(jù)分別為(0,1),(1,3),(2,5),(3,7),那么y關(guān)于x的經(jīng)驗(yàn)回歸方程必過(guò)點(diǎn)( D )
A.(2,2) B.(1.5,2)
C.(1,2) D.(1.5,4)
[解析] 因?yàn)椋剑?.5,==4,
所以經(jīng)驗(yàn)回歸方程必過(guò)點(diǎn)(1.5,4).
知識(shí)點(diǎn) 3 殘差與殘差分析
(1)殘差
對(duì)于響應(yīng)變量Y,通過(guò)觀測(cè)得到的數(shù)據(jù)稱(chēng)為_(kāi)觀測(cè)值__,通過(guò)經(jīng)驗(yàn)回歸方程得到的稱(chēng)為_(kāi)預(yù)測(cè)值__,_觀測(cè)值__減去_預(yù)測(cè)值__稱(chēng)為殘差.
(2)殘差分析
_殘差__是隨機(jī)誤差的估計(jì)結(jié)果,通過(guò)對(duì)殘差的分析可以判斷模型刻畫(huà)數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱(chēng)為_(kāi)殘差分析__.
(3)對(duì)模型刻畫(huà)數(shù)據(jù)效果的分析
①殘差圖法:在殘差圖中,如果殘差比較均勻地集中在以_橫軸為對(duì)稱(chēng)軸的水平帶狀區(qū)域內(nèi)__,則說(shuō)明經(jīng)驗(yàn)回歸方程較好地刻畫(huà)了兩個(gè)變量的關(guān)系;
②殘差平方和法:殘差平方和 (yi-i)2 越小,模型的擬合效果越好;
③R2法:可以用R2=1-來(lái)比較兩個(gè)模型的擬合效果,R2越_大__,模型擬合效果越好,R2越_小__,模型擬合效果越差.
練一練:
甲、乙、丙、丁四位同學(xué)在建立變量x,y的回歸模型時(shí),分別選擇了4種不同模型,計(jì)算可得它們的決定系數(shù)R2分別如表:
甲 乙 丙 丁
R2 0.98 0.78 0.50 0.85
哪位同學(xué)建立的回歸模型擬合效果最好( A )
A.甲 B.乙
C.丙 D.丁
[解析] 決定系數(shù)R2越大,表示回歸模型的擬合效果越好.
題|型|探|究
題型一 求經(jīng)驗(yàn)回歸方程
典例1 隨著網(wǎng)絡(luò)的普及,網(wǎng)上購(gòu)物的方式已經(jīng)受到越來(lái)越多年輕人的青睞,某家網(wǎng)絡(luò)店鋪商品的成交量x(單位:件)與店鋪的瀏覽量y(單位;次)之間的對(duì)應(yīng)數(shù)據(jù)如下表所示:
x/件 2 4 5 6 8
y/次 30 40 50 60 70
(1)根據(jù)表中數(shù)據(jù)畫(huà)出散點(diǎn)圖;
(2)根據(jù)表中的數(shù)據(jù),求出y關(guān)于x的經(jīng)驗(yàn)回歸方程;
(3)當(dāng)這種商品的成交量突破100件(含100 件)時(shí),預(yù)測(cè)這家店鋪的瀏覽量至少為多少?
[分析] 以橫軸表示成交量,縱軸表示瀏覽量,畫(huà)出散點(diǎn)圖,若散點(diǎn)圖顯示兩變量線性相關(guān),則依據(jù)公式求解經(jīng)驗(yàn)回歸方程,再利用經(jīng)驗(yàn)回歸方程進(jìn)行估計(jì).
[解析] (1)散點(diǎn)圖如圖所示.
(2)根據(jù)散點(diǎn)圖可得,變量x與y之間具有線性相關(guān)關(guān)系.
根據(jù)數(shù)據(jù)可知,=5,=50,xiyi=1 390,x=145,代入公式得===7,=-=50-7×5=15.
故所求的經(jīng)驗(yàn)回歸方程是=7x+15.
(3)根據(jù)上面求出的經(jīng)驗(yàn)回歸方程,當(dāng)成交量突破100件(含100件),即x=≥100時(shí),≥715,所以預(yù)測(cè)這家店鋪的瀏覽量至少為715次.
[規(guī)律方法] 經(jīng)驗(yàn)回歸分析的步驟
(1)收集樣本數(shù)據(jù),設(shè)為(xi,yi)(i=1,2,…,n)(數(shù)據(jù)一般由題目給出).
(2)作出散點(diǎn)圖,確定x,y具有線性相關(guān)關(guān)系.
(3)計(jì)算,,x,xiyi.
(4)代入公式計(jì)算相關(guān)系數(shù),確定相關(guān)性的強(qiáng)弱.
(5)代入公式計(jì)算,,寫(xiě)出經(jīng)驗(yàn)回歸方程=x+.
(6)利用經(jīng)驗(yàn)回歸方程進(jìn)行預(yù)測(cè).
對(duì)點(diǎn)訓(xùn)練 佩戴頭盔是一項(xiàng)對(duì)家庭與社會(huì)負(fù)責(zé)的表現(xiàn),某市對(duì)此不斷進(jìn)行安全教育.下表是該市某主干路口連續(xù)4年監(jiān)控設(shè)備抓拍到的駕駛員不戴頭盔的統(tǒng)計(jì)數(shù)據(jù):
年度 2020 2021 2022 2023
年度序號(hào)x 1 2 3 4
不戴頭盔人數(shù)y 1 250 1 050 1 000 900
(1)請(qǐng)利用所給數(shù)據(jù)求不戴頭盔人數(shù)y與年度序號(hào)x之間的經(jīng)驗(yàn)回歸方程=x+;
(2)估算該路口2024年不戴頭盔的人數(shù).
[解析] (1)由表中數(shù)據(jù)知,==,==1 050,
所以===-110,所以=-=1 050-(-110)×=1 325,
故所求回歸直線方程為=-110x+1 325.
(2)令x=5,則=-110×5+1 325=775,
則估算該路口2024年不戴頭盔的人數(shù)為775人.
題型二 R2的求解與回歸模型的擬合
典例2 我國(guó)在第七十五屆聯(lián)合國(guó)大會(huì)上提出:“中國(guó)將提高國(guó)家自主貢獻(xiàn)力度,采取更加有力的政策和措施,二氧化碳排放力爭(zhēng)于2030年前達(dá)到峰值,努力爭(zhēng)取2060年前實(shí)現(xiàn)碳中和.”減少碳排放,實(shí)現(xiàn)碳中和,人人都可出一份力.某中學(xué)數(shù)學(xué)教師組織開(kāi)展了題為“家庭燃?xì)庠钚o的最佳角度”的數(shù)學(xué)建?;顒?dòng).
實(shí)驗(yàn)假設(shè):
①燒開(kāi)一壺水有諸多因素,本建模的變量設(shè)定為燃?xì)庥昧颗c旋鈕的旋轉(zhuǎn)角度,其他因素假設(shè)一樣;
②由生活常識(shí)知,旋轉(zhuǎn)角度很小或很大,一壺水甚至不能燒開(kāi)或造成燃?xì)饫速M(fèi),因此旋轉(zhuǎn)角度設(shè)定在10°到90°之間,建模實(shí)驗(yàn)中選取5個(gè)代表性數(shù)據(jù):18°,36°,54°,72°,90°.
某數(shù)學(xué)建模小組收集了“燒開(kāi)一壺水”的實(shí)驗(yàn)數(shù)據(jù),如表:
項(xiàng)目旋轉(zhuǎn)角度 開(kāi)始燒水時(shí)燃?xì)獗矶葦?shù)/dm3 水燒開(kāi)時(shí)燃?xì)獗矶葦?shù)/dm3
18° 9 080 9 210
36° 8 958 9 080
54° 8 819 8 958
72° 8 670 8 819
90° 8 498 8 670
以x表示旋轉(zhuǎn)角度,y表示燃?xì)庥昧浚?br/>(1)用列表法整理數(shù)據(jù)(x,y);x(旋轉(zhuǎn)角度:度) 18 36 54 72 90
y(燃?xì)庥昧浚篸m3)
(2)假定x,y線性相關(guān),試求經(jīng)驗(yàn)回歸方程=x+;(注:計(jì)算結(jié)果精確到小數(shù)點(diǎn)后三位)
(3)計(jì)算(2)中所求模型的決定系數(shù),評(píng)價(jià)此模型的擬合效果.(注:計(jì)算結(jié)果精確到小數(shù)點(diǎn)后兩位)
參考數(shù)據(jù):i=712,(xi-)(yi-)=1 998,(xi-)2=3 240,(yi-)2=1 501.2,
(yi-i)2≈269.1.
[解析] (1)整理數(shù)據(jù)如表:
x(旋轉(zhuǎn)角度:度) 18 36 54 72 90
y(燃?xì)庥昧浚篸m3) 130 122 139 149 172
(2)=54,=142.4,==≈0.617,
≈142.4-0.617×54=109.082,
故回歸直線方程為=0.617x+109.082.
(3)計(jì)算(2)中所求模型的決定系數(shù)
R2=1-=1-≈0.82.
此模型的擬合效果較好.
[規(guī)律方法] 決定系數(shù)R2、殘差圖在回歸分析中的作用
(1)決定系數(shù)R2是用來(lái)刻畫(huà)回歸效果的,由R2=可知,R2越大,意味著殘差平方和越小,也就是說(shuō)模型的擬合效果就越好;
(2)殘差圖也是用來(lái)刻畫(huà)回歸效果的,判斷依據(jù)是殘差點(diǎn)比較均勻地分布在水平帶狀區(qū)域中,帶狀區(qū)域越窄,說(shuō)明模型擬合精度越高,回歸方程預(yù)測(cè)的精度也越高.
對(duì)點(diǎn)訓(xùn)練 某運(yùn)動(dòng)員訓(xùn)練次數(shù)與訓(xùn)練成績(jī)之間的數(shù)據(jù)關(guān)系如表:
次數(shù)(x) 30 33 35 37 39 44 46 50
成績(jī)(y) 30 34 37 39 42 46 48 51
(1)作出散點(diǎn)圖;
(2)求出經(jīng)驗(yàn)回歸方程;
(3)作出殘差圖;
(4)計(jì)算R2,并說(shuō)明運(yùn)動(dòng)員的訓(xùn)練次數(shù)對(duì)成績(jī)的影響占百分之幾.
[解析] (1)作出該運(yùn)動(dòng)員訓(xùn)練次數(shù)x與成績(jī)y的散點(diǎn)圖,如圖所示.由散點(diǎn)圖可知,它們之間具有相關(guān)關(guān)系.
(2)=39.25,=40.875,=12 656,iyi=13 180,
所以=≈1.041 5,
=-=-0.003 875,
所以經(jīng)驗(yàn)回歸方程為=1.041 5x-0.003 875.
(3)殘差分析:下面的表格列出了運(yùn)動(dòng)員訓(xùn)練次數(shù)和成績(jī)的原始數(shù)據(jù)以及相應(yīng)的殘差數(shù)據(jù).
x y =y(tǒng)-
30 30 -1.241 1
33 34 -0.365 6
35 37 0.551 4
37 39 0.468 4
39 42 1.385 4
44 46 0.177 9
46 48 0.094 9
50 51 -1.071 1
作殘差圖如圖所示.
由圖可知,殘差點(diǎn)比較均勻地分布在水平帶狀區(qū)域內(nèi),說(shuō)明選擇的模型比較合適.
(4)計(jì)算R2≈0.985 5,說(shuō)明了該運(yùn)動(dòng)的訓(xùn)練次數(shù)對(duì)成績(jī)的影響占98.55%.
題型三 非線性經(jīng)驗(yàn)回歸問(wèn)題
典例3 某公交公司推出掃碼支付優(yōu)惠乘車(chē)活動(dòng),活動(dòng)設(shè)置了一段時(shí)間的推廣期,由于推廣期內(nèi)優(yōu)惠力度較大,吸引了越來(lái)越多的人開(kāi)始使用掃碼支付.某線路公交車(chē)隊(duì)統(tǒng)計(jì)了活動(dòng)剛推出一周內(nèi)每一天使用掃碼支付的人次,用x表示推出的天數(shù),y表示每天使用掃碼支付的人次(一人次等于十人),統(tǒng)計(jì)數(shù)據(jù)如下表:
x 1 2 3 4 5 6 7
y 6 11 21 34 66 101 196
根據(jù)以上數(shù)據(jù),繪制了如圖所示的散點(diǎn)圖.
(1)根據(jù)散點(diǎn)圖判斷,在推廣期內(nèi),=x+與=c·dx(c,d均為大于零的常數(shù))哪一個(gè)適宜作為掃碼支付的人次y關(guān)于活動(dòng)推出天數(shù)x的經(jīng)驗(yàn)回歸方程類(lèi)型?(給出判斷即可,不必說(shuō)明理由)
(2)根據(jù)(1)的判斷結(jié)果及表中的數(shù)據(jù),求y關(guān)于x的經(jīng)驗(yàn)回歸方程,并預(yù)測(cè)活動(dòng)推出后第8天使用掃碼支付的人數(shù).
參考數(shù)據(jù):
iyi ivi 100.54
62.14 1.54 2 535 50.12 3.47
其中vi=lg yi,=i.
[分析] 由散點(diǎn)圖可判斷x,y之間的關(guān)系符合指數(shù)型函數(shù)模型,選擇=c·dx進(jìn)行擬合,然后取對(duì)數(shù),進(jìn)而求出經(jīng)驗(yàn)回歸方程.
[解析] (1)根據(jù)散點(diǎn)圖判斷=c·dx適宜作為掃碼支付的人次y關(guān)于活動(dòng)推出天數(shù)x的經(jīng)驗(yàn)回歸方程類(lèi)型.
(2)=c·dx,兩邊同時(shí)取常用對(duì)數(shù)得lg =lg(c·dx)=lg c+lg d·x.
設(shè)lg =v.
∴v=lg c+lg d·x.
∴=4,=1.54,=140,ivi=50.12.
∴l(xiāng)g d====0.25.
把點(diǎn)(4,1.54)代入v=lg c+lg d·x,得lg c=0.54,
∴v=0.54+0.25x,
∴l(xiāng)g =0.54+0.25x,
∴y關(guān)于x的經(jīng)驗(yàn)回歸方程為=100.54+0.25x=100.54×100.25x=3.47×100.25x.
把x=8代入,得=3.47×102=347(人次).
故預(yù)測(cè)活動(dòng)推出后第8天使用掃碼支付的人數(shù)為3 470.
[規(guī)律方法] 求非線性經(jīng)驗(yàn)回歸方程的方法
(1)非線性經(jīng)驗(yàn)回歸方程的求解,一般可以根據(jù)散點(diǎn)圖選取合適的非線性回歸模型,或根據(jù)已知條件選取擬合程度較好的非線性回歸模型,再通過(guò)變換,轉(zhuǎn)化為求線性經(jīng)驗(yàn)回歸方程,最后還原即可.
(2)非線性經(jīng)驗(yàn)回歸方程常見(jiàn)形式有以下幾種:=a+b(x-c)2,=a+bln(x-c),=a+b,=a+和=abcx.其中=a+b(x-c)2,=a+bln(x-c),=a+b,=a+可通過(guò)變量替換(換元)求解;=abcx可通過(guò)先兩邊取對(duì)數(shù),再變量替換(換元)求解.
對(duì)點(diǎn)訓(xùn)練 某公司為確定下一年度投入某種產(chǎn)品的宣傳費(fèi),需了解年宣傳費(fèi)x(單位:千元)對(duì)年銷(xiāo)售量y(單位:t)和年利潤(rùn)z(單位:千元)的影響.對(duì)近8年的年宣傳費(fèi)xi和年銷(xiāo)售量yi(i=1,2,…,8)的數(shù)據(jù)作了初步處理,得到下面的散點(diǎn)圖及一些統(tǒng)計(jì)量的值.
(xi-)2 (wi-)2 (xi-)(yi-) (wi-)(yi-)
46.6 563 6.8 289.8 1.6 1 469 108.8
表中wi=,=i.
(1)根據(jù)散點(diǎn)圖判斷,y=a+bx與y=c+d哪一個(gè)適宜作為年銷(xiāo)售量y關(guān)于年宣傳費(fèi)x的回歸方程類(lèi)型?(給出判斷即可,不必說(shuō)明理由)
(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程;
(3)已知這種產(chǎn)品的年利潤(rùn)z與x,y的關(guān)系為z=0.2y-x.根據(jù)(2)的結(jié)果回答下列問(wèn)題:
①年宣傳費(fèi)x=49時(shí),年銷(xiāo)售量及年利潤(rùn)的預(yù)報(bào)值是多少?
②年宣傳費(fèi)x為何值時(shí),年利潤(rùn)的預(yù)報(bào)值最大?
附:對(duì)于一組數(shù)據(jù)(u1,v1),(u2,v2),…,(un,vn),其回歸直線=+u的斜率和截距的最小二乘估計(jì)分別為=,=-.
[解析] (1)由散點(diǎn)圖可以判斷,y=c+d適宜作為年銷(xiāo)售量y關(guān)于年宣傳費(fèi)x的回歸方程類(lèi)型.
(2)令w=,先建立y關(guān)于w的經(jīng)驗(yàn)回歸方程.
由于===68,=-=563-68×6.8=100.6,
所以y關(guān)于w的經(jīng)驗(yàn)回歸方程為=100.6+68w,
因此y關(guān)于x的經(jīng)驗(yàn)回歸方程為=100.6+68.
(3)①由(2)知,當(dāng)x=49時(shí),年銷(xiāo)售量y的預(yù)報(bào)值=100.6+68=576.6(t),
年利潤(rùn)z的預(yù)報(bào)值=576.6×0.2-49=66.32(千元).
②根據(jù)(2)的結(jié)果知,年利潤(rùn)z的預(yù)報(bào)值
=0.2(100.6+68)-x=-x+13.6+20.12.
所以當(dāng)==6.8,
即x=46.24時(shí),取得最大值.
故年宣傳費(fèi)為46.24千元時(shí),年利潤(rùn)的預(yù)報(bào)值最大.
1.關(guān)于回歸分析,下列說(shuō)法錯(cuò)誤的是( D )
A.回歸分析是研究?jī)蓚€(gè)具有相關(guān)關(guān)系的變量的方法
B.散點(diǎn)圖中,解釋變量在x軸,響應(yīng)變量在y軸
C.回歸模型中一定存在隨機(jī)誤差
D.散點(diǎn)圖能明確反映變量間的關(guān)系
[解析] 用散點(diǎn)圖反映兩個(gè)變量間的關(guān)系時(shí),存在誤差.
2.關(guān)于殘差圖的描述錯(cuò)誤的是( C )
A.殘差圖的橫坐標(biāo)可以是樣本編號(hào)
B.殘差圖的橫坐標(biāo)也可以是解釋變量或預(yù)報(bào)變量
C.殘差點(diǎn)分布的帶狀區(qū)域的寬度越窄相關(guān)指數(shù)越小
D.殘差點(diǎn)分布的帶狀區(qū)域的寬度越窄殘差平方和越小
[解析] 殘差點(diǎn)分布的帶狀區(qū)域的寬度越窄,說(shuō)明模型擬合精度越高,則殘差平方和越小,此時(shí),相關(guān)指數(shù)R2的值越大.
3.根據(jù)如下樣本數(shù)據(jù):
x 2 3 4 5 6
y 4 2.5 -0.5 -2 -3
得到的經(jīng)驗(yàn)回歸方程為=x+,則( B )
A.>0,>0 B.>0,<0
C.<0,>0 D.<0,<0
[解析] 由題干表中的數(shù)據(jù)可得,變量y隨著x的增大而減小,則<0,又回歸方程為=x+經(jīng)過(guò)(2,4),(3,2.5),可得>0.
4.某種產(chǎn)品的廣告支出費(fèi)用x(單位:萬(wàn)元)與銷(xiāo)售額y(單位:萬(wàn)元)的數(shù)據(jù)如表:
x 2 4 5 6 8
y 30 40 60 50 70
已知y關(guān)于x的經(jīng)驗(yàn)回歸方程為=6.5x+17.5,則當(dāng)廣告支出費(fèi)用為5萬(wàn)元時(shí),殘差為_(kāi)10__.
[解析] 當(dāng)x=5時(shí),=6.5×5+17.5=50,表格中對(duì)應(yīng)y=60,于是殘差為60-50=10.8.3 列聯(lián)表與獨(dú)立性檢驗(yàn)
學(xué)習(xí)目標(biāo)
1.基于2×2列聯(lián)表,通過(guò)實(shí)例了解獨(dú)立性檢驗(yàn)的基本思想.
2.掌握獨(dú)立性檢驗(yàn)的基本步驟.
3.能利用條形圖、列聯(lián)表探討兩個(gè)分類(lèi)變量的關(guān)系.
4.了解χ2的含義及其應(yīng)用.
5.會(huì)用獨(dú)立性檢驗(yàn)解決簡(jiǎn)單的實(shí)際問(wèn)題.
核心素養(yǎng)
1.通過(guò)學(xué)習(xí)獨(dú)立性檢驗(yàn)的基本思想,提升邏輯推理素養(yǎng).
2.借助χ2公式,培養(yǎng)數(shù)學(xué)運(yùn)算素養(yǎng).
3.借助條形圖,培養(yǎng)直觀想象素養(yǎng).
4.通過(guò)利用獨(dú)立性檢驗(yàn)解決實(shí)際問(wèn)題,提升數(shù)據(jù)分析能力.
知識(shí)點(diǎn) 1 分類(lèi)變量與列聯(lián)表
(1)分類(lèi)變量:用來(lái)區(qū)別不同的現(xiàn)象或性質(zhì)的_隨機(jī)變量__,其取值可以用實(shí)數(shù)表示.
(2)2×2列聯(lián)表:如果隨機(jī)事件X與Y的樣本數(shù)據(jù)如下表格形式
Y=0 Y=1 合計(jì)
X=0 a b a+b
X=1 c d c+d
合計(jì) a+c b+d a+b+c+d
在這個(gè)表格中,核心的數(shù)據(jù)是中間的4個(gè)格子,所以這樣的表格通常稱(chēng)為2×2列聯(lián)表.
練一練:
下面是一個(gè)2×2列聯(lián)表:
X Y 合計(jì)
Y=0 Y=1
X=0 a 21 73
X=1 8 25 33
合計(jì) b 46
則表中a,b處的值分別為( C )
A.94,96 B.52,50
C.52,60 D.54,52
[解析] 因?yàn)閍+21=73,所以a=52,b=a+8=52+8=60.
知識(shí)點(diǎn) 2 獨(dú)立性檢驗(yàn)
(1)零假設(shè):設(shè)X和Y為定義在Ω上,取值于{0,1}的成對(duì)分類(lèi)變量.由于{X=0}和{X=1},{Y=0}和{Y=1}都是互為對(duì)立事件,故要判斷事件{X=1}和{Y=1}之間是否有關(guān)聯(lián),需要判斷假定關(guān)系_H0:P(Y=1|X=0)=P(Y=1|X=1)__是否成立.通常稱(chēng)H0為零假設(shè).
(2)獨(dú)立性檢驗(yàn):利用隨機(jī)變量χ2來(lái)判斷“兩個(gè)分類(lèi)變量有關(guān)系”的方法稱(chēng)為獨(dú)立性檢驗(yàn).
(3)公式:χ2=   ,其中n=a+b+c+d為樣本容量.
(4)對(duì)照表及檢驗(yàn)規(guī)則:
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
當(dāng)χ2≥xα?xí)r就推斷“X與Y不獨(dú)立”,這種推斷犯錯(cuò)誤的概率不超過(guò)α;當(dāng)χ2<xα?xí)r,可以認(rèn)為“X與Y獨(dú)立”.
練一練:
根據(jù)表格計(jì)算:
性別 不看電視 看電視
男 37 85
女 35 143
χ2≈_4.514__(保留3位小數(shù)).
[解析] χ2=≈4.514.
題|型|探|究
題型一 列聯(lián)表與等高堆積條形圖
典例1 某學(xué)校對(duì)高三學(xué)生做了一項(xiàng)調(diào)查,發(fā)現(xiàn):在平時(shí)的模擬考試中,性格內(nèi)向的學(xué)生426人中有332人在考前心情緊張.性格外向的學(xué)生594人中有213人在考前心情緊張,作出等高堆積條形圖,利用圖形判斷考前心情緊張與性格類(lèi)別是否有關(guān)系.
[解析] 作列聯(lián)表如下:
性格內(nèi)向 性格外向 合計(jì)
考前心情緊張 332 213 545
考前心情不緊張 94 381 475
合計(jì) 426 594 1 020
相應(yīng)的等高條形圖如圖所示:
圖中陰影部分表示考前心情緊張與考前心情不緊張中性格內(nèi)向的人數(shù)所占的比例,從圖中可以看出考前心情緊張的樣本中性格內(nèi)向的人數(shù)占的比例比考前心情不緊張樣本中性格內(nèi)向的人數(shù)占的比例高,可以認(rèn)為考前緊張與性格類(lèi)型有關(guān).
[規(guī)律方法] 1.利用2×2列聯(lián)表分析兩變量間關(guān)系的步驟
(1)根據(jù)題中數(shù)據(jù)獲得2×2列聯(lián)表;
(2)根據(jù)頻率特征,即將與
的值相比,直觀地反映出兩個(gè)分類(lèi)變量間是否相互影響.
2.利用等高條形圖判斷兩個(gè)分類(lèi)變量是否相關(guān)的步驟
微提醒:等高堆積條形圖的缺點(diǎn)是不能給出推斷“兩個(gè)分類(lèi)變量有關(guān)系”犯錯(cuò)誤的概率.
對(duì)點(diǎn)訓(xùn)練 為了解鉛中毒病人是否有尿棕色素增加現(xiàn)象,分別對(duì)病人組和對(duì)照組的尿液做尿棕色素定性檢查,結(jié)果如下表.問(wèn):鉛中毒病人組和對(duì)照組的尿棕色素陽(yáng)性數(shù)有無(wú)差別?
尿棕色素 合計(jì)
陽(yáng)性數(shù) 陰性數(shù)
鉛中毒病人組 29 7 36
鉛中毒對(duì)照組 9 28 37
合計(jì) 38 35 73
[解析] 由上述列聯(lián)表可知,在鉛中毒病人組中尿棕色素為陽(yáng)性的約占80.56%,而鉛中毒對(duì)照組僅約占24.32%.說(shuō)明它們之間有較大差別.
畫(huà)出等高堆積條形圖如圖所示.
由列聯(lián)表及等高堆積條形圖可知,鉛中毒病人組與對(duì)照組相比較,尿棕色素為陽(yáng)性數(shù)差別明顯,因此鉛中毒病人組和對(duì)照組的尿棕色素陽(yáng)性數(shù)有明顯差別.
題型二 獨(dú)立性檢驗(yàn)
典例2 某商場(chǎng)為提高服務(wù)質(zhì)量,隨機(jī)調(diào)查了50名男顧客和50名女顧客,每位顧客對(duì)該商場(chǎng)的服務(wù)給出滿意或不滿意的評(píng)價(jià),得到下面列聯(lián)表:
滿意 不滿意
男顧客 40 10
女顧客 30 20
(1)分別估計(jì)男、女顧客對(duì)該商場(chǎng)服務(wù)滿意的概率;
(2)能否有95%的把握認(rèn)為男、女顧客對(duì)該商場(chǎng)服務(wù)的評(píng)價(jià)有差異?
附:χ2=,
P(χ2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
[分析] (1)根據(jù)列聯(lián)表,用頻率代替概率,可分別估計(jì)男、女顧客對(duì)該商場(chǎng)服務(wù)滿意的概率;(2)求出χ2的值,與臨界值表對(duì)比可得結(jié)論.
[解析] (1)由調(diào)查數(shù)據(jù)知,男顧客對(duì)該商場(chǎng)服務(wù)滿意的概率的估計(jì)值為0.8;女顧客對(duì)該商場(chǎng)服務(wù)滿意的概率的估計(jì)值為=0.6.
(2)χ2=≈4.762.
由于4.762>3.841,故有95%的把握認(rèn)為男、女顧客對(duì)該商場(chǎng)服務(wù)的評(píng)價(jià)有差異.
[規(guī)律方法] 解決獨(dú)立性檢驗(yàn)問(wèn)題的基本步驟
對(duì)點(diǎn)訓(xùn)練 2024年春季,某出租汽車(chē)公司決定更換一批小汽車(chē)以代替原來(lái)報(bào)廢的出租車(chē),現(xiàn)有A,B兩款車(chē)型的使用壽命(單位:年)頻數(shù)表如下:
使用壽命/年 5 6 7 8 總計(jì)
A型出租車(chē)/輛 10 20 45 25 100
B型出租車(chē)/輛 15 35 40 10 100
(1)填寫(xiě)下表,并判斷是否有99%的把握認(rèn)為出租車(chē)的使用壽命與汽車(chē)車(chē)型有關(guān);
使用壽命不高于6年 使用壽命不低于7年 總計(jì)
A型
B型
總計(jì)
(2)司機(jī)師傅小李準(zhǔn)備在一輛開(kāi)了4年的A型車(chē)和一輛開(kāi)了4年的B型車(chē)中選擇,為了盡最大可能實(shí)現(xiàn)3年內(nèi)(含3年)不換車(chē),試通過(guò)計(jì)算說(shuō)明,他應(yīng)如何選擇?
[解析] (1)根據(jù)題目所給數(shù)據(jù)得到如下2×2的列聯(lián)表:
使用壽命不高于6年 使用壽命不低于7年 總計(jì)
A型 30 70 100
B型 50 50 100
總計(jì) 80 120 200
所以χ2=≈8.333.
查表可得P(χ2≥6.635)=0.01,
由于8.333>6.635,
所以有99%的把握認(rèn)為出租車(chē)的使用壽命與汽車(chē)車(chē)型有關(guān).
(2)記事件A為“小李選擇A型車(chē),3年內(nèi)(含3年)不換車(chē)”,事件B為“小李選擇B型車(chē),3年內(nèi)(含3年)不換車(chē)”,所以P(A)==0.25,P(B)==0.1,因?yàn)镻(A)>P(B),所以小李應(yīng)選擇A型車(chē).
題型三 獨(dú)立性檢驗(yàn)的綜合應(yīng)用
典例3 某校鼓勵(lì)即將畢業(yè)的大學(xué)生到西部偏遠(yuǎn)地區(qū)去支教,校學(xué)生就業(yè)部針對(duì)即將畢業(yè)的男、女生是否愿意到西部支教進(jìn)行問(wèn)卷調(diào)查,得到的情況如下表所示:
性別 支教 合計(jì)
愿意去支教 不愿意去支教
女生 20
男生 40
合計(jì) 70 100
(1)完成上述2×2列聯(lián)表;
(2)根據(jù)表中的數(shù)據(jù),試根據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),分析愿意去西部支教是否與性別有關(guān)?
(3)若在接受調(diào)查的所有男生中按照“是否愿意去支教”進(jìn)行分層抽樣,隨機(jī)抽取10人,再在10人中抽取3人進(jìn)行面談,記面談的男生中,不愿意去支教的人數(shù)為ξ,求ξ的分布列以及數(shù)學(xué)期望.
[分析] (2)根據(jù)列聯(lián)表求出χ2和相應(yīng)的頻率,從而分析是否與性別有關(guān);(3)由超幾何分布公式求出相應(yīng)的分布列,計(jì)算出數(shù)學(xué)期望.
[解析] (1)2×2列聯(lián)表如下:
性別 支教 合計(jì)
愿意去支教 不愿意去支教
女生 30 20 50
男生 40 10 50
合計(jì) 70 30 100
(2)零假設(shè)H0:支教與性別相互獨(dú)立,即是否愿意去西部支教與性別無(wú)關(guān).根據(jù)2×2列聯(lián)表中的數(shù)據(jù),可得χ2=≈4.762>3.841=x0.05,
根據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),我們推斷H0不成立,
即認(rèn)為是否愿意去西部支教與性別有關(guān)聯(lián),此推斷犯錯(cuò)誤的概率不大于0.05.
根據(jù)2×2列聯(lián)表中的數(shù)據(jù)計(jì)算,
女生愿意去支教與不愿意去支教的頻率分別為=0.6,=0.4;
男生愿意去支教與不愿意去支教的頻率分別為=0.8,=0.2.
由=2可見(jiàn),女生不愿意去支教的頻率是男生不愿意去支教的頻率的2倍.
于是,根據(jù)頻率穩(wěn)定于概率的原理,我們可以認(rèn)為女生不愿意去支教的概率明顯大于男生不愿意去支教的概率,即是否愿意去西部支教明顯與性別有關(guān).
(3)由題意,抽取的10人中有8人愿意去西部支教,2人不愿意去西部支教,于是ξ=0,1,2,
∴P(ξ=0)==,P(ξ=1)==,
P(ξ=2)==,
∴ξ的分布列為
ξ 0 1 2
P
∴E(ξ)=0×+1×+2×=.
[規(guī)律方法] 解決一般的獨(dú)立性檢驗(yàn)問(wèn)題的步驟:
對(duì)點(diǎn)訓(xùn)練 某地為了調(diào)查市民對(duì)“一帶一路”倡議的了解程度,隨機(jī)選取了100名年齡在20歲至60歲的市民進(jìn)行問(wèn)卷調(diào)查,并通過(guò)問(wèn)卷的分?jǐn)?shù)把市民劃分為了解“一帶一路”倡議與不了解“一帶一路”倡議兩類(lèi),數(shù)據(jù)如表所示.
年齡/歲 [20,30) [30,40) [40,50) [50,60]
調(diào)查人數(shù) 30 30 25 15
了解“一帶一路”倡議人數(shù) 12 28 15 5
(1)完成下面的2×2列聯(lián)表,并判斷是否有90%的把握認(rèn)為以40歲為分界點(diǎn)對(duì)“一帶一路”倡議的了解有差異;(結(jié)果精確到0.001)
年齡低于40歲的人數(shù) 年齡不低于40歲的人數(shù) 合計(jì)
了解
不了解
合計(jì)
(2)以頻率估計(jì)概率,若在該地選出4名市民(年齡在20歲至60歲),記4名市民中了解“一帶一路”倡議的人數(shù)為X,求隨機(jī)變量X的分布列、數(shù)學(xué)期望和方差.附:
α 0.15 0.10 0.05 0.025 0.010
xα 2.072 2.706 3.841 5.024 6.635
χ2=,其中n=a+b+c+d.
[分析] (1)由表格讀取信息,年齡低于40歲的共60人,年齡不低于40歲的共40人,填寫(xiě)2×2列聯(lián)表,再把數(shù)據(jù)代入χ2公式計(jì)算;
(2)在總體未知的市民中選取4人,由頻率估計(jì)概率得出選出的每位市民是了解“一帶一路”倡議的概率,可知隨機(jī)變量X服從二項(xiàng)分布.
[解析] (1)根據(jù)已知數(shù)據(jù)得到2×2列聯(lián)表:
年齡低于40歲的人數(shù) 年齡不低于40歲的人數(shù) 合計(jì)
了解 40 20 60
不了解 20 20 40
合計(jì) 60 40 100
χ2=≈2.778>2.706,
故有90%的把握認(rèn)為以40歲為分界點(diǎn)對(duì)“一帶一路”倡議的了解有差異.
(2)由(1)知市民了解“一帶一路”倡議的概率為=,X~B.
X的所有可能取值為0,1,2,3,4,則
P(X=0)=C4=,
P(X=1)=C××3=,
P(X=2)=C2×2=,
P(X=3)=C3×=,
P(X=4)=C4=,則X的分布列為
X 0 1 2 3 4
P
E(X)=4×=,D(X)=4××=.
1.判斷兩個(gè)分類(lèi)變量是彼此相關(guān)還是相互獨(dú)立的常用的方法中,最為精確的是( B )
A.殘差 B.獨(dú)立性檢驗(yàn)
C.等高堆積條形圖 D.回歸分析
[解析] 用獨(dú)立性檢驗(yàn)考查兩個(gè)分類(lèi)變量是否有關(guān)系時(shí),算出隨機(jī)變量χ2的值越大,說(shuō)明“X與Y有關(guān)系”成立的可能性越大.
2.下列關(guān)于獨(dú)立性檢驗(yàn)的敘述:
①常用等高堆積條形圖表示列聯(lián)表數(shù)據(jù)的頻率特征;
②獨(dú)立性檢驗(yàn)依據(jù)的是小概率原理;
③獨(dú)立性檢驗(yàn)的結(jié)果是完全正確的;
④對(duì)分類(lèi)變量X與Y的隨機(jī)變量χ2的觀測(cè)值來(lái)說(shuō),χ2越小,X與Y有關(guān)系的把握程度就越大.
其中敘述正確的個(gè)數(shù)為( B )
A.1 B.2
C.3 D.4
[解析] 因?yàn)楠?dú)立性檢驗(yàn)常用等高堆積條形圖表示列聯(lián)表數(shù)據(jù)的頻率特征,故①正確;獨(dú)立性檢驗(yàn)依據(jù)的是小概率原理,故②正確;獨(dú)立性檢驗(yàn)的結(jié)果不是完全正確的,故③不正確;對(duì)分類(lèi)變量X與Y的隨機(jī)變量χ2的觀測(cè)值來(lái)說(shuō),χ2越大,X與Y有關(guān)系的把握程度才越大,故④不正確.所以正確的個(gè)數(shù)為2,故選B.
3.一個(gè)2×2列聯(lián)表如下:
y1 y2 總計(jì)
x1 a 35 45
x2 7 b n
總計(jì) m 73 s
則表中m,n的值分別是( B )
A.10,38 B.17,45
C.10,45 D.17,38
[解析] 由a+35=45,得a=10.由a+7=m,得m=17.由m+73=s,得s=90.由45+n=s,得n=45.
4.在一項(xiàng)打鼾與患心臟病的調(diào)查中,共調(diào)查了1 671人,經(jīng)過(guò)計(jì)算χ2的值χ2≈27.63,根據(jù)這一數(shù)據(jù)分析,我們有理由認(rèn)為打鼾與患心臟病是_有關(guān)__的(填“有關(guān)”或“無(wú)關(guān)”).
[解析] 由χ2≈27.63與臨界值比較,在犯錯(cuò)誤的概率不超過(guò)0.001的前提下,說(shuō)明打鼾與患心臟病有關(guān).章末知識(shí)梳理
知識(shí)點(diǎn) 1 變量的相關(guān)關(guān)系
1.散點(diǎn)圖
為了直觀地描述成對(duì)樣本數(shù)據(jù)中兩個(gè)變量間的關(guān)系,用橫軸表示其中的一個(gè)變量,縱軸表示另一個(gè)變量,則每一對(duì)成對(duì)樣本數(shù)據(jù)都可以用直角坐標(biāo)系中的點(diǎn)表示出來(lái),由這些點(diǎn)組成的統(tǒng)計(jì)圖叫做散點(diǎn)圖.
2.線性相關(guān)與非線性相關(guān)
(1)線性相關(guān)
一般地,如果兩個(gè)變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點(diǎn)落在一條直線附近,我們就稱(chēng)這兩個(gè)變量線性相關(guān).
(2)非線性相關(guān)
一般地,如果兩個(gè)變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱(chēng)這兩個(gè)變量非線性相關(guān).
知識(shí)點(diǎn) 2 樣本相關(guān)系數(shù)
1.樣本相關(guān)系數(shù)
(1)計(jì)算公式:
r=

(2)取值范圍:[-1,1].
2.樣本相關(guān)系數(shù)的意義
樣本相關(guān)系數(shù)r是一個(gè)描述成對(duì)樣本數(shù)據(jù)的數(shù)字特征,r的符號(hào)反映了相關(guān)關(guān)系的正負(fù)性;|r|的大小反映了兩個(gè)變量相關(guān)的程度,具體如下:
(1)r的正負(fù)
當(dāng)r>0時(shí),稱(chēng)成對(duì)數(shù)據(jù)正相關(guān);當(dāng)r<0時(shí),稱(chēng)成對(duì)數(shù)據(jù)負(fù)相關(guān).
(2)r的絕對(duì)值
當(dāng)|r|越接近于1時(shí),成對(duì)數(shù)據(jù)的線性相關(guān)程度越強(qiáng);
|r|越接近于0,成對(duì)數(shù)據(jù)線性相關(guān)程度越弱.
3.判斷相關(guān)關(guān)系的兩種方法
(1)通過(guò)作散點(diǎn)圖,觀察由所給的數(shù)據(jù)描出的點(diǎn)是否在一條直線附近來(lái)判定,直觀方便.
(2)利用相關(guān)系數(shù).
知識(shí)點(diǎn) 3 一元線性回歸模型參數(shù)的最小二乘估計(jì)
1.最小二乘估計(jì)
設(shè)滿足一元線性回歸模型的兩個(gè)變量的n對(duì)樣本數(shù)據(jù)為(x1,y1),(x2,y2),…,(xn,yn),當(dāng)a,b的取值為
時(shí),Q(隨機(jī)誤差的平方和)達(dá)到最?。覀儗ⅲ絰+稱(chēng)為y關(guān)于x的經(jīng)驗(yàn)回歸方程,也稱(chēng)經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱(chēng)為經(jīng)驗(yàn)回歸直線.這種求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估計(jì).
2.殘差分析
對(duì)于響應(yīng)變量y,通過(guò)觀測(cè)得到的數(shù)據(jù)稱(chēng)為觀測(cè)值,通過(guò)經(jīng)驗(yàn)回歸方程得到的稱(chēng)為預(yù)測(cè)值,觀測(cè)值減去預(yù)測(cè)值稱(chēng)為殘差.殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過(guò)對(duì)殘差的分析可以判斷模型刻畫(huà)數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等.殘差分析的一般方法有以下兩種:
(1)殘差圖
(2)R2的表達(dá)式及其意義
①計(jì)算公式R2=1-.
②對(duì)于已獲取的樣本數(shù)據(jù),R2表達(dá)式中的(yi-)2為確定的數(shù),因此R2越大,殘差平方和(yi-i)2越小,即模型的擬合效果越好;R2越小,殘差平方和越大,即模型的擬合效果越差.
知識(shí)點(diǎn) 4 分類(lèi)變量與列聯(lián)表
(1)分類(lèi)變量
(2)2×2列聯(lián)表
如下表所示,我們將給出成對(duì)分類(lèi)變量數(shù)據(jù)的交叉分類(lèi)頻數(shù)的表格,稱(chēng)為2×2列聯(lián)表.
y1 y2 合計(jì)
x1 a b a+b
x2 c d c+d
合計(jì) a+c b+d a+b+c+d
(3)等高堆積條形圖
與表格相比,圖形更能直觀地反映出兩個(gè)分類(lèi)變量間是否相互影響,常用等高條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征.分別計(jì)算出中間四個(gè)數(shù)各自的頻率,可以用等高堆積條形圖直觀展示上述計(jì)算結(jié)果.
注意:(1)在等高堆積條形圖中,列聯(lián)表的行對(duì)應(yīng)的是高度,兩行的數(shù)據(jù)不相等,但對(duì)應(yīng)的條形圖的高度是相同的;同一行中兩列數(shù)據(jù)對(duì)應(yīng)不同的顏色.
(2)等高堆積條形圖中有兩個(gè)高度相同的矩形,每一個(gè)矩形中都有兩種顏色,如果兩個(gè)高度相差比較明顯,就判斷兩個(gè)分類(lèi)變量之間有關(guān)聯(lián).
知識(shí)點(diǎn) 5 獨(dú)立性檢驗(yàn)的基本思想
1.獨(dú)立性檢驗(yàn)的定義
一般地,假設(shè)有兩個(gè)分類(lèi)變量X和Y,其樣本頻數(shù)
X Y 合計(jì)
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合計(jì) a+c b+d n=a+b+c+d
依據(jù)上述2×2列聯(lián)表構(gòu)造統(tǒng)計(jì)量
χ2=,利用隨機(jī)變量χ2的取值推斷分類(lèi)變量是否獨(dú)立的方法稱(chēng)為χ2獨(dú)立性檢驗(yàn),簡(jiǎn)稱(chēng)獨(dú)立性檢驗(yàn).
2.臨界值表
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
3.應(yīng)用獨(dú)立性檢驗(yàn)的主要環(huán)節(jié)
(1)提出零假設(shè)H0:分類(lèi)變量X和Y相互獨(dú)立,并給出在問(wèn)題中的解釋?zhuān)?br/>(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計(jì)算χ2的值,并與臨界值xα比較.
(3)根據(jù)檢驗(yàn)規(guī)則得出推斷結(jié)論.
(4)在X和Y不獨(dú)立的情況下,根據(jù)需要,通過(guò)比較相應(yīng)的頻率,分析X和Y間的影響規(guī)律.
要點(diǎn)一 回歸分析
回歸分析是對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法,也是本章的重點(diǎn)、高考的熱點(diǎn),主要考查線性回歸分析.題型既有選擇、填空題,也有解答題.
典例1 連鎖經(jīng)營(yíng)公司所屬5個(gè)零售店某月的銷(xiāo)售額利潤(rùn)資料如表:
商店名稱(chēng) A B C D E
銷(xiāo)售額x/千萬(wàn)元 3 5 6 7 9
利潤(rùn)額y/百萬(wàn)元 2 3 3 4 5
(1)畫(huà)出銷(xiāo)售額和利潤(rùn)額的散點(diǎn)圖;
(2)若銷(xiāo)售額和利潤(rùn)額具有相關(guān)關(guān)系,試計(jì)算利潤(rùn)額y對(duì)銷(xiāo)售額x的經(jīng)驗(yàn)回歸直線方程;
(3)估計(jì)要達(dá)到1 000萬(wàn)元的利潤(rùn)額,銷(xiāo)售額約為多少萬(wàn)元.
參考公式:==,=-
[分析] (1)根據(jù)表中所給的數(shù)據(jù),在平面直角坐標(biāo)系中畫(huà)出散點(diǎn)圖即可;(2)求出對(duì)應(yīng)的數(shù)值,,以及n ,iyi,和n2,代入公式即可求出經(jīng)驗(yàn)回歸直線方程的系數(shù)與方程;(3)根據(jù)題意,令=10(注意單位),求出x的值即可.
[解析] (1)根據(jù)表中所給的5對(duì)數(shù)據(jù),在平面直角坐標(biāo)系中畫(huà)出散點(diǎn)圖,如圖所示.
(2)∵==6,
==,
∴n?。?×6×=102,
iyi=3×2+5×3+6×3+7×4+9×5=112,
=32+52+62+72+92=200,
n2=5×62=180,
===0.5,
=-=-0.5×6==0.4,
∴利潤(rùn)額y對(duì)銷(xiāo)售額x的經(jīng)驗(yàn)回歸直線方程是=0.5x+0.4.
(3)根據(jù)題意,令=0.5x+0.4=10,
解得x=19.2(千萬(wàn)元),
故銷(xiāo)售額約為19 200萬(wàn)元.
[規(guī)律方法] 1.建立經(jīng)驗(yàn)回歸模型的步驟
(1)確定研究對(duì)象,明確變量x,y.
(2)畫(huà)出變量的散點(diǎn)圖,觀察它們之間的關(guān)系.
(3)確定經(jīng)驗(yàn)回歸方程的類(lèi)型.
(4)按一定規(guī)則估計(jì)經(jīng)驗(yàn)回歸方程中的參數(shù)(如最小二乘法).
(5)得出經(jīng)驗(yàn)回歸方程.
2.分析兩個(gè)變量線性相關(guān)的常用方法
(1)散點(diǎn)圖法,該法主要是用來(lái)直觀地分析兩變量間是否存在相關(guān)關(guān)系.
(2)相關(guān)系數(shù)法,該法主要是從量上分析兩個(gè)變量間相互聯(lián)系的密切程度,|r|越接近于1,相關(guān)程度越大;|r|越接近于0,相關(guān)程度越?。?br/>要點(diǎn)二 獨(dú)立性檢驗(yàn)的基本思想與方法
獨(dú)立性檢驗(yàn)的基本思想是:先作出零假設(shè)H0,即假設(shè)兩個(gè)分類(lèi)變量沒(méi)有關(guān)系,再根據(jù)這個(gè)假設(shè)應(yīng)用統(tǒng)計(jì)的方法進(jìn)行分析,得到一個(gè)統(tǒng)計(jì)量χ2的值,再由統(tǒng)計(jì)學(xué)得到的各臨界值,確定我們的假設(shè)是否成立,以及假設(shè)的不合理程度.
典例2 某校為了探索一種新的教學(xué)模式, 進(jìn)行了一項(xiàng)課題實(shí)驗(yàn),乙班為實(shí)驗(yàn)班,甲班為對(duì)比班,甲、乙兩班均有50人,一年后對(duì)兩班進(jìn)行測(cè)試,成績(jī)?nèi)缦卤?總分:150分).
甲班
成績(jī) [80,90) [90,100) [100,110) [110,120) [120,130]
頻數(shù) 4 20 15 10 1
乙班
成績(jī) [80,90) [90,100) [100,110) [110,120) [120,130]
頻數(shù) 1 11 23 13 2
(1)現(xiàn)從甲班成績(jī)位于[90,120)內(nèi)的試卷中抽取9份進(jìn)行試卷分析,請(qǐng)問(wèn)用什么抽樣方法更合理,并寫(xiě)出最后的抽樣結(jié)果;
(2)根據(jù)所給數(shù)據(jù)可估計(jì)在這次測(cè)試中,甲班的平均分是101.8,請(qǐng)你估計(jì)乙班的平均分,并計(jì)算兩班平均分相差幾分;
(3)完成下面2×2列聯(lián)表,依據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),分析這兩個(gè)班在這次測(cè)試中成績(jī)的差異與實(shí)施課題實(shí)驗(yàn)是否有關(guān),并說(shuō)明理由.
成績(jī)小于100分 成績(jī)不小于 100分 總計(jì)
甲班26 50
乙班 12 50
總計(jì) 36 64 100
[分析] →→
(2)→→
(3)
[解析] (1)用分層抽樣的方法更合理.甲班成績(jī)位于[90,120)內(nèi)的試卷共有20+15+10=45(份),從中抽取9份,抽樣比為=,故在[90,100),[100,110),[110,120)各分?jǐn)?shù)段內(nèi)抽取試卷20×=4(份),15×=3(份),10×=2(份).
(2)估計(jì)乙班的平均分為乙=85×+95×+105×+115×+125×=105.8,105.8-101.8=4,即兩班的平均分相差4分.
(3)補(bǔ)全列聯(lián)表如下:
成績(jī)小于100分 成績(jī)不小于100分 總計(jì)
甲班 24 26 50
乙班 12 38 50
總計(jì) 36 64 100
零假設(shè)H0:兩個(gè)班的成績(jī)差異與實(shí)施課題實(shí)驗(yàn)無(wú)關(guān).
由列聯(lián)表中的數(shù)據(jù),得χ2的觀測(cè)值為
χ2==6.25>3.841=x0.05,根據(jù)小概率值α=0.05的獨(dú)立檢驗(yàn),我們推斷H0不成立,即認(rèn)為這兩個(gè)班在這次測(cè)試中成績(jī)的差異與實(shí)施課題有關(guān),此推斷犯錯(cuò)誤率不超過(guò)0.05.
[規(guī)律方法] 使用2×2列聯(lián)表進(jìn)行獨(dú)立性檢驗(yàn):
(1)根據(jù)數(shù)據(jù)繪制2×2列聯(lián)表,并檢驗(yàn)數(shù)據(jù)是否符合要求.
(2)由公式χ2=,計(jì)算 出χ2的值.
(3)將χ2的數(shù)值與臨界值進(jìn)行對(duì)比.
(4)作出統(tǒng)計(jì)判斷.
要點(diǎn)三 概率、統(tǒng)計(jì)與獨(dú)立性檢驗(yàn)的綜合問(wèn)題
概率、統(tǒng)計(jì)與獨(dú)立性檢驗(yàn)的綜合問(wèn)題在高考中常常出現(xiàn),一般為解答題,難度中等.有時(shí)古典概型與獨(dú)立性檢驗(yàn)綜合,有時(shí)樣本的分布與獨(dú)立性檢驗(yàn)綜合,更有三者融合在一起的綜合性較強(qiáng)的題目出現(xiàn).
典例3 某電視傳媒公司為了解某地區(qū)電視觀眾對(duì)某體育節(jié)目的收視情況,隨機(jī)抽取了100名觀眾進(jìn)行調(diào)查.根據(jù)調(diào)查結(jié)果繪制的觀眾日均收看該體育節(jié)目時(shí)間的頻率分布直方圖如圖所示:
將日均收看該體育節(jié)目的時(shí)間不低于40分鐘的觀眾稱(chēng)為“體育迷”.
(1)根據(jù)已知條件完成下面的2×2列聯(lián)表,試根據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),分析“體育迷”是否與性別有關(guān);
性別 電視觀眾 合計(jì)
非體育迷 體育迷

女 10 55
合計(jì)
(2)將上述調(diào)查所得到的頻率視為概率.現(xiàn)在從該地區(qū)大量電視觀眾中,采用隨機(jī)抽樣方法每次抽取1名觀眾,抽取3次,記被抽取的3名觀眾中的“體育迷”人數(shù)為X.若每次抽取的結(jié)果是相互獨(dú)立的,求X的分布列,期望E(X)和方差D(X).
附χ2=
P(χ2≥k) 0.05 0.01
k 3.841 6.635
[解析] (1)由頻率分布直方圖可知,在抽取的100名觀眾中,“體育迷”有25名,從而2×2列聯(lián)表如下:
性別 電視觀眾 合計(jì)
非體育迷 體育迷
男 30 15 45
女 45 10 55
合計(jì) 75 25 100
零假設(shè)H0:“體育迷”與性別無(wú)關(guān).
將2×2列聯(lián)表中的數(shù)據(jù)代入公式計(jì)算,得
χ2=≈3.030<3.841=x0.05.
根據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),沒(méi)有充分證據(jù)推斷H0不成立,因此可以認(rèn)為H0成立,即認(rèn)為“體育迷”與性別無(wú)關(guān).
(2)由頻率分布直方圖知抽到“體育迷”的頻率為0.25,將頻率視為概率,即從觀眾中抽取一名“體育迷”的概率為.由題意知X~B,從而X的分布列為
X 0 1 2 3
P
E(X)=np=3×=,
D(X)=np(1-p)=3××=.
[規(guī)律方法] 使用2×2列聯(lián)表進(jìn)行獨(dú)立性檢驗(yàn)的步驟:
(1)根據(jù)數(shù)據(jù)繪制2×2列聯(lián)表,并檢驗(yàn)數(shù)據(jù)是否符合要求.
(2)由公式χ2=,計(jì)算出χ2的值.
(3)將χ2的數(shù)值與臨界值進(jìn)行對(duì)比.
(4)作出統(tǒng)計(jì)判斷.

展開(kāi)更多......

收起↑

資源列表

    <track id="r4fhd"></track>

    <pre id="r4fhd"><abbr id="r4fhd"><code id="r4fhd"></code></abbr></pre>
      <ul id="r4fhd"></ul>

        <menu id="r4fhd"></menu>
        1. 主站蜘蛛池模板: 清原| 沁水县| 嘉义市| 社旗县| 金川县| 洛扎县| 当雄县| 大新县| 扶沟县| 东辽县| 思南县| 全州县| 石河子市| 乐陵市| 怀安县| 庄河市| 云霄县| 固始县| 鄂州市| 蒙城县| 南丰县| 邹平县| 将乐县| 嘉善县| 鄱阳县| 牙克石市| 太谷县| 耿马| 商城县| 福建省| 玛纳斯县| 仁怀市| 开封县| 祁连县| 湖南省| 弥勒县| 贡嘎县| 同仁县| 宁夏| 招远市| 伊宁市|