中文字幕精品无码一区二区,成全视频在线播放观看方法,大伊人青草狠狠久久,亚洲一区影音先锋色资源

2026屆高考數學第九章 統計 課件(5份打包)

資源下載
  1. 二一教育資源

2026屆高考數學第九章 統計 課件(5份打包)

資源簡介

(共79張PPT)
第九章
§9.1 隨機抽樣、統計圖表
數學





1.了解獲取數據的基本途徑.
2.會用簡單隨機抽樣的方法從總體中抽取樣本,了解分層隨機抽樣.
3.能根據實際問題的特點選擇恰當的統計圖表,體會使用統計圖表的重要性.
課標要求
課時精練
內容索引
第一部分 落實主干知識
第二部分 探究核心題型
落實主干知識
第一部分
1.總體、個體、樣本
調查對象的全體(或調查對象的某些指標的全體)稱為   ,組成總體的每一個調查對象(或每一個調查對象的相應指標)稱為   ,在抽樣調查中,從總體中抽取的那部分個體稱為   ,樣本中包含的個體數稱為
     ,簡稱樣本量.
2.簡單隨機抽樣
    和     是比較常用的兩種方法.
總體
個體
樣本
樣本容量
抽簽法
隨機數法
3.分層隨機抽樣
一般地,按一個或多個變量把總體劃分成若干個子總體,每個個體屬于且僅屬于一個子總體,在每個子總體中獨立地進行簡單隨機抽樣,再把所有子總體中抽取的樣本合在一起作為總樣本,這樣的抽樣方法稱為_________
   ,每一個子總體稱為  .
分層隨機
抽樣

4.統計圖表
(1)常見的統計圖表有    、    、    、        等.
(2)作頻率分布直方圖的步驟
①求   ;
②決定   與   ;
③將數據   ;
④列頻率分布表;
⑤畫頻率分布直方圖.
條形圖
扇形圖
折線圖
頻率分布直方圖
極差
組距
組數
分組
1.判斷下列結論是否正確.(請在括號中打“√”或“×”)
(1)在簡單隨機抽樣中,每個個體被抽到的機會與先后順序有關.(  )
(2)抽簽法和隨機數法都是簡單隨機抽樣.(  )
(3)在按比例分配的分層隨機抽樣中,每個個體被抽到的可能性與層數及分層有關.(  )
(4)在頻率分布直方圖中,小長方形的面積越大,表示樣本數據落在該區間的頻率越大.(  )

×

×
2.從某年級500名學生中抽取60名學生進行體重的統計分析,就這個問題來說,下列說法不正確的是
A.該年級500名學生的體重是總體
B.該年級每名學生的體重是個體
C.抽取的60名學生的體重是一個樣本
D.抽取的60名學生的體重是樣本容量

由題可知,從某年級500名學生中抽取60名學生進行體重的統計分析,其中總體是該年級500名學生的體重,個體是該年級每名學生的體重,樣本是抽取的60名學生的體重,樣本容量是60,故只有D不正確.
3.“中國天眼”為500米口徑球面射電望遠鏡,是具有我國自主知識產權、世界最大、最靈敏的單口徑射電望遠鏡.建造“中國天眼”的目的是
A.通過調查獲取數據 B.通過試驗獲取數據
C.通過觀察獲取數據 D.通過查詢獲取數據
“中國天眼”主要是通過觀察獲取數據.

4.從某校隨機抽取某次數學考試100分以上(含100分,滿分150分)的學生成績,將他們的分數繪制成如圖所示的頻率分布直方圖.若共抽取了100名學生的成績,則分數在[120,130)內的人數為    .
30
因為頻率分布直方圖中所有的小矩形面積和為1,所以(0.005+0.035+a+0.020+0.010)×10=1,解得a=0.030,所以分數在[120,130)內的人數為100×0.030×10=30.
1.利用按比例分配的分層隨機抽樣要注意按比例抽取,若各層應抽取的個體數不都是整數,可以進行一定的技術處理,比如將結果取成整數等.
2.頻率分布直方圖中縱軸上的數據是各組的頻率除以組距,不要和條形圖混淆.
返回
微點提醒
探究核心題型
第二部分
例1 (1)(2024·西安模擬)某高校對中文系新生進行體測,利用隨機數法對650名學生進行抽樣,先將650名學生進行編號:001,002,…,649,650.從中抽取50個樣本,下面提供隨機數表的第4行到第6行,若從表中第5行第6列開始向右讀取數據,則得到的第6個樣本編號是
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.623 B.328 C.072 D.457

抽樣方法
題型一
從第5行第6列開始向右讀取數據,第一個數為253,第二個數是313,第三個數是457,下一個數是860,不符合要求,下一個數是736,不符合要求,下一個數是253,重復,第四個數是007,第五個數是328,第六個數是623,故A正確.
(2)某課題組對甲、乙、丙三地的空氣質量進行調查,按地域特點分別在三地設置空氣質量觀測點.已知甲、乙、丙三地內觀測點的個數分別為20,y,z且依次構成等差數列,而20,y-10,z成等比數列,若用按比例分配的分層隨機抽樣的方法抽取觀測點的30個數據,則丙地應抽取的數據個數為
A.18 B.16 C.10 D.4

依題意得
解得(舍去).
所以丙地應抽取的數據個數為×30=16.
(1)簡單隨機抽樣需滿足:①被抽取的樣本總體的個體數有限;②等可能抽取.
(2)在按比例分配的分層隨機抽樣中,抽樣比=.
思維升華
跟蹤訓練1 (1)下列抽樣方法是簡單隨機抽樣的是
A.某醫院從200名醫生中,挑選出50名最優秀的醫生去參加培訓
B.從10部手機中逐個不放回地隨機抽取2部進行質量檢驗
C.從空間直角坐標系中抽取10個點作為樣本
D.飲料公司從倉庫中的500箱飲料中一次性抽取前10箱進行質量檢查

A選項中,挑選出50名最優秀的醫生去參加培訓,每個人被抽到的概率不相等,故A錯誤;
B選項中,從10部手機中逐個不放回地隨機抽取2部進行質量檢驗,是簡單隨機抽樣,故B正確;
C選項中,由于被抽取的樣本總體的個數是無限的,所以不是簡單隨機抽樣,故C錯誤;
D選項中,一次性抽取前10箱,每箱被抽到的概率不相等,所以不是簡單隨機抽樣,故D錯誤.
(2)(2024·駐馬店模擬)某電影上映引發了電信詐騙問題的熱議,也加大了各個社區反電信詐騙的宣傳力度.已知某社區共有居民480人,其中老年人200人,中年人200人,青少年80人,若按年齡進行按比例分配的分層隨機抽樣,共抽取36人作為代表,則中年人比青少年多
A.6人 B.9人 C.12人 D.18人

設中年人抽取x人,青少年抽取y人,由按比例分配的分層隨機抽樣可知
,解得x=15,y=6,故中年人比青少年多9人.
統計圖表
題型二
例2 (1)(多選)根據不同年齡段學生身心發展特點,小學生每天睡眠時間應達到10小時,初中生應達到9小時,高中生應達到8小時.某機構調查了1萬名學生睡眠及學習的時間,利用信息得出如圖所示的折線圖,則以下判斷正確的有
A.高三年級學生平均學習時間最長
B.中小學生的平均睡眠時間都沒有達到標準,
 其中高中生平均睡眠時間最接近標準
C.大多數年齡段學生平均睡眠時間長于學習
 時間
D.與高中生相比,大學生平均學習時間大幅
 下降,釋放出的時間基本是在睡眠


根據圖象可知,高三年級學生平均學習時間沒有高二年級學生平均學習時間長,故A錯誤;
根據圖象可知,中小學生的平均睡眠時間都沒有達到標準,其中高中生平均睡眠時間最接近標準,故B正確;
根據圖象可知,學習時間長于睡眠時間的有初二、初三、高一、高二、
高三,占比為,所以大多數年齡
段學生平均睡眠時間長于學習時間,故C正確;
從高三到大學一年級,學習時間減少了9.65-5.71=3.94(小時/天),睡眠時間增加了8.52-7.91=0.61(小時/天),故D錯誤.
(2)(多選)(2025·赤峰模擬)某學校組建了合唱、朗誦、脫口秀、舞蹈、太極拳五個社團,該校共有2 000名學生,每名學生依據自己的興趣愛好最多可參加其中一個社團,各個社團的人數比例的扇形圖如圖所示,其中參加朗誦社團的學生有8名,參加太極拳社團的學生有12名,則
A.這五個社團的總人數為100
B.脫口秀社團的人數占五個社團總人數的20%
C.這五個社團的總人數占該校學生人數的5%
D.從這五個社團中任選一人,其來自脫口秀社團或舞蹈社
 團的概率為45%


對于A,參加朗誦社團的學生有8名,占比為10%,所以
這五個社團的總人數為8÷10%=80(人),故A錯誤;
對于B,參加太極拳社團的學生有12名,可知其占五個
社團總人數的12÷80=15%,
因此脫口秀社團的人數占五個社團總人數的1-30%-10%-25%-15%=20%,故B正確;
對于C,該校共有2 000名學生,所以這五個社團的總人數占該校學生人數的80÷2 000=4%,故C錯誤;
對于D,由選項B易知脫口秀社團共有80×20%=16(人),
舞蹈社團共有80×25%=20(人),兩社團共有36人,所以
從這五個社團中任選一人,其來自脫口秀社團或舞蹈社
團的概率為36÷80=45%,故D正確.
統計圖表的主要應用
(1)扇形圖:直觀描述各類數據占總數的比例.
(2)折線圖:描述數據隨時間的變化趨勢.
(3)條形圖和直方圖:直觀描述不同類別或分組數據的頻數和頻率.
思維升華
跟蹤訓練2 (1)(多選)(2024·深圳模擬)為豐富優質旅游資源,釋放旅游消費潛力,推動旅游業高質量發展,某地政府從2024年國慶期間到該地旅游的游客中,隨機抽取部分游客進行調查,得到各年齡段游客的人數和對景區服務是否滿意的數據,并繪制統計圖如圖所示,則下列結論正確的是
A.到該地旅游的游客中,青年人是老
 年人的2倍多
B.到該地旅游的老年人的滿意人數是
 青年人的2倍
C.到該地旅游的游客中滿意的中年人
 占總游客人數的24.5%
D.到該地旅游的游客滿意人數超過一半



由扇形圖可知青年人占比45%,是老
年人占比20%的2倍多,故A正確;
其中滿意的青年人占總人數的0.45×
0.4×100%=18%,滿意的中年人占
總人數的(1-0.45-0.2)×0.7×100%
=24.5%,滿意的老年人占總人數的0.2×0.8×100%=16%,故B錯誤,C正確;
總滿意率為18%+24.5%+16%=58.5%>50%,故D正確.
(2)(多選)空氣質量指數(AQI)是反映空氣質量狀況的指數,AQI值越小,表明空氣質量越好,AQI不超過50,空氣質量為“優”;AQI大于50且不超過100,空氣質量為“良”;AQI大于100,空氣質量為“污染”.如圖是某市2023年空氣質量指數(AQI)折線圖.下列關于該市2023年空氣質量的敘述中,說法正確的是
A.2023年全年平均AQI對應的空氣質量
 等級為優或良
B.每月都至少有一天空氣質量等級為優
C.2月、8月、9月和12月均出現污染天氣
D.空氣質量為“污染”的天數最多的月份是2月份



根據折線圖可知,每月平均AQI都小
于100,故2023年全年平均AQI小于
100,對應的空氣質量等級為優或良,
故A正確;
每月AQI的最小值不超過50,故B正確;
2月、8月、9月和12月的AQI的最大值超過100,故C正確;
從折線圖只能知道,2月AQI的最大值最大,不能說明2月的空氣質量為“污染”的天數最多,故D不正確.
頻率分布直方圖
題型三
例3 某公司為了了解顧客對其旗下產品的滿意程度,隨機抽取n名顧客進行滿意度問卷調查,所得評分(滿分100分)均在[40,100]內,按從低到高將滿意度分為四個等級:
調查評分 [40,50) [50,60) [60,70) [70,80) [80,90) [90,100]
滿意度等級 不滿意 一般 良好 滿意
并繪制如圖所示的頻率分布直方圖.已知調查評分在[70,80)內的顧客為80人.
(1)求n的值及頻率分布直方圖中t的值;
由題意知0.02×10n=80,10t+0.06+0.1+0.2+60t+90t=1,
所以n=400,t=0.004.
(2)若某段時間有10 000名顧客購買該公司的產品,請估計這10 000名顧客中對該公司產品滿意度等級達到“滿意”的人數;
6t=6×0.004=0.024,
則估計這10 000名顧客中對該公司產品滿意度等級達到“滿意”的人數為10 000×0.024×10=2 400.
(3)該公司設定的預案是:以抽取的樣本作為參考,若顧客調查評分的均值低于80分,則需要對該公司旗下產品進行調整,否則不需要調整,根據你所學的統計知識,判斷該公司是否需要對旗下產品進行調整,并說明理由.(每組數據以區間的中點值代替)
由頻率分布直方圖得,顧客調查評分的均值為45×0.04+55×0.06+65×0.1+75×0.2+85×0.36+95×0.24=80(分),
由題意知該公司不需要對旗下產品進行調整.
頻率分布直方圖的相關結論
(1)頻率分布直方圖中各小長方形的面積之和為1.
(2)頻率分布直方圖中縱軸表示,每組樣本的頻率為組距×,
即小長方形的面積.
(3)頻率分布直方圖中每組樣本的頻數為頻率×總數.
思維升華
跟蹤訓練3 某校為了解學生學習的效果,進行了一次摸底考試,從中選取60名學生的成績,分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六組后,得到不完整的頻率分布直方圖如圖所示,觀察圖形,回答下列問題:
(1)求分數在區間[70,80)內的頻率,并補全這個頻率分布直方圖;
設分數在[70,80)內的頻率為x,
根據頻率分布直方圖,可得(0.01+0.015+0.02
+0.025+0.005)×10+x=1,解得x=0.25,
所以分數在[70,80)內的頻率為0.25,
補全這個頻率分布直方圖,如圖所示.
(2)根據評獎規則,排名在前10%的學生可以獲獎,請你估計獲獎的學生至少需要多少分?
因為分數在區間[80,90)內的頻率為0.25,在區
間[90,100]內的頻率為0.05,
而0.05<10%<0.25+0.05,
設排名前10%的分界點為90-a,則0.025a+
0.005×10=10%,解得a=2,
所以排名前10%的分界點為88分,即獲獎的學生至少需要88分.
返回
課時精練
對一對
答案
1
2
3
4
5
6
7
8
9
10
11
12
題號 1 2 3 4 5 6 7
答案 A C C B ABD BC 32
題號 8 11 12 答案 (1)36 (2)60 14 A BC 答案
1
2
3
4
5
6
7
8
9
10
11
12
(1)由統計圖表可知,當3≤n<5時,“一般”檔次占比26%,對應的學生
人數為6+7=13,故學生總人數為=50.
(2)由統計圖表可知,當5≤n<8時,“良好”檔次占比60%,即50×60%=12+x+7,解得x=11,又總人數為50,故y=50-(1+2+6+7+12+11+7+1)=3,
即x=11,y=3.
9.
答案
1
2
3
4
5
6
7
8
9
10
11
12
(3)由統計圖表可知,“優秀”檔次占比為=8%,故該校九年級400名學生中為“優秀”檔次的人數約為400×8%=32.
9.
答案
1
2
3
4
5
6
7
8
9
10
11
12
(1)依題可知,患病者該指標的頻率分布直方圖中第一個小矩形的面積為5×0.002=0.01=1%>0.5%,所以95所以(c-95)×0.002=0.5%,解得c=97.5,
q(c)=0.01×(100-97.5)+5×0.002=0.035=3.5%.
10.
答案
1
2
3
4
5
6
7
8
9
10
11
12
(2)當c∈[95,100)時,
f(c)=p(c)+q(c)=(c-95)×0.002+(100-c)×0.01+5×0.002=-0.008c+0.82> 0.02;
當c∈[100,105]時,
f(c)=p(c)+q(c)=5×0.002+(c-100)×0.012+(105-c)×0.002=0.01c-0.98≥ 0.02,
故f(c)=
所以f(c)在區間[95,105]的最小值為0.02.
10.
一、單項選擇題
1.在“世界讀書日”前夕,為了了解某地5 000名居民某天的閱讀時間,從中抽取了200名居民的閱讀時間進行統計分析.在這個問題中,5 000名居民的閱讀時間的全體是
A.總體 B.個體
C.樣本容量 D.從總體中抽取的一個樣本
1
2
3
4
5
6
7
8
9
10
11
12
知識過關
答案

1
2
3
4
5
6
7
8
9
10
11
12
答案
樣本容量是200,抽取的200名居民的閱讀時間是一個樣本,每個居民的閱讀時間就是一個個體,5 000名居民的閱讀時間的全體是總體.
1
2
3
4
5
6
7
8
9
10
11
12
答案
2.(2024·西安模擬)某醫院有醫生750人,護士1 600人,其他工作人員150人,用按比例分配的分層隨機抽樣的方法從這些人中抽取一個樣本容量為50的樣本,則樣本中醫生比護士少
A.19人 B.18人 C.17人 D.16人
由題意知樣本中醫生抽取×50=15(人),護士抽取×50=32(人),故樣本中醫生比護士少32-15=17(人).

1
2
3
4
5
6
7
8
9
10
11
12
答案
3.如圖為近一年我國商品零售總額和餐飲收
入總額同比增速情況折線圖,根據該圖,下
列結論正確的是
(注:同比,指當前的數據與上一年同期進
行比對;環比,指當前數據與上個月的數
據進行比對)
A.2024年1~2月份,商品零售總額同比增長9.2%
B.2023年3~12月份,餐飲收入總額同比都降低
C.2023年6~10月份,商品零售總額同比都增加
D.2023年12月,餐飲收入總額環比增速為-14.1%

1
2
3
4
5
6
7
8
9
10
11
12
答案
2024年1~2月份,商品零售總額同比增長
2.9%,故A錯誤;
2023年8月份,餐飲收入總額同比增加,
故B錯誤;
2023年6~10月份,商品零售總額同比都
增加,故C正確;
2023年12月,餐飲收入總額環比增速并未告知,故D錯誤.
1
2
3
4
5
6
7
8
9
10
11
12
答案
4.在某區高三年級第一學期初舉行的一次質量檢測中,某學科共有2 000人參加考試.為了解本次考試學生的該學科的成績情況,從中抽取了n名學生的成績(成績均為正整數,滿分為100分)作為樣本進行統計,成績均在[50,100]內,按照[50,60),[60,70),[70,80),[80,90),[90,100]分組作出頻率分布直方圖(如圖所示).已知成績落在[50,60)內的人數為16,則下列結論錯誤的是
A.m=0.016
B.n=1 000
C.估計全體學生該學科成績的平均分為70.6分
D.若成績低于60分為不及格,則估計全體學生中
 不及格的人數為320

1
2
3
4
5
6
7
8
9
10
11
12
答案
由題意有(m+0.030+0.040+0.010+0.004)×10
=1,解得m=0.016,所以成績落在[50,60)內
的頻率為0.16,故=0.16,解得n=100,故A
正確,B錯誤;
平均分=55×0.16+65×0.30+75×0.40+85×0.10+95×0.04=70.6(分),故C正確;
不及格的頻率為0.16,所以估計總體中不及格的學生人數為0.16×2 000=320,故D正確.
1
2
3
4
5
6
7
8
9
10
11
12
答案
二、多項選擇題
5.某高中高一學生從物化生政史地六科中選三科組合,其中選物化生組合的學生有600人,選物化地組合的學生有400人,選政史地組合的學生有250人,其他組合均無人選.現從高一學生中選取25人作樣本調研情況.為保證調研結果相對準確,下列判斷正確的是
A.用按比例分配的分層隨機抽樣的方法抽取物化生組合的學生為12人
B.用按比例分配的分層隨機抽樣的方法抽取政史地組合的學生為5人
C.物化生組合學生小張被選中的概率比物化地組合學生小王被選中的概
 率大
D.政史地組合學生小劉被選中的概率為



1
2
3
4
5
6
7
8
9
10
11
12
答案
用按比例分配的分層隨機抽樣的方法抽取物化生組合的學生為 25×
=12(人),故A正確;
用按比例分配的分層隨機抽樣的方法抽取政史地組合的學生為25×
=5(人),故B正確;
根據按比例分配的分層隨機抽樣的特征知,每名學生被選中的概率相等,
均為,故C錯誤,D正確.
1
2
3
4
5
6
7
8
9
10
11
12
答案
6.某校為了更好地支持學生個性發展,開設了學科拓展類、科技創新類、體藝特長類三種類型的校本課程,每個學生從中選擇一門課程學習.現對該校5 000名學生的選課情況進行了統計,如圖1,并用按比例分配的分層隨機抽樣的方法從中抽取2%的學生對所選課程進行了滿意率調查,如圖2.則下列說法正確的是
A.滿意率調查中抽取的樣本容量為5 000
B.該校學生中選擇學科拓展類課程的人
 數為1 250
C.該校學生中對體藝特長類課程滿意的
 人數約為875
D.若抽取的學生中對科技創新類課程滿意的人數為30,則a=70


1
2
3
4
5
6
7
8
9
10
11
12
答案
滿意率調查中抽取的樣本容量為5 000×
2%=100,A錯誤;
由扇形圖知1-35%-40%=25%,則
5 000×25%=1 250(人),B正確;
該校學生中對體藝特長類課程滿意的人
數約為5 000×35%×50%=875,C正確;
抽取的學生中對科技創新類課程滿意的人數為30,則100×40%×a%=30,則a=75,D錯誤.
三、填空題
7.為了解某校今年報考飛行員的學生的體重情況.將所得的數據整理后,作出了頻率分布直方圖(如圖).已知圖中從左到右的前3個小組的頻率之比為1∶2∶3,第1小組的頻數為4,則該校報考飛行員的學生總人數是    .
1
2
3
4
5
6
7
8
9
10
11
12
答案
32
1
2
3
4
5
6
7
8
9
10
11
12
答案
由圖可知后兩個組頻率為(0.012 5+0.037 5)×
5=0.25,又因為從左到右的前3個小組的頻率
之比為1∶2∶3,所以第1小組的頻率為(1-
0.25)×=0.125,又因為第1小組的頻
數為4,所以報考飛行員的學生人數是4÷0.125=32.
1
2
3
4
5
6
7
8
9
10
11
12
答案
8.在結束了380課時初中階段數學內容的教學后,唐老師根據數學內容所占課時比例,繪制如圖所示的統計圖表(圖1~圖3),請根據圖表提供的信息,回答下列問題:
1
2
3
4
5
6
7
8
9
10
11
12
答案
(1)圖1中“統計與概率”所在扇形的圓心角為   度;
36
由扇形圖可知“統計與概率”所在扇形的圓心角為(1-45%-5%-40%)
×360°=36°.
1
2
3
4
5
6
7
8
9
10
11
12
答案
(2)圖2,3中的a=   ,b=    .
60
14
由圖1和圖2可知a=380×45%-67-44=60,由圖3知b=60-18-13-12-3=14.
1
2
3
4
5
6
7
8
9
10
11
12
答案
四、解答題
9.某校為了解九年級學生近兩個月“推薦書目”的閱讀
情況,隨機抽取了該年級的部分學生,調查了他們每人
“推薦書目”的閱讀本數,設每名學生的閱讀本數為n,
并按以下規定分為四檔:當n<3時,為“偏少”;當3≤
n<5時,為“一般”;當5≤n<8時,為“良好”;當n≥
8時,為“優秀”,現將調查結果統計后繪制成不完整的統計圖表:
閱讀本數n/本 1 2 3 4 5 6 7 8 9
人數/名 1 2 6 7 12 x 7 y 1
1
2
3
4
5
6
7
8
9
10
11
12
答案
請根據以上信息回答下列問題:
(1)求出本次隨機抽取的學生總人數;
閱讀本數n/本 1 2 3 4 5 6 7 8 9
人數/名 1 2 6 7 12 x 7 y 1
由統計圖表可知,當3≤n<5時,“一般”檔次占比26%,對應的學生人
數為6+7=13,故學生總人數為=50.
1
2
3
4
5
6
7
8
9
10
11
12
答案
(2)分別求出統計表中的x,y的值;
閱讀本數n/本 1 2 3 4 5 6 7 8 9
人數/名 1 2 6 7 12 x 7 y 1
由統計圖表可知,當5≤n<8時,“良好”檔次占比60%,即50×60%=12+x+7,解得x=11,又總人數為50,故y=50-(1+2+6+7+12+11+7+1)=3,即x=11,y=3.
1
2
3
4
5
6
7
8
9
10
11
12
答案
(3)估計該校九年級400名學生中為“優秀”檔次的人數.
閱讀本數n/本 1 2 3 4 5 6 7 8 9
人數/名 1 2 6 7 12 x 7 y 1
由統計圖表可知,“優秀”檔次占比為=8%,故該校九年級400名學生中為“優秀”檔次的人數約為400×8%=32.
1
2
3
4
5
6
7
8
9
10
11
12
答案
10.(2023·新高考全國Ⅱ)某研究小組經過研究發現某種疾病的患病者與未患病者的某項醫學指標有明顯差異,經過大量調查,得到如下的患病者和未患病者該指標的頻率分布直方圖:
1
2
3
4
5
6
7
8
9
10
11
12
答案
利用該指標制定一個檢測標準,需要確定臨界值c,將該指標大于c的人判定為陽性,小于或等于c的人判定為陰性.此檢測標準的漏診率是將患病者判定為陰性的概率,記為p(c);誤診率是將未患病者判定為陽性的概率,記為q(c).假設數據在組內均勻分布,以事件發生的頻率作為相應事件發生的概率.
1
2
3
4
5
6
7
8
9
10
11
12
答案
(1)當漏診率p(c)=0.5%時,求臨界值c和誤診率q(c);
1
2
3
4
5
6
7
8
9
10
11
12
答案
依題可知,患病者該指標的頻率分布直方圖中第一個小矩形的面積為5×0.002=0.01=1%>0.5%,所以95所以(c-95)×0.002=0.5%,解得c=97.5,
q(c)=0.01×(100-97.5)+5×0.002=0.035=3.5%.
1
2
3
4
5
6
7
8
9
10
11
12
答案
(2)設函數f(c)=p(c)+q(c),當c∈[95,105]時,求f(c)的解析式,并求f(c)在區間[95,105]的最小值.
1
2
3
4
5
6
7
8
9
10
11
12
答案
當c∈[95,100)時,
f(c)=p(c)+q(c)=(c-95)×0.002+(100-c)×
0.01+5×0.002=-0.008c+0.82>0.02;
當c∈[100,105]時,
f(c)=p(c)+q(c)=5×0.002+(c-100)×0.012
+(105-c)×0.002=0.01c-0.98≥0.02,
故f(c)=所以f(c)在區間[95,105]的最小值為0.02.
1
2
3
4
5
6
7
8
9
10
11
12
答案
能力拓展
11.每到春夏交替時節,雌性楊樹會以滿天飛絮的方式來傳播下一代,漫天飛舞的楊絮易引發皮膚病、呼吸道疾病等,給人們造成困擾.為了解市民對治理楊絮方法的贊同情況,某課題小組隨機調查了部分市民(問卷調查表如下表所示),
治理楊絮——您選哪一項?(單選)
a.減少楊樹新增面積,控制楊樹每年的栽種量
b.調整樹種結構,逐漸更換現有楊樹
c.選育無絮楊品種,并推廣種植
d.對雌性楊樹注射生物干擾素,避免產生飛絮
e.其他
1
2
3
4
5
6
7
8
9
10
11
12
答案
并根據調查結果繪制了尚不完整的統計圖(如圖所示).
由兩個統計圖可知,選擇d的人數和扇形圖中e的圓心角分別為
A.500,28.8° B.250,28.6°
C.500,28.6° D.250,28.8°

1
2
3
4
5
6
7
8
9
10
11
12
答案
設接受調查市民的總人數為x,由調查
結果條形圖可知選擇a的人數為300,
通過調查結果的扇形圖可知選擇a的人
數比例為15%=,解得x=2 000.
∴選擇d的人數為2 000×25%=500,
∴扇形圖中e的圓心角為(1-15%-12%-40%-25%)×360°=28.8°.
1
2
3
4
5
6
7
8
9
10
11
12
答案
12.(多選)(2024·佛山模擬)如圖為某新能源汽車企業2015~2022年及2023年1~9月份的營業額(單位:億元)、凈利潤(單位:億元)與2015~2022年營業額的增長率的統計圖.已知2023年第二、三、四季度的凈利潤相比上季度均增長10%,則下列結論正確的是
A.2015~2022年營業額逐年增加
B.2022年的凈利潤超過2017~2021年
 凈利潤的總和
C.2015~2022年營業額的增長率最大
 的是2022年
D.2023年第四季度的凈利潤比第一季度的凈利潤多30多億元


1
2
3
4
5
6
7
8
9
10
11
12
答案
返回
2019年的營業額低于2018年,A錯誤;
2022年的凈利潤為166.2億元,2017~
2021年的凈利潤的總和為40.7+27.8+
16.1+42.3+30.5=157.4(億元),157.4
<166.2,B正確;
2015~2022年營業額的增長率最大的是2022年,C正確;
1
2
3
4
5
6
7
8
9
10
11
12
答案
返回
設2023年第一季度的凈利潤為a億元,
則第四季度的凈利潤為(1+10%)3a億
元,則a+(1+10%)a+(1+10%)2a=
=213.7,得1.13a-a=21.37,
故2023年第四季度的凈利潤比第一季
度的凈利潤多21.37億元,D錯誤.(共77張PPT)
第九章
§9.2 用樣本估計總體
數學





1.會用統計圖表對總體進行估計,會求n個數據的第p百分位數.
2.能用數字特征估計總體集中趨勢和總體離散程度.
課標要求
課時精練
內容索引
第一部分 落實主干知識
第二部分 探究核心題型
落實主干知識
第一部分
1.百分位數
一般地,一組數據的第p百分位數是這樣一個值,它使得這組數據中至少有 的數據小于或等于這個值,且至少有(100-p)%的數據__________
這個值.
2.平均數、中位數和眾數
(1)平均數: .
(2)中位數:將一組數據按從小到大或從大到小的順序排列,處在最_____
的一個數據(當數據個數是奇數時)或最中間兩個數據的    (當數據個數是偶數時).
(3)眾數:一組數據中出現次數   的數據(即頻數最大值所對應的樣本數據).
p%
大于或等于
(x1+x2+…+xn)
中間
平均數
最多
3.方差和標準差
(1)方差:s2= 或.
(2)標準差:s= .
(xi-)2
4.總體方差和總體標準差
(1)一般式:如果總體中所有個體的變量值分別為Y1,Y2,…,YN,總體
平均數為,則總體方差S2=(Yi-)2.
(2)加權式:如果總體的N個變量值中,不同的值共有k(k≤N)個,不妨記為Y1,Y2,…,Yk,其中Yi出現的頻數為fi(i=1,2,…,k),則總體方差
為S2=fi(Yi-)2.
1.判斷下列結論是否正確.(請在括號中打“√”或“×”)
(1)對一組數據來說,平均數和中位數總是非常接近.(  )
(2)方差與標準差具有相同的單位.(  )
(3)如果一組數中每個數減去同一個非零常數,則這組數的平均數改變,方差不變.(  )
(4)在頻率分布直方圖中,可以用最高的小長方形底邊中點的橫坐標作為眾數的估計值.(  )

×
×

2.在下列統計量中,用來描述一組數據離散程度的量是
A.平均數 B.眾數
C.百分位數 D.標準差
標準差反映了數據離散程度的大小,所以說標準差是用來描述一組數據離散程度的統計量,故D正確.

3.已知在高考前最后一次模擬考試中,高三某班8名同學的物理成績分別為84,79,84,86,95,84,87,93,則該組數據的平均數和眾數分別是
A.86,84 B.84.5,85
C.85,84 D.86.5,84
將樣本數據按升序排列為79,84,84,84,86,87,93,95,可得平均
數=86.5,因為84出現次數最多,所以眾數
為84.

4.(2024·周口模擬)已知一組從小到大排列的數據為a,2,2,4,4,5,6,b,8,8,若其第70百分位數等于其極差,則2a+b=   .
10
因為10×0.7=7,所以a,2,2,4,4,5,6,b,8,8的第70百分位數
為,其極差為8-a,所以=8-a,解得2a+b=10.
1.若x1,x2,…,xn的平均數為,方差為s2,那么mx1+a,mx2+a,…,mxn+a的平均數為m+a,方差為m2s2.
2.數據x1,x2,…,xn與數據x1'=x1+a,x2'=x2+a,…,xn'=xn+a 的方差相等,即數據經過平移后方差不變.
返回
微點提醒
探究核心題型
第二部分
例1 (1)(多選)(2024·郴州模擬)隨機抽取8位同學對他們2024年數學新課標全國Ⅰ卷的平均分進行預估,得到一組樣本數據:97,98,99,100,101,103,104,106,則下列關于該樣本的說法正確的有
A.平均數為101 B.極差為9
C.方差為8 D.第60百分位數為101

樣本數字特征的估計
題型一


平均數為
=101,A正確;
極差為106-97=9,B正確;
方差為
=,C錯誤;
因為60%×8=4.8,故第60百分位數為101,D正確.
(2)如圖是2023年11月中國的10個城市地鐵運營里程(單位:公里)及運營線路條數的統計圖,下列判斷正確的是
A.這10個城市中北京的地鐵運營里程
 最長且運營線路條數最多
B.這10個城市地鐵運營里程的中位數
 是516公里
C.這10個城市地鐵運營線路條數的平均數為15.4
D.這10個城市地鐵運營線路條數的極差是12

北京的地鐵運營線路條數最多,而運
營里程最長的是上海,A錯誤;
地鐵運營里程的中位數是=
537.3(公里),B錯誤;
地鐵運營線路條數的平均數為
=15.4,C正確;
地鐵運營線路條數的極差是27-8=19,D錯誤.
計算一組n個數據第p百分位數的步驟
思維升華
跟蹤訓練1 (多選)隨著互聯網的發展,網上購物幾乎成為了人們日常生活中不可或缺的一部分,這也使得快遞行業市場規模呈現出爆發式的增長.陳先生計劃在家所在的小區內開一家快遞驛站,為了確定驛站規模的大小,他統計了隔壁小區的A驛站和B驛站一周的日收件量(單位:件),得到折線圖如圖,則下列說法正確的是
A.B驛站一周的日收件量的極差為80
B.A驛站日收件量的中位數為160
C.A驛站日收件量的平均值大于B驛站
 的日收件量的平均值
D.A驛站和B驛站的日收件量的方差分別記為,,則>


對于A選項,B驛站一周的日收件量的
極差為160-40=120,故A錯誤;
對于B選項,A驛站日收件量從小到大
排列為:130,150,160,160,180,
190,200,所以中位數為160,故B正確;
對于C選項,由圖可知,A驛站日收件量每天都比B驛站的日收件量多,所以A驛站日收件量的平均值大于B驛站的日收件量的平均值,故C正確;
對于D選項,由圖可知,A驛站日收件量的波動比B驛站的日收件量的波動小,所以<,故D錯誤.
總體集中趨勢的估計
題型二
例2 某考試機構舉行了新高考適應性考試,在
聯考結束后,根據聯考成績,考生可了解自己
的學習情況,作出升學規劃,決定是否參加強
基計劃.在本次適應性考試中,某學校為了解高
三學生的聯考情況,隨機抽取了100名學生的聯
考數學成績作為樣本,并按照分數段[50,70),
[70,90),[90,110),[110,130),[130,150]分組,繪制了如圖所示的頻率分布直方圖.
(1)求出圖中a的值并估計本次考試的及格率(“及格率”指得分為90分及以上的學生所占的比例);
由頻率分布直方圖的性質,可得(a+0.004+0.013+0.014+0.016)×20=1,
解得a=0.003.
所以及格率為(0.016+0.014+0.003)×20=0.66=66%.
(2)估計該校學生聯考數學成績的第80百分
位數;
得分在110分以下的學生所占的比例為(0.004+0.013+0.016)×20=0.66,
得分在130分以下的學生所占的比例為0.66+0.014×20=0.94,
所以第80百分位數位于[110,130)內,
由110+20×=120,估計第80百分位數為120.
(3)估計該校學生聯考數學成績的眾數、平
均數.
由題圖可得,眾數的估計值為100.
平均數的估計值為0.08×60+0.26×80+0.32×100+0.28×120+0.06×140=99.6.
頻率分布直方圖中的數字特征
(1)眾數:最高矩形的底邊中點的橫坐標.
(2)中位數:中位數左邊和右邊的矩形的面積和應該相等.
(3)平均數:平均數在頻率分布直方圖中等于各組區間的中點值與對應頻率之積的和.
思維升華
跟蹤訓練2 (多選)(2024·佛山模擬)某企業是一所大學的社會實踐基地,實踐結束后學校對學生進行考核評分,其得分的頻率分布直方圖如圖所示,該學校規定,把成績位于后25%的學生劃定為不及格,把成績位于前25%的學生劃定為優秀,則下列結論正確的是
A.本次測試分數的極差在50~70之間
B.本次測試優秀分數線的估計值為76.2分
C.本次測試分數中位數的估計值為70
D.本次測試分數的平均數小于中位數



由頻率分布直方圖可知,90-20=70,80-30=
50,極差在50~70之間,故A正確;
由頻率分布直方圖可知,分數不低于80的頻率為
0.2,分數不低于70的頻率為0.5,所以優秀分數
線的估計值在區間[70,80)內,設其為m,則(80-m)×0.03+0.2=0.25,解得m≈78.3,故B錯誤;
因為分數不低于70的頻率為0.5,所以本次測試分數中位數的估計值為70,故C正確;
因為頻率分布直方圖左拖尾,所以平均數小于中位數,故D正確.
總體離散程度的估計
題型三
例3 (2024·安康模擬)首屆中國航協航空大會在各個展區中設置了多項互動體驗活動,吸引了很多的中小學生.現從某個有互動體驗的展區中隨機抽取60名中小學生,統計他們的參觀時間(從進入該展區到離開該展區的時長,單位:分鐘,時間取整數),將時間分成[40,50),[50,60),…,[90,100]六組,并繪制成如圖所示的頻率分
布直方圖.
(1)由頻率分布直方圖,估計樣本的平均數
和方差;(每組數據以區間的中點值為代表)
由題意得,
=10×(45×0.010+55×0.015+65×0.015+
75×0.030+85×0.025+95×0.005)=71,
所以樣本的方差為=10×[(45-71)2×0.010
+(55-71)2×0.015+(65-71)2×0.015+(75-71)2×0.030+(85-71)2×
0.025+(95-71)2×0.005]=194.
(2)為對比展區是否有體驗區對中小學生的吸
引程度,某工作人員給出了一份該展區中沒
有體驗區的參觀時間的隨機數據,經計算得
到該組數據的平均值為=65,方差為=
178,試判斷有體驗區的參觀時間的平均值比沒有體驗區的參觀時間的平均值是否有顯著提高?(如果,則認為有顯著提高,否則不認為有顯著提高)
由題意得=71-65=6,
<6,
所以>,
所以有體驗區的參觀時間的平均值比沒有體驗區的參觀時間的平均值有顯著提高.
(3)利用(2)中的結果,你認為展區是否應該設置互動體驗展區?請說明理由.
從(2)中可知展區應該設置互動體驗展區,這樣可以吸引更多的參觀者進行觀看與體驗,使他們能更多地了解產品,并能更大程度地激發中小學生的興趣愛好.
總體離散程度的估計
標準差(方差)反映了數據的離散與集中、波動與穩定的程度.標準差(方差)越大,數據的離散程度越大;標準差(方差)越小,數據的離散程度越小.
思維升華
跟蹤訓練3 (1)(多選)(2024·佛山統考)甲、乙兩臺機床同時生產同一種零件,在10天中,兩臺機床每天生產的次品數分別為:
甲:0,1,2,2,0,2,3,3,3,4;
乙:1,3,1,1,0,2,0,1,0,1.
則下列說法正確的是
A.甲機床每天生產的次品數的平均數大于乙機床每天生產的次品數的平
 均數
B.甲機床每天生產的次品數的方差大于乙機床每天生產的次品數的方差
C.從這兩組次品數的平均數和方差來看,乙機床的性能更好
D.從這兩組次品數的平均數和方差來看,甲機床的性能更好



由題意,可得甲機床每天生產的次品數的平均數為
=2,
方差為×[(0-2)2+(1-2)2+(2-2)2+(2-2)2+(0-2)2+(2-2)2+
(3-2)2+(3-2)2+(3-2)2+(4-2)2]=1.6;
乙機床每天生產的次品數的平均數為
=1,
方差為×[(1-1)2+(3-1)2+(1-1)2+(1-1)2+(0-1)2+(2-1)2+
(0-1)2+(1-1)2+(0-1)2+(1-1)2]=0.8.
比較發現乙機床每天生產的次品數的平均數較小而且方差也較小,所以乙機床的性能更好,結合選項,可得選項A,B,C正確,選項D錯誤.
(2)(2024·珠海模擬)甲、乙兩班參加了同一學科的考試,其中甲班50人,乙班40人.甲班的平均成績為72,方差為90;乙班的平均成績為90,方差
為60.那么甲、乙兩班全部90名學生的平均成績是   ,方差是   .
80
甲、乙兩班全部90名學生的平均成績為=80,
方差為×[90+(72-80)2]+×[60+(90-80)2]=×154+×160=.
返回
課時精練
對一對
答案
1
2
3
4
5
6
7
8
9
10
11
12
題號 1 2 3 4 5 6 7
答案 C C D D BD BCD 6
題號 8 11 12 答案 D AD 答案
1
2
3
4
5
6
7
8
9
10
11
12
(1)根據表格將這十次試驗中甲工藝處理后的橡膠產品的伸縮率按大小
順序排列,可得中位數為=546.5,
極差為596-522=74.
9.
答案
1
2
3
4
5
6
7
8
9
10
11
12
(2)由表格可知
故zi=(xi-yi)=10z=9+6+8+(-8)+15+11+19+18+20+12=110,解得z=11,
9.
序號i 1 2 3 4 5 6 7 8 9 10
zi=xi-yi 9 6 8 -8 15 11 19 18 20 12
答案
1
2
3
4
5
6
7
8
9
10
11
12
s2=
=×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19
-11)2+(18-11)2+(20-11)2+(12-11)2]=61,
所以2=2<69.
答案
1
2
3
4
5
6
7
8
9
10
11
12
(1)因為A,B配方樣本容量相同,設為n,
由于B配方廢品有6件,由B配方的頻率分布直方圖可知,廢品的頻率為
=0.006×10,解得n=100,
所以a=100-(8+36+24+8)=24,
由(0.006+b+0.038+0.022+0.008)×10=1,解得b=0.026.
10.
答案
1
2
3
4
5
6
7
8
9
10
11
12
(2)由(1)及A配方的頻數分布表得,
A配方質量指標值的樣本平均數為
=100,
質量指標值的樣本方差為×[(-20)2×8+(-10)2×24+02×36+
102×24+202×8]=112,
由(1)及B配方的頻率分布直方圖知,B配方質量指標值的樣本平均數為=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100,
10.
答案
1
2
3
4
5
6
7
8
9
10
11
12
質量指標值的樣本方差為=(-20)2×0.06+(-10)2×0.26+02×0.38+
102×0.22+202×0.08=104,
所以,>,即兩種配方質量指標值的樣本平均數相等,但A配方質量指標值的樣本方差比B配方質量指標值的樣本方差大,
所以B配方更好.
10.
一、單項選擇題
1.已知一組樣本數據1,2,2,3,4,5,則2.5是該組數據的
A.極差 B.平均數  C.中位數   D.眾數
1
2
3
4
5
6
7
8
9
10
11
12
知識過關
答案
由題意得眾數為2,極差為5-1=4,平均數為=2.5.

1
2
3
4
5
6
7
8
9
10
11
12
答案
2.(2024·云南模擬)甲、乙、丙、丁四名運動員參加射擊項目選拔賽,每人10次射擊成績的平均數(單位:環)和方差s2如表所示:
甲 乙 丙 丁
8.2 9.5 9.9 7.7
s2 0.16 0.65 0.09 0.41
根據表中數據,若從中選擇一名成績好且發揮穩定的運動員參加比賽,最合適的人是
A.甲 B.乙 C.丙 D.丁

1
2
3
4
5
6
7
8
9
10
11
12
答案
由題意可知,丙的平均數最大且方差最小,所以丙的總成績最好且發揮最穩定,故最合適的人是丙.
甲 乙 丙 丁
8.2 9.5 9.9 7.7
s2 0.16 0.65 0.09 0.41
1
2
3
4
5
6
7
8
9
10
11
12
答案
3.某時間段公路上車速的頻率分布直方圖如圖所示,則
A.a=0.1
B.車速眾數的估計值是70
C.車速平均數的估計值大于其中位數的估計值
D.車速中位數的估計值是62.5

1
2
3
4
5
6
7
8
9
10
11
12
答案
由10(a+3a+4a+2a)=1,得a=0.01,A錯誤;
車速在[60,70)內的頻率最大,所以車速眾數的
估計值是65,B錯誤;
車速的平均數為0.1×45+0.3×55+0.4×65+0.2
×75=62,車速的中位數m∈(60,70),則(m-60)×0.04=0.1,解得m=62.5,C錯誤,D正確.
1
2
3
4
5
6
7
8
9
10
11
12
答案
4.(2025·大慶模擬)法國當地時間2024年7月26日晚,第三十三屆夏季奧林匹克運動會在巴黎舉行開幕式.為弘揚奧運精神,某學校組織高一年級學生進行奧運專題的答題活動.為了調查男生和女生對奧運會的關注程度,在高一年級隨機抽取10名男生和10名女生的答題成績(滿分100分),按從低到高的順序排列,得到下表中的樣本數據:
男生 82 85 86 87 88 90 90 92 94 96
女生 82 84 85 87 87 87 88 88 90 92
1
2
3
4
5
6
7
8
9
10
11
12
答案
則下列說法錯誤的是
A.男生樣本數據的25%分位數是86
B.男生樣本數據的中位數小于男生樣本數據的眾數
C.女生樣本數據中去掉一個最高分和一個最低分后所得數據的平均數不變
D.女生樣本數據中去掉一個最高分和一個最低分后所得數據的方差不變

男生 82 85 86 87 88 90 90 92 94 96
女生 82 84 85 87 87 87 88 88 90 92
1
2
3
4
5
6
7
8
9
10
11
12
答案
10×25%=2.5,所以男生樣本數據的25%分位數是86,故A正確;
男生樣本數據的中位數為=89,男生樣本數據的眾數為90,故B正確;
女生樣本數據的平均數為×(82+84+85+87×3+88×2+90+92)=87,
女生樣本數據中去掉一個最高分和一個最低分后所得數據的平均數為
×(84+85+87×3+88×2+90)=87,故C正確;
女生樣本數據中去掉一個最高分和一個最低分后所得數據的平均數不變,但是極差變小,所以方差變小,故D錯誤.
1
2
3
4
5
6
7
8
9
10
11
12
答案
二、多項選擇題
5.(2025·邯鄲模擬)某公司計劃組織秋游活動,定制了一套服裝,女職工需要不同尺碼服裝的頻數如圖.根據圖中數據,下列結論正確的是
A.服裝尺碼的眾數為187
B.服裝尺碼的平均數為165
C.服裝尺碼的方差為28
D.服裝尺碼的中位數為165


1
2
3
4
5
6
7
8
9
10
11
12
答案
由題圖知,眾數為165,故A錯誤;
總數為34+59+187+85+21=386,
平均數為×(155×34+160×59+165×187+
170×85+175×21)=165,故B正確;
方差為×≈23.58,
故C錯誤;
386÷2=193,34+59=93<193,
34+59+187=280>193,所以中位數為165,故D正確.
1
2
3
4
5
6
7
8
9
10
11
12
答案
6.(2024·濟南模擬)某次數學考試后,為分析學生的學習情況,某校從某年級中隨機抽取了100名學生的成績,整理得到如圖所示的頻率分布直方圖.為進一步分析高分學生的成績分布情況,計算得到這100名學生中,成績位于[80,90)內的學生成績的方差為12,成績位于[90,100]內的學生成績的方差為10.則
A.a=0.004
B.估計該年級學生成績的中位數為77.14
C.估計該年級成績在80分及以上的學生成績的平
 均數為87.5
D.估計該年級成績在80分及以上的學生成績的方差為30.25



1
2
3
4
5
6
7
8
9
10
11
12
答案
在頻率分布直方圖中,所有矩形的面積之和為1,
則(2a+3a+7a+6a+2a)×10=200a=1,解得a
=0.005,故A錯誤;
前兩個矩形的面積之和為(2a+3a)×10=50a=
0.25<0.5,前三個矩形的面積之和為(2a+3a+7a)
×10=120a=0.6>0.5.設該年級學生成績的中位數為m,則m∈(70,80),根據中位數的定義可得0.25+(m-70)×0.035=0.5,解得m≈77.14,所以估計該年級學生成績的中位數為77.14,故B正確;
1
2
3
4
5
6
7
8
9
10
11
12
答案
估計該年級成績在80分及以上的學生成績的平均
數為×85+×95=87.5,故C正確;
估計該年級成績在80分及以上的學生成績的方差
為×[12+(85-87.5)2]+×[10+(95-87.5)2]=
30.25,故D正確.
三、填空題
7.一組數據按從小到大的順序排列為2,4,m,12,16,17,若該組數據的中位數是極差的,則該組數據的第40百分位數是   .
1
2
3
4
5
6
7
8
9
10
11
12
答案
由題意知該組數據的極差為17-2=15,
中位數為,所以=15×=9,解得m=6,
又6×40%=2.4,
所以該組數據的第40百分位數是該組數據的第三個數6.
6
1
2
3
4
5
6
7
8
9
10
11
12
答案
8.身體質量指數,簡稱體質指數,是國際上常用的衡量人體胖瘦程度以及是否健康的一個標準.該指標是通過體重(kg)除以身高(m)的平方計算得來.這個公式所得比值在一定程度上可以反映人體密度.一般情況下,我國成年人的體質指數在18.5~23.9內屬正常范圍.已知A,B,C三人的體質指數的平均值為20,方差為3.D,E兩人的體質指數分別為18和22.則這5人的體
質指數的方差為   .
1
2
3
4
5
6
7
8
9
10
11
12
答案
設A,B,C三人的體質指數分別為a,b,c.
方法一 由于A,B,C三人的體質指數的平均值為20,方差為3,故
=3,則(a-20)2+(b-20)2+(c-20)2=9,由于=20,故這5人的體質指數的平均值為20,方差為
=.
1
2
3
4
5
6
7
8
9
10
11
12
答案
方法二 這5人的體質指數的平均值為=
20,D,E兩人的體質指數的平均值為=20,方差為=4,故這5人的體質指數的方差為×[3+(20-20)2]+×[4+(20-20)2]=.
1
2
3
4
5
6
7
8
9
10
11
12
答案
四、解答題
9.某廠為比較甲、乙兩種工藝對橡膠產品伸縮率的處理效應,進行了10次配對試驗,每次配對試驗選用材質相同的兩個橡膠產品,隨機地選其中一個用甲工藝處理,另一個用乙工藝處理,測量處理后的橡膠產品的伸縮率.甲、乙兩種工藝處理后的橡膠產品的伸縮率分別記為xi,yi(i=1,2,…,10),記zi=xi-yi(i=1,2,…,10).試驗結果如下:
試驗序號i 1 2 3 4 5 6 7 8 9 10
伸縮率xi 545 533 551 522 575 544 541 568 596 548
伸縮率yi 536 527 543 530 560 533 522 550 576 536
1
2
3
4
5
6
7
8
9
10
11
12
答案
(1)求甲工藝處理后的橡膠產品的伸縮率的中位數和極差;
根據表格將這十次試驗中甲工藝處理后的橡膠產品的伸縮率按大小順序
排列,可得中位數為=546.5,極差為596-522=74.
試驗序號i 1 2 3 4 5 6 7 8 9 10
伸縮率xi 545 533 551 522 575 544 541 568 596 548
伸縮率yi 536 527 543 530 560 533 522 550 576 536
1
2
3
4
5
6
7
8
9
10
11
12
答案
(2)設z1,z2,…,z10的樣本平均數為z,樣本方差為s2.判斷甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率是否有顯著提
高(如果z≥2,則認為甲工藝處理后的橡膠產品的伸縮率較乙工藝處理
后的橡膠產品的伸縮率有顯著提高,否則不認為有顯著提高).
試驗序號i 1 2 3 4 5 6 7 8 9 10
伸縮率xi 545 533 551 522 575 544 541 568 596 548
伸縮率yi 536 527 543 530 560 533 522 550 576 536
1
2
3
4
5
6
7
8
9
10
11
12
答案
由表格可知
故zi=(xi-yi)=10z=9+6+8+(-8)+15+11+19+18+20+12=110,解得z=11,
s2=
序號i 1 2 3 4 5 6 7 8 9 10
zi=xi-yi 9 6 8 -8 15 11 19 18 20 12
1
2
3
4
5
6
7
8
9
10
11
12
答案
=×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2
+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61,
所以2=2<6序號i 1 2 3 4 5 6 7 8 9 10
zi=xi-yi 9 6 8 -8 15 11 19 18 20 12
1
2
3
4
5
6
7
8
9
10
11
12
答案
10.我國醫療科研專家攻堅克難,研發出某種治療肺炎的復方的A,B兩種新配方,在兩種新配方生產的產品中隨機抽取數量相同的樣本,測量這些產品的質量指標值(藥產品的質量以其質量指標值衡量,質量指標值越大表明質量越好),規定指標值小于85為廢品,指標值在[85,115)內為一等品,不小于115為特等品.現把測量數據整理如下,其中B配方廢品有6件.
     A配方的頻數分布表
質量 指標值 [75, 85) [85, 95) [95, 105) [105, 115) [115,
125]
頻數 8 a 36 24 8
1
2
3
4
5
6
7
8
9
10
11
12
答案
(1)求實數a,b的值;
質量 指標值 [75, 85) [85, 95) [95, 105) [105, 115) [115,
125]
頻數 8 a 36 24 8
1
2
3
4
5
6
7
8
9
10
11
12
答案
因為A,B配方樣本容量相同,設為n,
由于B配方廢品有6件,由B配方的頻率分布
直方圖可知,廢品的頻率為=0.006×10,
解得n=100,
所以a=100-(8+36+24+8)=24,
由(0.006+b+0.038+0.022+0.008)×10=1,解得b=0.026.
1
2
3
4
5
6
7
8
9
10
11
12
答案
(2)試確定A配方和B配方哪一種更好?(同一組數據常用該組區間的中點值作為代表)
質量 指標值 [75, 85) [85, 95) [95, 105) [105, 115) [115,
125]
頻數 8 a 36 24 8
1
2
3
4
5
6
7
8
9
10
11
12
答案
由(1)及A配方的頻數分布表得,
A配方質量指標值的樣本平均數為
=100,
質量指標值的樣本方差為×[(-20)2
×8+(-10)2×24+02×36+102×24+202×
8]=112,
1
2
3
4
5
6
7
8
9
10
11
12
答案
由(1)及B配方的頻率分布直方圖知,B配方質
量指標值的樣本平均數為
=80×0.06+90×0.26+100×0.38+110×
0.22+120×0.08=100,
質量指標值的樣本方差為=(-20)2×0.06
+(-10)2×0.26+02×0.38+102×0.22+202×0.08=104,
所以>,即兩種配方質量指標值的樣本平均數相等,但A配方質量指標值的樣本方差比B配方質量指標值的樣本方差大,
所以B配方更好.
1
2
3
4
5
6
7
8
9
10
11
12
答案
能力拓展
11.已知一組數據丟失了其中一個,另外六個數據分別是10,8,8,11,16,8,若這組數據的平均數、中位數、眾數依次成等差數列,則丟失數據的所有可能值的和為
A.12 B.20 C.25 D.27

1
2
3
4
5
6
7
8
9
10
11
12
答案
設丟失數據是x,則平均數為,眾數是8,若x<8,則中位數為8,此
時x=-5;
若8若x≥10,則中位數為10,此時2×10=+8,解得x=23,
所以丟失數據的所有可能值為-5,9,23,其和為27.
1
2
3
4
5
6
7
8
9
10
11
12
答案
12.(多選)(2024·泰州模擬)已知m,n∈R,有一組數據為2+m,3,6-n,7-m,8,10,11+n,12,13,若在這組數據中去除第5個數8,則
A.平均數不變 B.中位數不變
C.方差不變 D.極差不變


1
2
3
4
5
6
7
8
9
10
11
12
答案
原數據的平均數為=8,
去除第5個數8后的平均數為=8,
所以平均數不變,故A正確;
當m=n=0時,原數據的中位數為8,去除第5個數8后的中位數為=
8.5,此時中位數改變,故B錯誤;
原數據的方差s2=[(2+m-8)2+(3-8)2+(6-n-8)2+(7-m-8)2+(10
-8)2+(11+n-8)2+(12-8)2+(13-8)2],
1
2
3
4
5
6
7
8
9
10
11
12
答案
返回
去除第5個數8后的方差[(2+m-8)2+(3-8)2+(6-n-8)2+(7-m
-8)2+(10-8)2+(11+n-8)2+(12-8)2+(13-8)2],
所以s2<,即方差改變,故C錯誤;
因為3<8<13,所以8這個數對于極差沒有影響,即極差不變,故D正確.(共96張PPT)
第九章
§9.3 一元線性回歸模型
   及其應用
數學





1.了解樣本相關系數的統計含義.
2.了解最小二乘法原理,掌握一元線性回歸模型參數的最小二乘估計方法.
3.針對實際問題,會用一元線性回歸模型進行預測.
課標要求
課時精練
內容索引
第一部分 落實主干知識
第二部分 探究核心題型
落實主干知識
第一部分
1.變量的相關關系
(1)相關關系:兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系.
(2)相關關系的分類:    和    .
(3)線性相關:一般地,如果兩個變量的取值呈現正相關或負相關,而且散點落在     附近,我們就稱這兩個變量線性相關.
正相關
負相關
一條直線
2.樣本相關系數
(1)r=.
(2)當r>0時,稱成對樣本數據    ;當r<0時,稱成對樣本數據    .
(3)|r|≤1;當|r|越接近1時,成對樣本數據的線性相關程度越  ;當|r|越接近0時,成對樣本數據的線性相關程度越  .
正相關
負相關


3.一元線性回歸模型
(1)我們將x+稱為Y關于x的經驗回歸方程,
其中
(2)殘差:    減去    所得的差稱為殘差.
觀測值
預測值
1.判斷下列結論是否正確.(請在括號中打“√”或“×”)
(1)相關關系是一種非確定性關系.(  )
(2)散點圖是判斷兩個變量相關關系的一種重要方法和手段.(  )
(3)經驗回歸直線x+至少經過(x1,y1),(x2,y2),…,(xn,yn)中的一個點.(  )
(4)樣本相關系數越小,成對樣本數據的線性相關程度越弱.(  )
×


×
2.(多選)下列說法正確的是
A.若兩個具有線性相關關系的變量的相關性越強,則樣本相關系數r的值
 越接近于1
B.當r=1時,兩變量呈函數關系
C.當經驗回歸方程為=0.3-0.7x時,變量x和y負相關
D.在經驗回歸方程=0.4+0.5x中,當x每增加1個單位時,相應觀測值y一
 定增加0.5個單位


若兩個具有線性相關關系的變量的相關性越強,則樣本相關系數r的絕對值越接近于1,故A錯誤;
當樣本相關系數r=1時,兩變量呈確定的函數關系,故B正確;
因為斜率小于0,所以變量x和y負相關,故C正確;
在經驗回歸方程=0.4+0.5x中,當x每增加1個單位時,相應觀測值y約增加0.5個單位,故D錯誤.
3.(2024·茂名模擬)已知變量x和y的統計數據如表:
x 1 2 3 4 5
y 6 6 7 8 8
根據上表可得經驗回歸方程=0.6x+,據此可以預測當x=8時,y約等于
A.8.5 B.9 C.9.5 D.10

依題意知,=3,
=7,
于是7=0.6×3+,解得=5.2,
即=0.6x+5.2,
當x=8時,=0.6×8+5.2=10.
4.色差和色度是衡量毛絨玩具質量優劣的重要指標,現抽檢一批產品,已知該產品的色度y和色差x之間滿足線性相關關系,且=0.8x-1.8,現有一對測量數據為(33,25.2),則該數據的殘差為    .
0.6
將x=33代入=0.8x-1.8,
可得=0.8×33-1.8=24.6,
故數據(33,25.2)的殘差為25.2-24.6=0.6.
1.經驗回歸直線過點(,).
2.求時,常用公式.
3.回歸分析是基于成對樣本觀測數據進行估計或推斷,得出的結論都可能犯錯誤.
返回
微點提醒
探究核心題型
第二部分
例1 (1)對四組數據進行統計,獲得如圖所示的散點圖,關于其樣本相關系數的比較,正確的是
A.r4C.r2
成對數據的相關性
題型一
由散點圖可知,樣本相關系數r2,r4所在散點圖的兩個變量呈負相關,r1,r3所在散點圖的兩個變量呈正相關,所以r1,r3都為正數,r2,r4都為負數.r1,r2所在散點圖點的分布近似在一條直線上,線性相關性比較強,樣本相關系數的絕對值接近1,而r3,r4所在散點圖點的分布比較分散,線性相關性比較弱,則r2r3,綜上所得,r2(2)(2024·石家莊模擬)某校為了解本校高一男生身高和體重的相關關系,在該校高一年級隨機抽取了7名男生,測量了他們的身高和體重得下表:
身高x(單位:cm) 167 173 175 177 178 180 181
體重y(單位:kg) 90 54 59 64 67 72 76
由表格制作成如圖所示的散點圖:
由最小二乘法計算得到經驗回歸直線l1的方程為x+,其樣本相關系數為r1;經過殘差分析,點(167,90)對應殘差過大,把它去掉后,再
用剩下的6組數據計算得到經驗回歸直線l2的方程為x+,樣本相
關系數為r2.則下列選項正確的是
A.<,>,r1B.<,<,r1>r2
C.>,<,r1>r2
D.>,>,r1
身高的平均數為
 
≈176,
因為點(167,90)的橫坐標167小于
平均值176,縱坐標90相對過大,
所以去掉點(167,90)后經驗回歸
直線的縱截距變小而斜率變大,故<,>,
去掉點(167,90)后相關性更強,擬合效果也更好,且還是正相關,所以r1判定兩個變量相關性的方法
(1)畫散點圖:若點的分布從左下角到右上角,則兩個變量正相關;若點的分布從左上角到右下角,則兩個變量負相關.
(2)樣本相關系數:當r>0時,正相關;當r<0時,負相關;|r|越接近1,線性相關性越強.
(3)經驗回歸方程:當>0時,正相關;當<0時,負相關.
思維升華
跟蹤訓練1 (多選)下列有關回歸分析的結論中,正確的有
A.若經驗回歸方程為=5+2x,則變量y與x正相關
B.運用最小二乘法求得的經驗回歸直線一定經過點(,)
C.若r1表示變量x與y之間的樣本相關系數,r2表示變量u與v之間的樣本相
 關系數,且r1=0.837,r2=-0.957,則x與y之間的線性相關性強于u與v
 之間的線性相關性
D.若散點圖中所有點都在直線y=0.93x-3.6上,則樣本相關系數r=0.93


因為經驗回歸方程為=5+2x,可知2>0,所以變量y與x正相關,故A正確;
由經驗回歸方程的性質可知,經驗回歸直線一定經過點(,),故B正確;
樣本相關系數|r|越大,說明線性相關性越強,反之,則越弱,|r1|<|r2|,所以u與v之間的線性相關性更強,故C錯誤;
散點圖中所有點都在直線y=0.93x-3.6上,則|r|=1,且0.93>0,所以變量y與x正相關,即r>0,可知r=1,故D錯誤.
回歸模型
題型二
例2 根據統計,某蔬菜基地西紅柿畝產量的增加量
y(百千克)與某種液體肥料每畝的使用量x(千克)之間
對應數據的散點圖如圖所示.
(1)從散點圖可以看出,可用線性回歸模型擬合y與x的
關系,請計算樣本相關系數r并判斷它們的相關程度;
命題點1 一元線性回歸模型
附:r=,.
由題意知,=5,
=5,
所以(xi-)(yi-)=14,
=20,=10,
所以r==≈0.99,
所以y與x呈正相關,且線性相關程度很強.
(2)求y關于x的經驗回歸方程x+,并預測液體肥料每畝的使用量為12千克時,西紅柿畝產量的增加量.
附:r=,
.
因為=0.7,
=5-0.7×5=1.5,
所以y關于x的經驗回歸方程為=0.7x+1.5,
當x=12時,=0.7×12+1.5=9.9.
所以預測液體肥料每畝的使用量為12千克時,西紅柿畝產量的增加量為9.9百千克.
例3 某大型現代化農場在種植某種大棚有
機無公害的蔬菜時,為創造更大價值,提高
畝產量,積極開展技術創新活動.該農場采用
了延長光照時間的方案,該農場選取了20間
大棚(每間一畝)進行試點,得到各間大棚產
量數據并繪制成散點圖.光照時長為x(單位:小時),大棚蔬菜產量為y(單位:噸/畝),記w=ln x.
命題點2 非線性回歸模型
參考數據:
290 102.4 52 4 870 540.28 137 1 578.2 272.1
參考公式:y關于x的經驗回歸方程x+中,,.
(1)根據散點圖判斷,y=a+bx與y=c+dln x哪一個適宜作為大棚蔬菜產量y關于光照時長x的經驗回歸方程類型(給出判斷即可,不必說明理由);
根據散點圖,開始的點在某條直線旁,但后面的點會越來越偏離這條直線,因此y=c+dln x更適宜作為大棚蔬菜產量y關于光照時長x的經驗回歸方程類型.
(2)根據(1)的判斷結果及表中數據,建立y關于x的經驗回歸方程(結果保留小數點后兩位);
參考數據:
290 102.4 52 4 870 540.28 137 1 578.2 272.1
參考公式:y關于x的經驗回歸方程x+中,,.
w=ln x,則y=c+dln x,即y=c+dw,
=5.12,=2.6,
≈3.26,
≈5.12-3.26×2.6≈-3.36,
所以=3.26w-3.36,
即=3.26ln x-3.36.
(3)根據實際種植情況,發現上述回歸方程在光照時長位于6~14小時內擬合程度良好,利用(2)中所求方程估計當光照時長為e2小時時(e為自然對數的底數),大棚蔬菜的畝產量.
參考數據:
290 102.4 52 4 870 540.28 137 1 578.2 272.1
參考公式:y關于x的經驗回歸方程x+中,,.
當x=e2時,=3.26ln e2-3.36=3.16.
即大棚蔬菜畝產量約為3.16噸.
求經驗回歸方程的步驟
思維升華
跟蹤訓練2 (1)現有一組數據如表所示,
已知變量y關于x的非線性經驗回歸方程為,若對兩邊取自然對數,可以發現ln y與x線性相關,則當x=6時,預測y的值為
A.8.7 B.8 C.e8.7 D.e8
x 1 2 3 4 5
y e e3 e4 e6 e7

對兩邊取自然對數,
得ln x-0.3,
令z=ln y,則x-0.3,z的數據如表所示:
=3,=4.2,
x 1 2 3 4 5
y e e3 e4 e6 e7
z 1 3 4 6 7
代入-0.3,得4.2=3-0.3,
故=1.5.
故=1.5x-0.3,=e1.5x-0.3.
當x=6時,=e1.5×6-0.3=e8.7.
x 1 2 3 4 5
y e e3 e4 e6 e7
z 1 3 4 6 7
(2)(2024·新鄉模擬)氮氧化物是一種常見的大氣污染物,如圖為我國2014年至2022年氮氧化物排放量(單位:萬噸)的折線圖,其中年份代碼1~9分別對應年份2014~2022.
已知yi≈12 000,≈1 100,tiyi≈51 800.
①可否用線性回歸模型擬合y與t的關系?請分別根據折線圖和樣本相關系數加以說明;
附:樣本相關系數r=.
從折線圖看,各點落在一條直線附近,
因而可以用線性回歸模型擬合y與t的關系,
由題意知×(1+2+3+4+5+6+7+
8+9)=5,
樣本相關系數r=≈=-≈-0.97.
故可以用線性回歸模型擬合y與t的關系.
②若根據所給數據建立經驗回歸模型=-138t+2 025,可否用此模型來預測2025年和2035年我國的氮氧化物排放量?請說明理由.
附:樣本相關系數r=.
可以預測2025年的氮氧化物排放量,但
不可以預測2035年的氮氧化物排放量.
理由如下:
2025年與所給數據的年份較接近,因而
可以認為短期內氮氧化物排放量將延續該趨勢,故可以用此模型進行預測;
2035年與所給數據的年份相距過遠,而影響氮氧化物排放量的因素有很多,這些因素在短期內可能保持不變,但從長期看很有可能會變化,因而用此模型預測可能是不準確的.
殘差分析
題型三
例4 某公司為了解年研發資金x(單位:億元)對年產值y(單位:億元)的影響,對公司近8年的年研發資金xi和年產值yi(i∈N,1≤i≤8)的數據對比分析中,選用了兩個回歸模型,并利用最小二乘法求得相應的y關于x的經驗回歸方程:
①=13.05x-48.4;②=0.76x2-8.98.
已知①中的殘差平方和S1≈3 610,②中的殘差平方和S2≈658,請根據決定系數選擇擬合效果更好的經驗回歸方程,并利用該經驗回歸方程預測年研發資金為20億元時的年產值.
參考數據:=32 900.
參考公式:刻畫回歸模型擬合效果的決定系數R2=1-.
設經驗回歸方程①的決定系數為,由S1≈3 610,
得≈1-≈0.89,
設經驗回歸方程②的決定系數為,由S2≈658,
得≈1-=0.98,
因為<,所以經驗回歸方程②的擬合效果更好.
當x=20時,=0.76×202-8.98=295.02,
所以年研發資金為20億元時的年產值約為295.02億元.
檢驗回歸模型的擬合效果的兩種方法
(1)殘差分析:通過殘差分析發現原始數據中的可疑數據,判斷所建立模型的擬合效果.
(2)R2分析:通過公式計算R2,R2越大,殘差平方和越小,模型的擬合效果越好;R2越小,殘差平方和越大,模型的擬合效果越差.
思維升華
跟蹤訓練3 (1)(多選)下列命題中,說法正確的有
A.在經驗回歸方程=-0.3x+10中,當解釋變量每增加1個單位時,響應
 變量的預測值將減少0.3個單位
B.經驗回歸直線x+恒過點(,),且在經驗回歸直線上的樣本點越
 多,擬合效果越好
C.殘差圖是一種散點圖,若殘差點比較均勻地落在以取值為0的橫軸為對
 稱軸的水平帶狀區域中,說明模型選擇比較合適,而且帶狀區域的寬
 度越窄,模型擬合的精度越高
D.決定系數R2越大,表示殘差平方和越小,即模型的擬合效果越好



在經驗回歸方程=-0.3x+10中,當解釋變量每增加1個單位時,響應變量的預測值將減少0.3個單位,故A正確;
經驗回歸直線x+恒過點(,),擬合效果是整體效果,與在經驗
回歸直線上的樣本點的多少無關,如果在經驗回歸直線上的樣本點增多,但其他點偏離程度增大,相應的殘差的平方和仍可能會增大,擬合效果也會變差,故B錯誤;
殘差帶狀圖區域越窄,模型擬合的精度越高,故C正確;
決定系數R2=1-,殘差平方和為,根據決定系數
公式可得,R2越大,表示殘差平方和越小,即模型的擬合效果越好,故D正確.
(2)(2024·呂梁模擬)某市2018年至2022年新能源汽車的年銷量y(單位:百臺)與年份代號x的數據如表:
年份 2018 2019 2020 2021 2022
年份代號x 0 1 2 3 4
年銷量y 10 15 20 30 35
若根據表中的數據用最小二乘法求得y關于x的回歸直線方程為=6.5x+,據此可得x=1時,殘差為    .
-0.5
依題意,=2,
=22,
將(2,22)代入回歸直線方程=6.5x+,
解得=9,
所以回歸直線方程為=6.5x+9,
當x=1時,=6.5×1+9=15.5,
因此殘差為15-15.5=-0.5.
返回
課時精練
對一對
答案
1
2
3
4
5
6
7
8
9
10
11
12
題號 1 2 3 4 5 6 7
答案 A D C D ABD ACD 乙
題號 8 11 12 答案 1.4 BD 答案
1
2
3
4
5
6
7
8
9
10
11
12
(1)由題可知,×(1+3+5+7+9)=5,
×(25+37+48+58+72)=48,
所以r==
=≈≈0.999.
因為y與x的樣本相關系數近似為0.999,非常接近1,所以y與x的線性相關程度很高,可以用線性回歸模型擬合y與x的關系.
9.
答案
1
2
3
4
5
6
7
8
9
10
11
12
(2)=5.75,
=48-5.75×5=19.25,
所以y關于x的線性回歸方程為=5.75x+19.25.
當x=24時,=5.75×24+19.25=157.25,
所以當充電樁數量為24萬臺時,該地區新能源汽車的年銷量為157.25萬輛.
9.
答案
1
2
3
4
5
6
7
8
9
10
11
12
(1)應該選擇模型②.
由于模型②殘差點比較均勻地落在水平的帶狀區域中,且帶狀區域的寬度比模型①帶狀寬度窄,所以模型②的擬合精度更高,相應的經驗回歸方程的預報精度就會越高,所以選模型②比較合適.
10.
答案
1
2
3
4
5
6
7
8
9
10
11
12
(2)根據模型②,令t=,研發投入y與t可用經驗回歸方程來擬合,有t.
則≈6.404,
所以=75-×2.25=60.59,則y關于t的經驗回歸方程為
=6.40t+60.59.
10.
答案
1
2
3
4
5
6
7
8
9
10
11
12
所以y關于x的非線性經驗回歸方程為=6.40+60.59.
在2029年,即當x=16時,
=6.40+60.59
=86.19(億元).
所以該公司2029年高科技研發投入y的預報值為86.19億元.
10.
一、單項選擇題
1.下列兩個變量中,成正相關的兩個變量是
A.汽車自身的重量與行駛每公里的耗油量
B.正方形的面積與邊長
C.花費在體育活動上的時間與期末考試數學成績
D.期末考試隨機編排的準考證號與期末考試成績總分
1
2
3
4
5
6
7
8
9
10
11
12
知識過關
答案

1
2
3
4
5
6
7
8
9
10
11
12
答案
一般情況下,汽車越重,則每公里耗油量越多,成正相關,故A正確;
正方形的面積與邊長是函數關系,故B錯誤;
一般情況下,若花費在體育活動上的時間越長,則期末考試數學成績可能會降低,故不為正相關,故C錯誤;
期末考試隨機編排的準考證號與期末考試成績總分沒有相關關系,故D錯誤.
1
2
3
4
5
6
7
8
9
10
11
12
答案
2.某校課外學習小組研究某作物種子的發芽率y和溫度x(單位:℃)的關系,由實驗數據得到如圖所示的散點圖.由此散點圖判斷,最適宜作為發芽率y和溫度x的回歸模型的是
A.y=a+bx B.y=a+bx2(b>0)
C.y=a+bex D.y=a+bln x

1
2
3
4
5
6
7
8
9
10
11
12
答案
由散點圖可見,數據分布成遞增趨勢,但是呈現上
凸效果,即增長緩慢.
A中,y=a+bx是直線型,均勻增長,不符合要求;
B中,y=a+bx2(b>0)是二次函數型,圖象呈現下凸,
增長也較快,不符合要求;
C中,y=a+bex是指數型,爆炸式增長,增長快,不符合要求;
D中,y=a+bln x是對數型,增長緩慢,符合要求.
故對數型最適宜該回歸模型.
1
2
3
4
5
6
7
8
9
10
11
12
答案
3.已知變量y關于變量x的非線性經驗回歸方程為ln x+0.24,其一組數據如表所示:
若x=e10,則y的值大約為
A.4.94 B.5.74 C.6.81 D.8.04
x e e3 e4 e6 e7
y 1 2 3 4 5

1
2
3
4
5
6
7
8
9
10
11
12
答案
由ln x+0.24,令t=ln x,則t+0.24,由題意易得
=4.2,=3,所以3=×4.2+0.24,解
得≈0.657,所以=0.657ln x+0.24,若x=e10,解得=6.81.
x e e3 e4 e6 e7
y 1 2 3 4 5
1
2
3
4
5
6
7
8
9
10
11
12
答案
4.為了研究y關于x的線性相關關系,收集了5組樣本數據(如表所示):
若已求得經驗回歸方程為x+0.34,則下列選項中正確的是
附:樣本相關系數r=.
A.=0.21
B.當x=8時,y的預測值為2.2
C.兩變量y與x負相關
D.去掉樣本點(3,1)后,x與y的樣本相關系數r不會改變
x 1 2 3 4 5
y 0.5 0.9 1 1.1 1.5

1
2
3
4
5
6
7
8
9
10
11
12
答案
=3,=1,將(3,1)代入x
+0.34得3+0.34=1,解得=0.22,故A錯誤;
當x=8時,y的預測值為=0.22×8+0.34=2.1,故B錯誤;
因為=0.22>0,所以兩變量y與x正相關,故C錯誤;
去掉樣本點(3,1)后,新樣本數據的平均值沒有變化,即=3,=1仍然成立,不妨設(3,1)為第5組數據,即x5=3,y5=1,則x5-=0,y5-=0,其余數據沒有變化,
1
2
3
4
5
6
7
8
9
10
11
12
答案
則由樣本相關系數公式r=可知,即新樣本數據x與y
的樣本相關系數與原數據的樣本相關系數相等,即x與y的樣本相關系數r不會改變,故D正確.
1
2
3
4
5
6
7
8
9
10
11
12
答案
二、多項選擇題
5.(2025·南昌模擬)如圖對兩組數據x,y和v,u分別進行回歸分析,得到散
點圖如圖,并求得經驗回歸方程分別是y=x+和u=v+,并對變
量x,y進行線性相關檢驗,得到樣本相關系數r1,對變量v,u進行線性相關檢驗,得到樣本相關系數r2,則下列判斷正確的是
A.<0 B.>0
C.< D.r1+r2<0



1
2
3
4
5
6
7
8
9
10
11
12
答案
由散點圖可知,x與y負相關,v與u正相關,則<0,>0,故A,B正確;
圖形中點(x,y)比(v,u)更加集中在一條直線附近,
則>,又r1<0,r2>0,則r1+r2<0,故C錯誤,D正確.
1
2
3
4
5
6
7
8
9
10
11
12
答案
6.(2024·武漢模擬)某科技公司統計了一款APP,最近5個月的下載量如表所示,若y與x線性相關,且經驗回歸方程為=-0.6x+,則
A.y與x負相關
B.=5.6
C.預測第6個月的下載量約為2.1萬次
D.殘差絕對值的最大值為0.2

月份編號x 1 2 3 4 5
下載量y(萬次) 5 4.5 4 3.5 2.5


1
2
3
4
5
6
7
8
9
10
11
12
答案
因為-0.6<0,所以變量y與x負相關,故A正確;
×(1+2+3+4+5)=3,×(5+4.5+4+3.5+2.5)=3.9,=-0.6x+,則-0.6×3+=3.9,解得=5.7,故B錯誤;
當x=6時,=-0.6×6+5.7=2.1,故可以預測第6個月的下載量約為2.1萬次,
故C正確;
當x=1時,=-0.6×1+5.7=5.1,|y1-|=0.1;當x=2時,=-0.6×2+5.7=4.5,|y2-|=0;當x=3時,=-0.6×3+5.7=3.9,|y3-|=0.1;當x=4時,=-0.6×4+5.7=3.3,|y4-|=0.2;當x=5時,=-0.6×5+5.7=2.7,|y5-|=0.2,故殘差絕對值的最大值為0.2,故D正確.
三、填空題
7.甲、乙、丙、丁各自研究兩個隨機變量的數據,若甲、乙、丙、丁計算得到各自研究的兩個隨機變量的樣本相關系數分別為r1=0.66,r2=-0.97,r3=0.92,r4=0.89,則這四人中,   研究的兩個隨機變量的線性相關程度最高.
1
2
3
4
5
6
7
8
9
10
11
12
答案
因為|r2|=0.97>|r3|>|r4|>|r1|,所以這四人中,乙研究的兩個隨機變量的線性相關程度最高.

1
2
3
4
5
6
7
8
9
10
11
12
答案
8.新能源汽車的核心部件是動力電池,電池成本占了新能源整車成本的大部分,而其中的原材料碳酸鋰又是電池的主要成分.從2020年底開始,碳酸鋰的價格一路水漲船高,下表是2022年某企業的前5個月碳酸鋰的價格與月份的統計數據:
月份代碼x 1 2 3 4 5
碳酸鋰價格y(萬元/kg) 0.5 0.6 1 m 1.5
根據表中數據,得出y關于x的經驗回歸方程為=0.28x+,根據數據計算出在樣本點(5,1.5)處的殘差為-0.06,則表中m=   .
1.4
1
2
3
4
5
6
7
8
9
10
11
12
答案
由題設,1.5-=1.5-(0.28×5+)=-0.06,可得=0.16.
又=3,

所以0.28×3+0.16=,可得m=1.4.
月份代碼x 1 2 3 4 5
碳酸鋰價格y(萬元/kg) 0.5 0.6 1 m 1.5
1
2
3
4
5
6
7
8
9
10
11
12
答案
四、解答題
9.(2024·曲靖模擬)某地區2019-2023年的充電樁數量及新能源汽車的年銷量如表所示:
年份 2019 2020 2021 2022 2023
充電樁數量x/萬臺 1 3 5 7 9
新能源汽車的年銷量y/萬輛 25 37 48 58 72
(1)已知可用線性回歸模型擬合y與x的關系,請用樣本相關系數加以說明(結果精確到0.001);
1
2
3
4
5
6
7
8
9
10
11
12
答案
參考公式:樣本相關系數r=,
經驗回歸方程x中斜率和截距的最小二乘估計公式分別為
,.
參考數據:=40,=1 326,xiyi=1 430,
≈230.304.
1
2
3
4
5
6
7
8
9
10
11
12
答案
由題可知,×(1+3+5+7+9)=5,
×(25+37+48+58+72)=48,
所以r===≈≈
0.999.
因為y與x的樣本相關系數近似為0.999,非常接近1,所以y與x的線性相關程度很高,可以用線性回歸模型擬合y與x的關系.
1
2
3
4
5
6
7
8
9
10
11
12
答案
(2)求y關于x的線性回歸方程,預測當該地區充電樁數量為24萬臺時,新能源汽車的年銷量是多少萬輛?
年份 2019 2020 2021 2022 2023
充電樁數量x/萬臺 1 3 5 7 9
新能源汽車的年銷量y/萬輛 25 37 48 58 72
1
2
3
4
5
6
7
8
9
10
11
12
答案
參考公式:樣本相關系數r=,
經驗回歸方程x中斜率和截距的最小二乘估計公式分別為
,.
參考數據:=40,=1 326,xiyi=1 430,
≈230.304.
1
2
3
4
5
6
7
8
9
10
11
12
答案
=5.75,
=48-5.75×5=19.25,
所以y關于x的線性回歸方程為=5.75x+19.25.
當x=24時,=5.75×24+19.25=157.25,
所以當充電樁數量為24萬臺時,該地區新能源汽車的年銷量為157.25萬輛.
1
2
3
4
5
6
7
8
9
10
11
12
答案
10.某科技公司為加大高科技研發投入,現對近十年來高科技研發投入情況分析調研,統計了近十年的研發投入y(單位:億元)與年份代碼x共10組數據,其中年份代碼x=1,2,…,10分別指2014年,2015年,…,2023年.現用模型①y=bx+a,②y=c+d分別進行擬合,由此得到相應的經驗回歸方程,并進行殘差分析,得到如圖所示的殘差圖.
1
2
3
4
5
6
7
8
9
10
11
12
答案
根據收集到的數據,計算得到下表數據,其中ti=,ti.
75 2.25 82.5 4.5 121.4 28.82
(1)根據殘差圖,比較模型①②的擬合效果,判斷哪個模型擬合效果更好,并說明理由;
1
2
3
4
5
6
7
8
9
10
11
12
答案
應該選擇模型②.
由于模型②殘差點比較均勻地落在水平的
帶狀區域中,且帶狀區域的寬度比模型①
帶狀寬度窄,所以模型②的擬合精度更高,
相應的經驗回歸方程的預報精度就會越高,所以選模型②比較合適.
1
2
3
4
5
6
7
8
9
10
11
12
答案
(2)根據(1)中所選模型,求出y關于x的經驗回歸方程(結果保留2位小數);根據該模型,求該公司2029年高科技研發投入y的預報值.
75 2.25 82.5 4.5 121.4 28.82
1
2
3
4
5
6
7
8
9
10
11
12
答案
附:經驗回歸直線 +x的斜率和截距的最小二乘估計分別為
,.
1
2
3
4
5
6
7
8
9
10
11
12
答案
根據模型②,令t=,研發投入y與t可用
經驗回歸方程來擬合,有t.
則≈6.404,
所以=75-×2.25=60.59,則y關于t的經驗回歸方程為=
6.40t+60.59.
1
2
3
4
5
6
7
8
9
10
11
12
答案
所以y關于x的非線性經驗回歸方程為=
6.40+60.59.
在2029年,即當x=16時,
=6.40+60.59=86.19(億元).
所以該公司2029年高科技研發投入y的預報值為86.19億元.
1
2
3
4
5
6
7
8
9
10
11
12
答案
能力拓展
11.(多選)某地新開了一條夜市街,每晚平均客流量為2萬人,每晚最多能接納的客流量為10萬人,主辦公司決定通過微信公眾號和其他APP進行廣告宣傳提高營銷效果.通過調研,公司發現另一處同等規模的夜市街投入的廣告費x(單位:萬元)與每晚增加的客流量y(單位:千人)存在如下關系:
x/萬元 1 2 3 4 5 6
y/千人 5 6 8 9 12 20
1
2
3
4
5
6
7
8
9
10
11
12
答案
現用曲線C:×2x擬合變量x與y的相關關系,并利用一元線性回歸模型求參數,(精確到0.01),以所求經驗回歸方程C為預測依據,則
參考數據:=10,xiyi=257,=91,2i=126,=5 460,2iyi=1 906.
x/萬元 1 2 3 4 5 6
y/千人 5 6 8 9 12 20
1
2
3
4
5
6
7
8
9
10
11
12
答案
附:一元線性回歸模型參數的最小二乘估計公式:,
.
A.=5.82
B.曲線C經過點(log221,10)
C.廣告費每增加1萬元,每晚客流量平均增加3 000人
D.若廣告費超過9萬元,則每晚客流量會超過夜市街的接納能力
x/萬元 1 2 3 4 5 6
y/千人 5 6 8 9 12 20


1
2
3
4
5
6
7
8
9
10
11
12
答案
由題知,2iyi=1 906,=10,
2i=×126=21,=5 460,
所以≈0.23,
≈10-0.23×21=5.17,A錯誤;
所以=5.17+0.23×2x,
令x=log221,求得=10,B正確;
由上式可知,x每增加1萬元,y不是平均增加的,C錯誤;
若x>9,則>122.93,而每晚最多能接納的客流量為10萬人,故D正確.
1
2
3
4
5
6
7
8
9
10
11
12
答案
12.(2024·邵陽模擬)某學習小組對一組數據(xi,yi)(i=1,2,3,…,7)進行回歸分析,甲同學首先求出回歸直線方程為=5x+4,=2,=m.乙同學對甲同學的計算過程進行檢查,發現甲同學將數據(2,3)誤輸成(3,2),將這兩個數據修正后得到回歸直線方程為=kx+7,則實數k=   .
1
2
3
4
5
6
7
8
9
10
11
12
答案
由題意可得m=5×2+4=14,
即修正前的=14,
假設甲輸入的(x1,y1)為(3,2),
則3+x2+x3+…+x7=2×7=14,
則x2+x3+…+x7=11,
且2+y2+y3+…+y7=7×14=98,
則y2+y3+…+y7=96,
1
2
3
4
5
6
7
8
9
10
11
12
答案
返回
改為正確數據后,則
'=×(2+11)='=×(3+96)=,
將點=kx+7,
可得k+7,解得k=.(共93張PPT)
第九章
§9.4 列聯表與獨立性檢驗
數學





1.通過實例,理解2×2列聯表的統計意義.
2.通過實例,了解獨立性檢驗及其應用.
課標要求
課時精練
內容索引
第一部分 落實主干知識
第二部分 探究核心題型
落實主干知識
第一部分
1.分類變量
為了表述方便,我們經常會使用一種特殊的隨機變量,以區別不同的現象或性質,這類隨機變量稱為分類變量.分類變量的取值可以用實數表示.
2.列聯表與獨立性檢驗
(1)關于分類變量X和Y的抽樣數據的2×2列聯表:
X Y 合計
Y=0 Y=1 X=0 a b a+b
X=1 c d c+d
合計 a+c b+d n=a+b+c+d
(2)計算統計量χ2=,利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ2獨立性檢驗.
如表為5個常用的小概率值和相應的臨界值.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
1.判斷下列結論是否正確.(請在括號中打“√”或“×”)
(1)2×2列聯表中的數據是兩個分類變量的頻數.(  )
(2)事件A和B的獨立性檢驗無關,即兩個事件互不影響.(  )
(3)χ2的大小是判斷事件A和B是否相關的統計量.(  )
(4)在2×2列聯表中,若|ad-bc|越小,則說明兩個分類變量之間關系越強.(  )
×

×

2.一個2×2列聯表如表所示,則表中a,c處的值分別為
y1 y2 合計
x1 a 25 73
x2 21 b c
合計 d 49
A.98,28 B.28,98
C.48,45 D.45,48

由2×2列聯表知,
a+25=73,b+25=49,b+21=c,
解得a=48,b=24,c=45.
3.想要檢驗喜歡參加體育活動是不是與性別有關,應該提出統計假設H0為
A.男性喜歡參加體育活動
B.女性不喜歡參加體育活動
C.喜歡參加體育活動與性別有關
D.喜歡參加體育活動與性別無關
獨立性檢驗是一種假設性檢驗,假設有反證法的意味,應假設兩類變量無關,在該假設下構造的隨機變量χ2應該很小,如果χ2很小,則不能肯定或否定假設,反之,則在一定程度上說明假設不合理,即認為兩個變量在一定程度上有關,所以想要檢驗喜歡參加體育活動是不是與性別有關,應該提出統計假設H0:喜歡參加體育活動與性別無關.

4.(2024·哈爾濱模擬)根據分類變量x與y的成對樣本數據,計算得χ2=2.826,依據α=0.05的獨立性檢驗,結論為
參考值:
A.x與y不獨立
B.x與y不獨立,這個結論犯錯誤的概率不超過0.05
C.x與y獨立
D.x與y獨立,這個結論犯錯誤的概率不超過0.05
α 0.1 0.05 0.01
xα 2.706 3.841 6.635

零假設為H0:x與y獨立,由χ2=2.826<3.841,依據α=0.05的獨立性檢驗,可得H0成立,故可以認為x與y獨立.
回歸分析和獨立性檢驗都是基于成對樣本觀測數據進行估計或推斷,得出的結論都可能犯錯誤.
返回
微點提醒
探究核心題型
第二部分
例1 (1)為了發展學生的興趣和個性特長,培養全面發展的人才.某學校在不加重學生負擔的前提下,提供個性、全面的選修課程.為了解學生對于選修課《學生領導力的開發》的選擇意愿情況,對部分高二學生進行了抽樣調查,制作出如圖所示的兩個等高堆積條形圖,根據條形圖,下列結論正確的是
A.樣本中不愿意選該門課的人數較多
B.樣本中男生人數多于女生人數
C.樣本中女生人數多于男生人數
D.該等高堆積條形圖無法確定樣本中男生人數是否多于女生人數

列聯表及等高堆積條形圖
題型一
由圖乙可知,樣本中男生,女生都大部
分愿意選擇該門課,則樣本中愿意選該
門課的人數較多,A錯誤;
由圖甲可知,在愿意和不愿意的人中,
都是男生占比較大,所以可以確定,樣本中男生人數多于女生人數,B正確,C,D錯誤.
(2)假設有兩個分類變量X與Y,它們的可能取值分別為{x1,x2}和{y1,y2},其2×2列聯表為
Y X   y1 y2 合計
x1 10 18 28
x2 m 26 m+26
合計 m+10 44 m+54
則當整數m取     時,X與Y的關系最弱
A.8 B.9 C.14 D.19

在兩個分類變量的列聯表中,當|ad-bc|的值越小時,認為兩個分類變量有關的可能性越小.
令|ad-bc|=0,得10×26=18m,
解得m≈14.4,
又m為整數,所以當m=14時,X與Y的關系最弱.
利用2×2列聯表分析兩個分類變量間關系的步驟
(1)根據題中數據獲得2×2列聯表;
(2)根據頻率特征,即將的值相比,直觀地反映出兩個分類變量間是否相互影響.
思維升華
跟蹤訓練1 (2024·成都模擬)有甲、乙兩個班級進行數學考試,按照大于等于85分為優秀,85分以下為非優秀統計成績,得到列聯表:
優秀 非優秀
甲班 10 b
乙班 c 30
附:χ2=(n=a+b+c+d).
α 0.05 0.01 0.005
xα 3.841 6.635 7.879
已知在全部的105人中隨機抽取1人,成績優秀的概率為,則下列說法正確的是
A.甲班人數少于乙班人數
B.甲班的優秀率高于乙班的優秀率
C.表中c的值為15,b的值為50
D.根據表中的數據,若依據α=0.05的獨立性檢驗,能認為“成績優秀率
 與班級有關系”

由條件知10+b+c+30=105,,故b+c=65,10+c=30,所以b=45,c=20,故C錯誤;
由于甲班人數為10+b=10+45=55,乙班人數為c+30=20+30=50<55,故A錯誤;
由于甲班優秀率為>,故B錯誤;
由于χ2=≈6.109>3.841,故D正確.
列聯表與獨立性檢驗
題型二
例2 (2025·八省聯考)為考察某種藥物A對預防疾病B的效果,進行了動物(單位:只)試驗,得到如下列聯表:
藥物 疾病 合計
未患病 患病 未服用 100 80 s
服用 150 70 220
合計 250 t 400
(1)求s,t;
s=100+80=180,t=80+70=150.
藥物 疾病 合計
未患病 患病 未服用 100 80 s
服用 150 70 220
合計 250 t 400
(2)記未服用藥物A的動物患疾病B的概率為p,給出p的估計值;
∵,∴p的估計值為.
藥物 疾病 合計
未患病 患病 未服用 100 80 s
服用 150 70 220
合計 250 t 400
(3)根據小概率值α=0.01的獨立性檢驗,能否認為藥物A對預防疾病B有效?
附:χ2=.
藥物 疾病 合計
未患病 患病 未服用 100 80 s
服用 150 70 220
合計 250 t 400
α 0.05 0.01 0.001
xα 3.841 6.635 10.828
零假設H0:藥物A對預防疾病B無效.
根據列聯表中的數據可得χ2=≈6.734>6.635=x0.01.
根據小概率值α=0.01的獨立性檢驗,推斷H0不成立,
即認為藥物A對預防疾病B有效.
獨立性檢驗的一般步驟
(1)根據樣本數據制成2×2列聯表.
(2)根據公式χ2=計算.
(3)比較χ2與臨界值的大小關系,作統計推斷.
思維升華
跟蹤訓練2 某中學對高二甲、乙兩個同類班級進行“加強‘語文閱讀理解’訓練對提高‘數學應用題’得分率的作用”的試驗,其中甲班為試驗班(加強“語文閱讀理解”訓練),乙班為對比班(常規教學,無額外訓練),在試驗前的測試中,甲、乙兩班學生在數學應用題上的得分率基本一致,試驗結束后,統計幾次數學應用題測試的平均成績(均取整數)如表所示:
60分以下 61~70分 71~80分 81~90分 91~100分
甲班(人數) 3 11 6 12 18
乙班(人數) 7 8 10 10 15
現規定平均成績在80分以上(不含80分)的為優秀.
(1)計算兩個班級的優秀率;
由題意知,甲、乙兩班均有學生50人,
甲班優秀人數為30人,優秀率為=0.6=60%,
乙班優秀人數為25人,優秀率為=0.5=50%,
所以甲、乙兩班的優秀率分別為60%和50%.
(2)根據以上統計數據填寫右面2×2列聯表,依據小概率值α=0.05的獨立性檢驗,能否認為加強“語文閱讀理解”訓練對提高“數學應用題”得分率有幫助?
參考公式及數據:
χ2=,n=a+b+c+d.
優秀人數 非優秀人數 合計
甲班
乙班
合計
α 0.05 0.01 0.001
xα 3.841 6.635 10.828
補全2×2列聯表如下所示.
零假設為H0:加強“語文閱讀理解”訓練對提高“數學應用題”得分率沒有幫助.
優秀人數 非優秀人數 合計
甲班 30 20 50
乙班 25 25 50
合計 55 45 100
由χ2=≈1.01<3.841,
根據小概率值α=0.05的獨立性檢驗,沒有充分證據推斷H0不成立,因此認為H0成立,即加強“語文閱讀理解”訓練對提高“數學應用題”得分率沒有幫助.
獨立性檢驗的綜合應用
題型三
例3 (2024·拉薩模擬)為促進中華戲曲文化的傳承與發展,某校開展了戲曲進校園文藝活動,從全校學生中隨機抽取60名男生和60名女生參加戲曲知識競賽,并按得分(滿分:100分)統計,分別繪制成頻率分布直方圖,如圖所示.
(1)現有10張某戲劇的演出票送給得分在80分以上(含80分)的同學,根據男生組和女生組得分在80分以上(含80分)的人數,采用按比例分配的分層隨機抽樣的方法,則男生組、女生組分別得多少張該戲劇的演出票?
由頻率分布直方圖得,
男生組得分在80分以上(含80分)的有(0.010+0.005)×10×60=9(人),
女生組得分在80分以上(含80分)的有(0.025+0.010)×10×60=21(人),
所以男生組分得票數為×10=3,
女生組分得票數為×10=7,
所以男生組、女生組分別得3張和7張該戲劇的演出票.
(2)假設學生競賽成績在80分以上(含80分)被認定為這名學生喜愛戲曲.將參加競賽的學生成績及性別制成下列2×2列聯表:
男生 女生 合計
喜愛戲曲
不喜愛戲曲
合計
將列聯表補充完整并依據小概率值α=0.01的獨立性檢驗,能否認為學生喜愛戲曲與性別有關?
參考公式及數據:χ2=(其中n=a+b+c+d).
α 0.05 0.01 0.001
xα 3.841 6.635 10.828
由(1)知,男生組得分在80分以上(含80分)的有9人,80分以下的有51人;女生組得分在80分以上(含80分)的有21人,80分以下的有39人,
所以補充2×2列聯表:
男生 女生 合計
喜愛戲曲 9 21 30
不喜愛戲曲 51 39 90
合計 60 60 120
零假設為H0:學生喜愛戲曲與性別無關.
根據列聯表中數據計算,得χ2=
==6.4<6.635,
根據臨界值表可知,沒有充分證據推斷H0不成立,即學生喜愛戲曲與性別無關.
獨立性檢驗的考查,往往與概率和抽樣統計圖等一起考查,這類問題的求解往往按各小題及提問的順序,一步步進行下去,是比較容易解答的,考查單純的獨立性檢驗往往用小題的形式,而且χ2的公式一般會在原題中給出.
思維升華
跟蹤訓練3 (2024·赤峰模擬)隨著中國科技的迅猛發展和進步,中國民用無人機行業技術實力和國際競爭力不斷提升,市場規模持續增長.為了適應市場需求,我國某無人機制造公司研發了一種新型民用無人機,為測試其性能,對其飛行距離與核心零件損壞數進行了統計,數據如下:
飛行距離x(千公里) 56 63 71 79 90 102 110 117
核心零件 損壞數y(個) 61 73 90 105 119 136 149 163
(1)若建立y關于x的回歸模型為x+,求y關于x的經驗回歸方程(精確到0.1,精確到1);
附:經驗回歸方程x+中斜率和截距的最小二乘估計公式,,χ2=,n=a+b+c+d.
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
參考數據:=86,=112,xiyi=82 743,=62 680.
依題意,≈1.6,
=112-1.6×86≈-26,
所以y關于x的經驗回歸方程為=1.6x-26.
(2)為了檢驗核心零件報廢是否與保養有關,該公司進行第二次測試,從所有同型號民用無人機中隨機選取100臺進行等距離測試,測試前對其中60臺進行核心零件保養,測試結束后,有20臺無人機核心零件報廢,其中保養過的占比30%,請根據統計數據完成2×2列聯表,并根據小概率值α=0.01的獨立性檢驗,能否認為核心零件的報廢與保養有關?
保養 未保養 合計
報廢 20
未報廢
合計 60 100
附:經驗回歸方程x+中斜率和截距的最小二乘估計公式,,χ2=,n=a+b+c+d.
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
參考數據:=86,=112,xiyi=82 743,=62 680.
依題意,核心零件報廢的無人機中保養過的有20×30%=6(臺),未保養的有20-6=14(臺),
則2×2列聯表如下:
保養 未保養 合計
報廢 6 14 20
未報廢 54 26 80
合計 60 40 100
零假設為H0:核心零件的報廢與保養無關,
則χ2==9.375>6.635,根據小概率值α=0.01的獨立性檢驗,
推斷H0不成立,即認為核心零件報廢與保養有關,此推斷犯錯誤的概率不超過0.01.
返回
課時精練
對一對
答案
1
2
3
4
5
6
7
8
9
10
11
12
題號 1 2 3 4 5 6 7
答案 D D C B ABC BD 有關
題號 8 11 12 答案 0.05 C 5或6 答案
1
2
3
4
5
6
7
8
9
10
11
12
(1)由題意得來自B地區且喜愛程度為“非常喜歡”的觀眾有0.35×100=35(人),
所以應從A地區抽取
30×=6(人),
從B地區抽取35×=7(人).
9.
答案
1
2
3
4
5
6
7
8
9
10
11
12
(2)完成2×2列聯表如下:
零假設為H0:觀眾的喜愛程度與所在地區無關.
9.
非常喜歡 喜歡 合計
A 30 15 45
B 35 20 55
合計 65 35 100
答案
1
2
3
4
5
6
7
8
9
10
11
12
χ2=≈0.1<3.841=x0.05,
根據小概率值α=0.05的獨立性檢驗,沒有充分證據推斷H0不成立,因此可以認為H0成立,即觀眾的喜愛程度與所在地區無關.
9.
答案
1
2
3
4
5
6
7
8
9
10
11
12
(1)依題意,抽取的學生人數為50+100+200+400+250=1 000,則估計這次測試學生得分的平均值為55×+65×+75×+85×+95×=82.
(2)依題意得
解得可得2×2列聯表:
10.
答案
1
2
3
4
5
6
7
8
9
10
11
12
零假設為H0:男生和女生對消防安全知識的掌握情況無差異.
10.
男生 女生 合計
得分不低于80分 400 250 650
得分低于80分 100 250 350
合計 500 500 1 000
答案
1
2
3
4
5
6
7
8
9
10
11
12
則χ2=
≈98.901>10.828=x0.001,
故依據小概率值α=0.001的獨立性檢驗,我們推斷H0不成立,即能判斷男生和女生對消防安全知識的掌握情況有差異,此推斷犯錯誤的概率不超過0.001.
10.
一、單項選擇題
1.觀察下列各圖,其中兩個分類變量x,y之間關系最強的是
1
2
3
4
5
6
7
8
9
10
11
12
知識過關
答案

1
2
3
4
5
6
7
8
9
10
11
12
答案
觀察等高堆積條形圖發現相差很大,就判斷兩個分類變量之間關系最強.
1
2
3
4
5
6
7
8
9
10
11
12
答案
2.下列關于獨立性檢驗的說法正確的是
A.獨立性檢驗是對兩個變量是否具有線性相關關系的一種檢驗
B.獨立性檢驗可以100%確定兩個變量之間是否具有某種關系
C.利用χ2獨立性檢驗推斷吸煙與患肺病的關聯中,若有99%的把握認為吸煙
 與患肺病有關系時,則我們可以說在100個吸煙的人中,有99人患肺病
D.對于獨立性檢驗,隨機變量χ2的值越小,判定“兩變量有關系”犯錯誤
 的概率越大

1
2
3
4
5
6
7
8
9
10
11
12
答案
對于A,獨立性檢驗是通過卡方計算來判斷兩個變量存在關聯的可能性的一種方法,并非檢驗二者是否是線性相關,故錯誤;
對于B,獨立性檢驗并不能100%確定兩個變量相關,故錯誤;
對于C,99%是指“吸煙”和“患肺病”存在關聯的可能性,并非吸煙人中患肺病的發病率,故錯誤;
對于D,根據卡方計算的定義可知該選項正確.
1
2
3
4
5
6
7
8
9
10
11
12
答案
3.(2024·棗莊模擬)某兒童醫院用甲、乙兩種療法治療小兒消化不良.采用有放回簡單隨機抽樣的方法對治療情況進行檢查,得到兩種療法治療數據的列聯表:
療法 療效 合計
未治愈 治愈 甲 15 52 67
乙 6 63 69
合計 21 115 136
1
2
3
4
5
6
7
8
9
10
11
12
答案
經計算得到χ2≈4.881,根據小概率值α=0.005的獨立性檢驗(已知χ2獨立性檢驗中x0.005=7.879),則可以認為
A.兩種療法的效果存在差異
B.兩種療法的效果存在差異,這種判斷犯錯誤的概率不超過0.005
C.兩種療法的效果沒有差異
D.兩種療法的效果沒有差異,這種判斷犯錯誤的概率不超過0.005

1
2
3
4
5
6
7
8
9
10
11
12
答案
零假設為H0:療法與療效獨立,即兩種療法效果沒有差異.
由χ2≈4.881<7.879=x0.005,根據小概率值α=0.005的獨立性檢驗,沒有充分證據推斷H0不成立,
因此可以認為H0成立,即認為兩種療法效果沒有差異.
1
2
3
4
5
6
7
8
9
10
11
12
答案
4.古語云:“朝霞不出門,晚霞行千里”,其大意是如果早晨起來看到天邊有朝霞的話,今天的天氣可能不佳,會下雨,要引起重視,若是傍晚看到天邊的晚霞,第二天很有可能是一個好天氣,天氣晴朗.某學習小組針對“朝霞不出門”這一句的可信度進行了觀測統計,得到如下2×2列聯表.
有朝霞 無朝霞 合計
當天有雨 8 8 16
當天無雨 2 12 14
合計 10 20 30
1
2
3
4
5
6
7
8
9
10
11
12
答案
參考公式:χ2=,n=a+b+c+d.
臨界值參照表:
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
則下列說法正確的是
A.如果有朝霞,當天下雨的概率超過95%
B.能在犯錯誤的概率不超過5%的前提下,認為有朝霞與當天下雨有關
C.能在犯錯誤的概率不超過0.5%的前提下,認為有朝霞與當天下雨有關
D.連續三天中必有一天出現朝霞

1
2
3
4
5
6
7
8
9
10
11
12
答案
由題中2×2列聯表知,如果有朝霞,則當天下雨的概率約為80%,故A選項錯誤;
由題得χ2=≈4.286>3.841,但小于7.879,故B選項正確,
C選項錯誤;
有朝霞的天數占總天數的,但并不意味著連續三天中必有一天出現朝霞,
故D選項錯誤.
1
2
3
4
5
6
7
8
9
10
11
12
答案
二、多項選擇題
5.(2024·湛江模擬)某養老院有110名老人,經過一年的跟蹤調查,過去的一年中他們是否患過某流行疾病和性別的相關數據如表所示:
性別 是否患過某流行疾病 合計
患過該疾病 未患過該疾病 男 20 b a+b
女 c 50 c+d
合計 a+c 80 110
1
2
3
4
5
6
7
8
9
10
11
12
答案
下列說法正確的有
參考公式:χ2=,其中n=a+b+c+d.
附表:
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
A.>
B.χ2>6.635
C.根據小概率值α=0.01的獨立性檢驗,認為是否患過該流行疾病與性別有關聯
D.根據小概率值α=0.01的獨立性檢驗,沒有充分的證據推斷是否患過該流行疾
 病與性別有關聯



1
2
3
4
5
6
7
8
9
10
11
12
答案
根據列聯表中的數據可求得a=20,b=30,c=10,d=50,代入計算可
得>,A正確;
經計算可得χ2=≈7.486>6.635,B正確;
結合附表數值以及獨立性檢驗的實際意義,根據小概率值α=0.01的獨立性檢驗,認為是否患過該流行疾病與性別有關聯,C正確,D錯誤.
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
1
2
3
4
5
6
7
8
9
10
11
12
答案
6.(2024·長春模擬)暑假結束后,為了解假期中學生鍛煉身體情況,學生處對所有在校學生做問卷調查,并隨機抽取了180人的調查問卷,其中男生比女生少20人,并將調查結果繪制得到等高堆積條形圖.
參考公式及數據:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
1
2
3
4
5
6
7
8
9
10
11
12
答案
在被調查者中,下列說法正確的是
A.男生中不經常鍛煉的人數比女生中經常鍛煉的人數多
B.男生中經常鍛煉的人數比女生中經常鍛煉的人多8人
C.經常鍛煉者中男生的頻率是不經常鍛煉者中男生的頻率的2倍
D.根據小概率值α=0.01的獨立性檢驗,可以認為假期是否經常鍛煉與性
 別有關


1
2
3
4
5
6
7
8
9
10
11
12
答案
設男生人數為x,則女生人數為x+20,
由題意得x+x+20=180,
解得x=80,即在被調查者中,男生、女生人數分別為80,100,可得到如下2×2列聯表,
性別 鍛煉情況 合計
經常鍛煉 不經常鍛煉 男 48 32 80
女 40 60 100
合計 88 92 180
1
2
3
4
5
6
7
8
9
10
11
12
答案
由表可知,A顯然錯誤;
男生中經常鍛煉的人數比女生中經常鍛煉的人數多48-40=8,B正確;
在經常鍛煉者中是男生的頻率為≈0.545 5,在不經常鍛煉者中是男生的頻率為≈0.347 8,≈1.6,C錯誤;
零假設H0:是否經常鍛煉與性別無關,則χ2=≈7.115>
6.635=x0.01,根據小概率值α=0.01的獨立性檢驗,我們推斷H0不成立,即認為假期是否經常鍛煉與性別有關,D正確.
三、填空題
7.在獨立性檢驗中,統計量χ2有兩個臨界值:3.841和6.635.當χ2≥3.841時,至少有95%的把握說明兩個事件有關,當χ2≥6.635時,至少有99%的把握說明兩個事件有關,當χ2<3.841時,認為兩個事件無關.在一項打鼾與心臟病的調查中,共調查了200人,經計算χ2=20.87.根據這一數據分析,我們可認為打鼾與患心臟病之間是    的(填“有關”或“無關”).
1
2
3
4
5
6
7
8
9
10
11
12
答案
有關
因為χ2=20.87>6.635,
所以至少有99%的把握認為打鼾與患心臟病有關.
可認為打鼾與患心臟病之間是有關的.
1
2
3
4
5
6
7
8
9
10
11
12
答案
8.在某病毒疫苗的研發過程中,需要利用基因編輯小鼠進行動物實驗.現隨機抽取100只基因編輯小鼠對該病毒疫苗進行實驗,得到如下2×2列聯表(部分數據缺失):
被某病毒感染 未被某病毒感染 合計
注射疫苗 10 50
未注射疫苗 30 50
合計 30 100
計算可知,根據小概率值α=    的獨立性檢驗,認為 “給基因編輯小鼠注射該種疫苗能起到預防該病毒感染的效果”.
0.05
1
2
3
4
5
6
7
8
9
10
11
12
答案
附:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
1
2
3
4
5
6
7
8
9
10
11
12
答案
完善2×2列聯表如下:
零假設為H0:給基因編輯小鼠注射該種疫苗不能起到預防該病毒感染的效果.
被某病毒感染 未被某病毒感染 合計
注射疫苗 10 40 50
未注射疫苗 20 30 50
合計 30 70 100
1
2
3
4
5
6
7
8
9
10
11
12
答案
因為χ2=≈4.762,
3.841<4.762<6.635,
所以根據小概率值α=0.05的獨立性檢驗,推斷H0不成立,即認為“給基因編輯小鼠注射該種疫苗能起到預防該病毒感染的效果”.
1
2
3
4
5
6
7
8
9
10
11
12
答案
四、解答題
9.由中央電視臺綜合頻道(CCTV-1)和某傳媒公司聯合制作的《開講啦》是中國首檔青年電視公開課.每期節目由一位知名人士講述自己的故事,分享他們對于生活和生命的感悟,受到了青年觀眾的喜愛.為了了解觀眾對節目的喜愛程度,電視臺隨機調查了A,B兩個地區的100名觀眾,得到如下2×2列聯表.
非常喜歡 喜歡 合計
A 30 15
B
合計
1
2
3
4
5
6
7
8
9
10
11
12
答案
已知在被調查的100名觀眾中隨機抽取1名,該觀眾來自B地區且喜愛程度為“非常喜歡”的概率為0.35.
(1)現從100名觀眾中根據喜愛程度用按比例分配的分層隨機抽樣的方法抽取20名進行問卷調查,則應抽取喜愛程度為“非常喜歡”的A,B地區的人數各是多少?
由題意得來自B地區且喜愛程度為“非常喜歡”的觀眾有0.35×100=35(人),
所以應從A地區抽取30×=6(人),
從B地區抽取35×=7(人).
1
2
3
4
5
6
7
8
9
10
11
12
答案
(2)完成上述表格,依據小概率值α=0.05的獨立性檢驗,能否認為觀眾的喜愛程度與所在地區有關?
附:χ2=,n=a+b+c+d.
α 0.05 0.01 0.001
xα 3.841 6.635 10.828
1
2
3
4
5
6
7
8
9
10
11
12
答案
完成2×2列聯表如下:
零假設為H0:觀眾的喜愛程度與所在地區無關.
非常喜歡 喜歡 合計
A 30 15 45
B 35 20 55
合計 65 35 100
1
2
3
4
5
6
7
8
9
10
11
12
答案
χ2=≈0.1<3.841=x0.05,
根據小概率值α=0.05的獨立性檢驗,沒有充分證據推斷H0不成立,因此可以認為H0成立,即觀眾的喜愛程度與所在地區無關.
1
2
3
4
5
6
7
8
9
10
11
12
答案
10.某學校開展消防安全教育活動,邀請消防隊進校園給師生進行培訓,培訓結束后抽取了部分學生進行消防安全知識測試(滿分100分),所得分數統計如表①所示,并按照學生性別進行分類,所得數據如表②所示.
表①
得分 [50,60) [60,70) [70,80) [80,90) [90,100]
人數 50 100 200 400 250
表②
男生 女生
得分不低于80分 4a b
得分低于80分 a b
1
2
3
4
5
6
7
8
9
10
11
12
答案
(1)估計這次測試學生得分的平均值;(每組數據以所在區間的中點值為代表)
依題意,抽取的學生人數為50+100+200+400+250=1 000,則估計這
次測試學生得分的平均值為55×+65×+75×+85×+95×=82.
1
2
3
4
5
6
7
8
9
10
11
12
答案
(2)依據小概率值α=0.001的獨立性檢驗,能否判斷男生和女生對消防安全知識的掌握情況有差異?
參考公式:χ2=,n=a+b+c+d.
參考數據:
α 0.01 0.005 0.001
xα 6.635 7.879 10.828
1
2
3
4
5
6
7
8
9
10
11
12
答案
依題意得
可得2×2列聯表:
零假設為H0:男生和女生對消防安全知識的掌握情況無差異.
男生 女生 合計
得分不低于80分 400 250 650
得分低于80分 100 250 350
合計 500 500 1 000
1
2
3
4
5
6
7
8
9
10
11
12
答案
則χ2=≈98.901>10.828=x0.001,
故依據小概率值α=0.001的獨立性檢驗,我們推斷H0不成立,即能判斷男生和女生對消防安全知識的掌握情況有差異,此推斷犯錯誤的概率不超過0.001.
1
2
3
4
5
6
7
8
9
10
11
12
答案
能力拓展
11.某課外興趣小組為研究數學成績優秀是否與性別有關,通過隨機抽樣調查,得到成對樣本觀測數據的分類統計結果,并計算得出χ2≈6.816,經查閱χ2獨立性檢驗的小概率值和相應的臨界值,知x0.01=6.635,則下列判斷正確的是
A.若某人數學成績優秀,那么他為男生的概率是0.010
B.每100個數學成績優秀的人中就會有1名是女生
C.數學成績優秀與性別有關,此推斷犯錯誤的概率不大于0.01
D.在犯錯誤的概率不超過1%的前提下,認為數學成績優秀與性別無關

1
2
3
4
5
6
7
8
9
10
11
12
答案
因為χ2≈6.816>6.635=x0.01,所以數學成績優秀與性別有關,此推斷犯錯誤的概率不大于0.01,即在犯錯誤的概率不超過1%的前提下認為“數學成績優秀與性別有關”,故C正確,D錯誤;
若某人數學成績優秀,由已知數據不能判斷他為男生的概率,故A錯誤;
每100個數學成績優秀的人中可能沒有女生,也有可能有多名女生,由已知數據不能確定結論,故B錯誤.
1
2
3
4
5
6
7
8
9
10
11
12
答案
12.(2024·宜春模擬)為了調查學生對網絡課程是否喜愛,研究人員隨機調查了相同人數的男、女學生,發現男生中有80%喜歡網絡課程,女生中有40%不喜歡網絡課程,且依據小概率值α=0.05的獨立性檢驗認為喜歡網絡課程與性別有關,但依據小概率值α=0.01的獨立性檢驗認為喜歡網絡課程與性別無關.已知被調查的男、女學生的總人數為20k(k∈N*),則k=   .
附:χ2=,n=a+b+c+d.
臨界值表:
5或6
α 0.05 0.01 0.005 0.001
xα 3.841 6.635 7.879 10.828
1
2
3
4
5
6
7
8
9
10
11
12
答案
設男、女學生的總人數為2m,則2m=20k(k∈N*),并把列聯表的數據補充完整:
所以χ2=,
喜歡 不喜歡 合計
男生 0.8m 0.2m m
女生 0.6m 0.4m m
合計 1.4m 0.6m 2m
1
2
3
4
5
6
7
8
9
10
11
12
答案
返回
由題意得3.841≤<6.635 80.661≤2m<139.335,
又2m=20k(k∈N*),所以4.033≤k<6.967,
所以k=5或k=6.
喜歡 不喜歡 合計
男生 0.8m 0.2m m
女生 0.6m 0.4m m
合計 1.4m 0.6m 2m(共30張PPT)
第九章
必刷大題18 統計與統計
      分析
數學





答案
1
2
3
4
(1)該地被調查村的村戶年平均收入的估計值為xi=×15=1(萬元).
(2)樣本相關系數為
r==≈≈0.95.
1.
答案
1
2
3
4
(3)采用按比例分配的分層隨機抽樣,理由如下:
由(2)知被調查村的村戶年平均收入與該村的產業投入資金有很強的正相關性,
由于各被調查村產業資金投入差異很大,因此被調查村的村戶年平均收入差異也很大,
所以采用按比例分配的分層隨機抽樣的方法較好地保持了樣本結構與總體結構的一致性,提高了樣本的代表性,從而可以獲得該地更準確的驗收估計.
1.
答案
1
2
3
4
(1)由(0.005+0.010+0.020+a+0.025+0.010)×10=1,
解得a=0.030.
(2)因為(0.005+0.010+0.020)×10=0.35,
(0.005+0.010+0.020+0.030)×10=0.65,
所以樣本數據的第62百分位數在[70,80)內,
可得70+×10=79,
所以樣本數據的第62百分位數為79.
2.
答案
1
2
3
4
(3)樣本數據落在[50,60)的個數為0.1×100=10,
落在[60,70)的個數為0.2×100=20,
總平均數×52+×64=60,
總方差s2=[6+(52-60)2]+[3+(64-60)2]=36.
2.
答案
1
2
3
4
(1)==20.3,
×[(20.1-20.3)2+(20.1-20.3)2+(20.5-20.3)2+(20.3-20.3)2+(20.5-20.3)2]==0.032,
==20.0,
×[(20.0-20.0)2+(19.9-20.0)2+(19.8-20.0)2+(20.1-20.0)2+(20.2-20.0)2]==0.02.
3.
答案
1
2
3
4
(2)由(1)得=0.3,
()2=0.09,
2=2
=2,
則(2)2=4×0.052
=0.208>0.09,
所以<2,
所以該藥物對小鼠的生長沒有顯著的抑制作用.
3.
答案
1
2
3
4
(1)零假設為H0:“制定學習計劃并堅持實施”和“數學成績高于120分”沒有關聯,
因為χ2=≈22.120>10.828=x0.001,
所以依據小概率值α=0.001的獨立性檢驗,認為H0不成立,
即認為“制定學習計劃并堅持實施”和“數學成績高于120分”有關聯.
4.
答案
1
2
3
4
(2)①×(1+2+3+4+5)=3,
×(881+857+729+569+475)=702.2,
所以===-110,
=702.2+110×3=1 032.2.
4.
答案
1
2
3
4
所以經驗回歸方程為=-110x+1 032.2.
②模型B較好,由于模型B的決定系數R2≈0.997 3與模型A的決定系數R2≈0.792 7相比較,模型B的決定系數R2大于模型A的,因此模型B的擬合效果更好;
由于經驗回歸方程為=-110x+1 032.2,當六月初月考時,x=8,小明的月考校內名次預測值為=-110×8+1 032.2≈152,
故全省名次的預測值為=28e0.016×152=28e2.432≈319.
4.
1
2
3
4
答案
1.某地用簡單隨機抽樣的方法抽取15個村進行驗收調查,調查得到一組樣本數據(xi,yi)(i=1,2,…,15),其中xi和yi分別表示第i個村中村戶的年平均收入(單位:萬元)和產業資金投入數量(單位:萬元),并計算得到
xi=15,yi=750,=0.82,=1 670,(xi-
)(yi-)=35.3.
(1)試估計該地被調查村的村戶年平均收入;
該地被調查村的村戶年平均收入的估計值為xi=×15=1(萬元).
1
2
3
4
答案
(2)根據樣本數據,求該地被調查村中村戶年平均收入與產業資金投入數量的樣本相關系數;(精確到0.01)
樣本相關系數為r=≈≈0.95.
1
2
3
4
答案
(3)根據現有統計資料,各被調查村產業資金投入差異很大.為了準確地進行驗收,請給出一種你認為更合理的抽樣方法,并說明理由.
采用按比例分配的分層隨機抽樣,理由如下:
由(2)知被調查村的村戶年平均收入與該村的產業投入資金有很強的正相關性,
由于各被調查村產業資金投入差異很大,因此被調查村的村戶年平均收入差異也很大,
所以采用按比例分配的分層隨機抽樣的方法較好地保持了樣本結構與總體結構的一致性,提高了樣本的代表性,從而可以獲得該地更準確的驗收估計.
1
2
3
4
答案
2.某學校為提高學生對《紅樓夢》的了解,舉辦了“我知紅樓”知識競賽,現從所有答卷卷面成績中隨機抽取100份作為樣本,將樣本數據(滿分100分,成績均為不低于40分的整數)分成六段:[40,50),[50,60),…,[90,100],并作出如圖所示的頻率分布直方圖.
(1)求頻率分布直方圖中a的值;
由(0.005+0.010+0.020+a+0.025+0.010)×10=1,
解得a=0.030.
1
2
3
4
答案
(2)求樣本數據的第62百分位數;
因為(0.005+0.010+0.020)×10=0.35,
(0.005+0.010+0.020+0.030)×10=0.65,
所以樣本數據的第62百分位數在[70,80)內,
可得70+×10=79,
所以樣本數據的第62百分位數為79.
1
2
3
4
答案
(3)已知樣本數據落在[50,60)的平均數是52,方差是6;落在[60,70)的平均數是64,方差是3.求這兩組數據的總平均數和總方差s2.
樣本數據落在[50,60)的個數為0.1×100=10,
落在[60,70)的個數為0.2×100=20,
總平均數×52+×64=60,
總方差s2=[6+(52-60)2]+[3+(64-60)2]=36.
1
2
3
4
答案
3.(2024·咸陽模擬)為探究某藥物對小鼠的生長抑制作用,將10只小鼠均分為兩組:對照組(不加藥物)和實驗組(加藥物),測得10只小鼠的體重(單位:g)如下:
對照組:20.1 20.1 20.5 20.3 20.5
實驗組:20.0 19.9 19.8 20.1 20.2
對照組和實驗組的小鼠體重的樣本平均數分別記為和,樣本方差分別記為和.
(1)求,,,;
1
2
3
4
答案
=20.3,
×[(20.1-20.3)2+(20.1-20.3)2+(20.5-20.3)2+(20.3-20.3)2+(20.5-20.3)2]==0.032,
=20.0,
×[(20.0-20.0)2+(19.9-20.0)2+(19.8-20.0)2+(20.1-20.0)2+(20.2-20.0)2]==0.02.
1
2
3
4
答案
(2)判斷該藥物對小鼠的生長是否有顯著的抑制作用(若≥2,則認為該藥物對小鼠的生長有顯著的抑制作用,否則不認為有顯著的抑制作用).
由(1)得=0.3,()2=0.09,2=2=2,
則(2)2=4×0.052=0.208>0.09,
所以<2,
所以該藥物對小鼠的生長沒有顯著的抑制作用.
1
2
3
4
答案
4.(2025·海口模擬)制定適合自己的學習計劃并在學習過程中根據自己的實際情況有效地安排和調整學習方法是一種有效的學習策略.某教師為研究學生制定學習計劃并堅持實施和數學成績之間的關系,得到如下數據:
成績>120分 成績≤120分 合計
制定學習計劃并堅持實施 14 6 20
沒有制定學習計劃 2 28 30
合計 16 34 50
1
2
3
4
答案
(1)依據小概率值α=0.001的獨立性檢驗,能否認為“制定學習計劃并堅持實施”和“數學成績高于120分”有關聯?
成績>120分 成績≤120分 合計
制定學習計劃并堅持實施 14 6 20
沒有制定學習計劃 2 28 30
合計 16 34 50
1
2
3
4
答案
參考數據及公式:e2.272≈9.7,e2.432≈11.4,e0.672≈2.0,xiyi=9 433,
χ2=,其中n=a+b+c+d.
α 0.05 0.01 0.005 0.001
xα 3.841 6.635 7.879 10.828
,.
1
2
3
4
答案
零假設為H0:“制定學習計劃并堅持實施”和“數學成績高于120分”沒有關聯,
因為χ2=≈22.120>10.828=x0.001,
所以依據小概率值α=0.001的獨立性檢驗,認為H0不成立,
即認為“制定學習計劃并堅持實施”和“數學成績高于120分”有關聯.
1
2
3
4
答案
(2)若該校高三年級每月進行一次月考,該校學生小明在高三開學初認真制定了學習計劃,其中一項要求自己每天要把錯題至少重做一遍,做對為止.以下為小明堅持實施計劃的月份和他在學校數學月考成績的校內名次數據:
月考時間 11月初 12月初 次年1月初 次年2月初 次年3月初
時間代碼x 1 2 3 4 5
月考校內名次y 881 857 729 569 475
①求月考校內名次y與時間代碼x的經驗回歸方程x+;
1
2
3
4
答案
參考數據及公式:e2.272≈9.7,e2.432≈11.4,e0.672≈2.0,xiyi=9 433,
χ2=,其中n=a+b+c+d.
α 0.05 0.01 0.005 0.001
xα 3.841 6.635 7.879 10.828
,.
1
2
3
4
答案
×(1+2+3+4+5)=3,
×(881+857+729+569+475)=702.2,
所以=-110,
=702.2+110×3=1 032.2.
所以經驗回歸方程為=-110x+1 032.2.
1
2
3
4
答案
②該校老師給出了該校上一年學生高考(6月初考試)數學成績在校內的名次和在全省名次的部分數據:
月考時間 11月初 12月初 次年1月初 次年2月初 次年3月初
時間代碼x 1 2 3 4 5
月考校內名次y 881 857 729 569 475
校內名次w 5 100 200 300
全省名次u 20 257 666 2 780
1
2
3
4
答案
利用數據分析軟件,得出了兩個回歸模型和決定系數R2:
模型A 模型B
R2≈0.792 7 R2≈0.997 3
在以上兩個模型中選擇“較好”模型(說明理由),并結合問題①的經驗回歸方程,依據“較好”模型預測小明如果能堅持實施學習計劃,他在次年高考中數學成績的全省名次(名次均保留整數).
1
2
3
4
答案
參考數據及公式:e2.272≈9.7,e2.432≈11.4,e0.672≈2.0,xiyi=9 433,
χ2=,其中n=a+b+c+d.
α 0.05 0.01 0.005 0.001
xα 3.841 6.635 7.879 10.828
,.
1
2
3
4
答案
模型B較好,由于模型B的決定系數R2≈0.997 3與模型A的決定系數R2≈0.792 7相比較,模型B的決定系數R2大于模型A的,因此模型B的擬合效果更好;
由于經驗回歸方程為=-110x+1 032.2,當六月初月考時,x=8,小明的月考校內名次預測值為=-110×8+1 032.2≈152,
故全省名次的預測值為=28e0.016×152=28e2.432≈319.

展開更多......

收起↑

資源列表

    <track id="r4fhd"></track>

    <pre id="r4fhd"><abbr id="r4fhd"><code id="r4fhd"></code></abbr></pre>
      <ul id="r4fhd"></ul>

        <menu id="r4fhd"></menu>
        1. 主站蜘蛛池模板: 长汀县| 永福县| 阳朔县| 蓝山县| 东莞市| 大厂| 垣曲县| 区。| 两当县| 镇安县| 呼图壁县| 泾源县| 庄河市| 车致| 云梦县| 平定县| 南宁市| 女性| 嘉鱼县| 中超| 海城市| 沈丘县| 云林县| 浑源县| 临泉县| 龙游县| 石狮市| 麻城市| 琼海市| 开阳县| 上蔡县| 益阳市| 阿拉善右旗| 巫山县| 龙海市| 红河县| 三都| 吴江市| 永修县| 安陆市| 凤凰县|