中文字幕精品无码一区二区,成全视频在线播放观看方法,大伊人青草狠狠久久,亚洲一区影音先锋色资源

新教材同步備課2024春高中數(shù)學(xué)第8章 成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析 章末綜合提升學(xué)生用書新人教A版選擇性必修第三冊(cè) 學(xué)案(5份打包)

資源下載
  1. 二一教育資源

新教材同步備課2024春高中數(shù)學(xué)第8章 成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析 章末綜合提升學(xué)生用書新人教A版選擇性必修第三冊(cè) 學(xué)案(5份打包)

資源簡(jiǎn)介

第1課時(shí) 一元線性回歸模型及參數(shù)的最小二乘估計(jì)
學(xué)習(xí)任務(wù) 1.了解一元線性回歸模型的含義,了解模型參數(shù)的統(tǒng)計(jì)意義.(數(shù)學(xué)抽象) 2.了解最小二乘原理,掌握一元線性回歸模型參數(shù)的最小二乘估計(jì)方法.(數(shù)學(xué)抽象) 3.針對(duì)實(shí)際問題,會(huì)用一元線性回歸模型進(jìn)行預(yù)測(cè).(數(shù)據(jù)分析、數(shù)學(xué)運(yùn)算)
某地區(qū)從某一年開始進(jìn)行了環(huán)境污染整治,得到了如下數(shù)據(jù):
第x年 1 2 3 4 5 6 7
污染指數(shù)y 6.1 5.2 4.5 4.7 3.8 3.4 3.1
作出這些成對(duì)數(shù)據(jù)的散點(diǎn)圖,判斷污染指數(shù)y與x是否線性相關(guān)?在知道y與x線性相關(guān)的前提下,你能找出近似描述y與x之間關(guān)系的一次函數(shù)表達(dá)式嗎?根據(jù)所得到的關(guān)系式,你能估計(jì)出該地區(qū)第8年的污染指數(shù)嗎?
知識(shí)點(diǎn)1 一元線性回歸模型
為Y關(guān)于x的一元線性回歸模型.其中,Y稱為________或________,x稱為________或________.a(chǎn)和b為模型的未知參數(shù),a稱為________參數(shù),b稱為________參數(shù);________是Y與bx+a之間的隨機(jī)誤差.
1.具有相關(guān)關(guān)系的兩個(gè)變量,其樣本點(diǎn)散布在某一條直線y=bx+a的附近,可以用一次函數(shù)y=bx+a來描述兩個(gè)變量之間的關(guān)系嗎?
                                    
                                    
                                    
知識(shí)點(diǎn)2 經(jīng)驗(yàn)回歸方程
(1)有關(guān)概念
稱為Y關(guān)于x的經(jīng)驗(yàn)回歸方程,也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱為________,求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估計(jì).
(2)計(jì)算公式
=________=,.
(1)經(jīng)驗(yàn)回歸直線過點(diǎn)(),不一定過成對(duì)樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)中的某一點(diǎn).
(2)經(jīng)驗(yàn)回歸直線的截距和斜率都是通過樣本估計(jì)而得的,存在著誤差,這種誤差可能導(dǎo)致預(yù)報(bào)結(jié)果的偏差.
(3)經(jīng)驗(yàn)回歸方程中的表示x增加1個(gè)單位時(shí),y的平均變化量為,而表示y不隨x的變化而變化的部分.
2.正相關(guān)、負(fù)相關(guān)與的符號(hào)有何關(guān)系?
                                    
                                    
                                    
1.思考辨析(正確的畫“√”,錯(cuò)誤的畫“×”)
(1)隨機(jī)誤差是一個(gè)隨機(jī)變量. (  )
(2)經(jīng)驗(yàn)回歸方程最能代表觀測(cè)值x,y之間的線性關(guān)系,且回歸直線過樣本點(diǎn)的中心(). (  )
(3)求經(jīng)驗(yàn)回歸方程前可以不進(jìn)行相關(guān)性檢驗(yàn). (  )
(4)利用經(jīng)驗(yàn)回歸方程求出的值是準(zhǔn)確值. (  )
2.下列有關(guān)經(jīng)驗(yàn)回歸方程敘述正確的是________(填序號(hào)).
①反映與x之間的函數(shù)關(guān)系;
②反映與x之間的函數(shù)關(guān)系;
③表示與x之間不確定關(guān)系;
④表示最接近與x之間真實(shí)關(guān)系的一條直線.
3.某地區(qū)近十年居民的年收入x與支出y之間的關(guān)系大致符合=0.8x+0.1(單位:億元),預(yù)計(jì)今年該地區(qū)居民收入為15億元,則年支出估計(jì)是________億元.
類型1 一元線性回歸模型的理解
【例1】 在一元線性回歸模型Y=bx+a+e中,下列說法正確的是(  )
A.Y=bx+a+e是一次函數(shù)
B.響應(yīng)變量Y是由解釋變量x唯一確定的
C.響應(yīng)變量Y除了受解釋變量x的影響外,可能還受到其他因素的影響,這些因素會(huì)導(dǎo)致隨機(jī)誤差e的產(chǎn)生
D.隨機(jī)誤差e是由于計(jì)算不準(zhǔn)確造成的,可通過精確計(jì)算避免隨機(jī)誤差e的產(chǎn)生
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
 明確一元線性回歸模型的含義是解題的關(guān)鍵,其中a和b為模型的未知參數(shù),a稱為截距參數(shù),b稱為斜率參數(shù);e是Y與bx+a之間的隨機(jī)誤差.
[跟進(jìn)訓(xùn)練]
1.關(guān)于一元線性回歸模型給出下列說法:
①表達(dá)式Y(jié)=bx+a+e刻畫的是變量Y與變量x之間的線性相關(guān)關(guān)系;
②bx+a反映了由于x的變化而引起的Y的線性變化;
③誤差項(xiàng)e是一個(gè)期望值為0的隨機(jī)變量,即E(e)=0;
④對(duì)于所有的x值,e的方差σ2都相同.
其中正確的是________(填序號(hào)).
                                    
                                    
                                    
                                    
                                    
類型2 求經(jīng)驗(yàn)回歸方程
【例2】 隨著網(wǎng)絡(luò)的普及,網(wǎng)上購(gòu)物的方式已經(jīng)受到越來越多年輕人的青睞,某家網(wǎng)絡(luò)店鋪商品的成交量x(單位:件)與店鋪的瀏覽量y(單位:次)之間的對(duì)應(yīng)數(shù)據(jù)如表所示:
x/件 2 4 5 6 8
y/次 30 40 50 60 70
(1)根據(jù)表中數(shù)據(jù)畫出散點(diǎn)圖;
(2)根據(jù)表中的數(shù)據(jù),求出y關(guān)于x的經(jīng)驗(yàn)回歸方程;
(3)當(dāng)這種商品的成交量突破100件(含100件)時(shí),預(yù)測(cè)這家店鋪的瀏覽量至少為多少.
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
 求經(jīng)驗(yàn)回歸方程的基本步驟
(1)畫出散點(diǎn)圖,從直觀上分析數(shù)據(jù)間是否存在線性相關(guān)關(guān)系;
(3)代入公式求出中參數(shù),的值;
(4)寫出經(jīng)驗(yàn)回歸方程并對(duì)實(shí)際問題作出估計(jì).
提醒:只有在散點(diǎn)圖大致呈線性時(shí),求出的經(jīng)驗(yàn)回歸方程才有實(shí)際意義.
[跟進(jìn)訓(xùn)練]
2.某地隨著經(jīng)濟(jì)的發(fā)展,居民收入逐年增長(zhǎng),該地一銀行連續(xù)五年年底的儲(chǔ)蓄存款情況如表所示.
年份x 2018 2019 2020 2021 2022
儲(chǔ)蓄存款額 y/千億元 5 6 7 8 10
為了計(jì)算方便,工作人員將上表的數(shù)據(jù)進(jìn)行了處理,令t=x-2 017,z=y(tǒng)-5,得到下表.
t 1 2 3 4 5
z 0 1 2 3 5
(1)作z關(guān)于t的散點(diǎn)圖,求z關(guān)于t的經(jīng)驗(yàn)回歸方程;
(2)通過(1)中的方程,求出y關(guān)于x的回歸方程.
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
類型3 利用經(jīng)驗(yàn)回歸方程進(jìn)行預(yù)測(cè)
【例3】 (源自湘教版教材)一個(gè)車間為了估計(jì)加工某種新型零件所花費(fèi)的時(shí)間,進(jìn)行了10次試驗(yàn),測(cè)得的數(shù)據(jù)如表所示:
零件個(gè)數(shù)x 10 20 30 40 50 60 70 80 90 100
加工時(shí)間y/min 62 68 75 81 89 95 102 108 115 122
(1)y與x之間是否具有相關(guān)關(guān)系?
(2)如果y與x之間具有相關(guān)關(guān)系,求經(jīng)驗(yàn)回歸方程(結(jié)果保留三位小數(shù)).
(3)據(jù)此估計(jì)加工110個(gè)零件所用的時(shí)間.
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
 (1)判斷兩個(gè)變量是否線性相關(guān):可以利用經(jīng)驗(yàn),也可以畫散點(diǎn)圖.
(2)求經(jīng)驗(yàn)回歸方程,注意運(yùn)算的正確性.
(3)根據(jù)經(jīng)驗(yàn)回歸方程進(jìn)行預(yù)測(cè)估計(jì):估計(jì)值不是實(shí)際值,兩者會(huì)有一定的誤差.
[跟進(jìn)訓(xùn)練]
3.某研究機(jī)構(gòu)對(duì)高三學(xué)生的記憶力x和判斷力y進(jìn)行統(tǒng)計(jì)分析,得如表數(shù)據(jù):
x 6 8 10 12
y 2 3 5 6
(1)請(qǐng)畫出上表數(shù)據(jù)的散點(diǎn)圖;
(2)請(qǐng)根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關(guān)于x的經(jīng)驗(yàn)回歸方程;
(3)試根據(jù)求出的經(jīng)驗(yàn)回歸方程,預(yù)測(cè)記憶力為9的同學(xué)的判斷力.
參考公式:=,=-.
                                    
                                    
                                    
                                    
                                    
1.某樣本點(diǎn)(xi,yi)(i=1,2,…,n)的經(jīng)驗(yàn)回歸方程為=0.5x+0.7,當(dāng)x=8時(shí),y的實(shí)際值為4.5,則當(dāng)x=8時(shí),預(yù)測(cè)值與實(shí)際值的差值為(  )
A.0.1  B.0.2  C.0.3  D.0.4
2.對(duì)具有線性相關(guān)關(guān)系的變量x,y,有一組觀測(cè)數(shù)據(jù)(xi,yi)(i=1,2,3,…,8),其經(jīng)驗(yàn)回歸方程為=x+,且x1+x2+x3+…+x8=6,y1+y2+y3+…+y8=9,則a的值為(  )
A.-2 B.2
C.-1 D.1
3.調(diào)查了某地若干戶家庭的年收入x(單位:萬(wàn)元)和年飲食支出y(單位:萬(wàn)元),調(diào)查顯示年收入x與年飲食支出y具有線性相關(guān)關(guān)系,并由調(diào)查數(shù)據(jù)得到y(tǒng)對(duì)x的經(jīng)驗(yàn)回歸方程:=0.254x+0.321.由經(jīng)驗(yàn)回歸方程可知,家庭年收入每增加1萬(wàn)元,年飲食支出平均增加________萬(wàn)元.
4.如圖是一組數(shù)據(jù)(x,y)的散點(diǎn)圖,經(jīng)最小二乘估計(jì)公式計(jì)算,y與x之間的經(jīng)驗(yàn)回歸方程為=x+1,則=________.
回顧本節(jié)知識(shí),自主完成以下問題:
1.經(jīng)驗(yàn)回歸直線一定過哪個(gè)點(diǎn)?
2.y與x正、負(fù)相關(guān)的充要條件各是什么?
3.b的實(shí)際意義是什么?
“回歸”一詞的由來
統(tǒng)計(jì)學(xué)中的“回歸”一詞,是統(tǒng)計(jì)學(xué)家高爾頓引入的.早在19世紀(jì)80年代,高爾頓就開始了親代與子代(即父母親與子女)之間相似特征(身高、性格等)的研究.他收集了一些親代的身高x與子代的身高y的成對(duì)數(shù)據(jù),并作出了散點(diǎn)圖,發(fā)現(xiàn)y與x的關(guān)系可以借助一次函數(shù)來近似表示,而且總體上親代的身高增加時(shí),子代的身高也增加.
但是,高爾頓在研究過程中,發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象.他收集的數(shù)據(jù)顯示,總體上親代的平均身高為68英寸(約為172.72 cm),子代的平均身高為69英寸,子代的平均身高比親代的平均身高大1英寸(約為2.54 cm).于是,一個(gè)自然的推想是:平均身高為63英寸的親代,其子代的平均身高應(yīng)約為64英寸;平均身高為72英寸的親代,其子代的平均身高應(yīng)約為73英寸.但實(shí)際數(shù)據(jù)顯示:平均身高為63英寸的親代,其子代的平均身高為67英寸,增加量為4英寸;平均身高為72英寸的親代,其子代的平均身高為71英寸,增加量為-1英寸.也就是說,平均身高不同的親代,其子代的平均身高增加量并不相等,但子代的平均身高有回歸于中心(即總體平均值)的趨勢(shì).
正是由于這種現(xiàn)象的存在,高爾頓引入了“回歸”一詞.雖然不是所有相關(guān)關(guān)系中都會(huì)發(fā)生類似的現(xiàn)象,但從那以后,“回歸”就成了相關(guān)關(guān)系討論中一個(gè)約定俗成的詞了.
第1課時(shí) 一元線性回歸模型及參數(shù)的最小二乘估計(jì)
[必備知識(shí)·情境導(dǎo)學(xué)探新知]
知識(shí)點(diǎn)1 因變量 響應(yīng)變量 自變量 解釋變量 截距 斜率 e
思考1 提示:不能.
知識(shí)點(diǎn)2 (1)經(jīng)驗(yàn)回歸直線
(2) 
思考2 提示:Y與X正相關(guān)的充要條件是>0,Y與X負(fù)相關(guān)的充要條件是<0.
課前自主體驗(yàn)
1.(1)√ (2)√ (3)× (4)×
2.①④ [x+與x之間的函數(shù)關(guān)系,而不是y與x之間的函數(shù)關(guān)系,但它反映的關(guān)系最接近y與x之間的真實(shí)關(guān)系,故①④正確.]
3.12.1 [∵=0.8x+0.1,∴=0.8×15+0.1=12.1(億元).]
[關(guān)鍵能力·合作探究釋疑難]
例1 C [對(duì)于A中,一元線性回歸模型Y=bx+a+e中,方程表示的不是確定性關(guān)系,因此不是一次函數(shù),所以A說法錯(cuò)誤;對(duì)于B中,響應(yīng)變量Y不是由解釋變量x唯一確定的,所以B錯(cuò)誤;對(duì)于C中,響應(yīng)變量Y除了受解釋變量x的影響外,可能還受到其他因素的影響,這些因素會(huì)導(dǎo)致隨機(jī)誤差e的產(chǎn)生,所以C正確;對(duì)于D中,隨機(jī)誤差是不能避免的,只能將誤差縮小,所以D錯(cuò)誤.故選C.]
跟進(jìn)訓(xùn)練
1.①②③④ [根據(jù)一元線性回歸模型的含義可知,以上說法均正確.]
例2 解:(1)散點(diǎn)圖如圖所示.
(2)根據(jù)散點(diǎn)圖可得,變量x與y之間具有線性相關(guān)關(guān)系.
代入公式得==50-7×5=15.
故所求的經(jīng)驗(yàn)回歸方程是=7x+15.
(3)根據(jù)上面求出的經(jīng)驗(yàn)回歸方程,
當(dāng)成交量突破100件(含100件),即x=≥100時(shí),≥715,所以預(yù)測(cè)這家店鋪的瀏覽量至少為715次.
跟進(jìn)訓(xùn)練
2.解:(1)作散點(diǎn)圖,直觀看z與t具有線性相關(guān)關(guān)系.
根據(jù)z關(guān)于t的表格數(shù)據(jù),得
(1+2+3+4+5)=3,
(0+1+2+3+5)=2.2,
∴==1.2,
==2.2-1.2×3=-1.4.
所以z關(guān)于t的經(jīng)驗(yàn)回歸方程為=1.2t-1.4.
(2)=1.2t-1.4,代入t=x-2017,z=y(tǒng)-5,
得-5=1.2(x-2017)-1.4,
即=1.2x-2416.8.
故y關(guān)于x的回歸方程為=1.2x-2416.8.
例3 解:(1)==55,
=91.7.
=≈0.9998,
因此y與x之間具有顯著的正相關(guān)關(guān)系.
(2)設(shè)所求的經(jīng)驗(yàn)回歸方程為x+,
則=≈0.668,
=91.7-0.668×55=54.96,
即所求的經(jīng)驗(yàn)回歸方程為=0.668x+54.96.
(3)當(dāng)x=110時(shí),y的估計(jì)值=0.668×110+54.96=128.44.
因此,估計(jì)加工110個(gè)零件所用的時(shí)間為128.44min.
跟進(jìn)訓(xùn)練
3.解:(1)散點(diǎn)圖如圖所示.
(2)=9,=4,
=0.7,
=4-0.7×9=-2.3,
故經(jīng)驗(yàn)回歸方程為=0.7x-2.3.
(3)由(2)中經(jīng)驗(yàn)回歸方程可知,
當(dāng)x=9時(shí),=0.7×9-2.3=4,
即預(yù)測(cè)記憶力為9的同學(xué)的判斷力為4.
[學(xué)習(xí)效果·課堂評(píng)估夯基礎(chǔ)]
1.B [當(dāng)x=8時(shí),y的預(yù)測(cè)值=4.7,4.7-4.5=0.2.故選B.]
2.D [,由于經(jīng)驗(yàn)回歸直線方程過樣本中心點(diǎn),將代入經(jīng)驗(yàn)回歸方程,解得=1.]
3.0.254 [由于=0.254x+0.321知,當(dāng)x增加1萬(wàn)元時(shí),年飲食支出y增加0.254萬(wàn)元.]
4.0.8 [由題圖知=2,=2.6,將(2,2.6)代入x+1中,解得=0.8.]
課堂小結(jié)
1.提示:經(jīng)驗(yàn)回歸直線一定過樣本中心點(diǎn)().
2.提示:y與x正相關(guān)的充要條件是>0,y與x負(fù)相關(guān)的充要條件是<0.
3.提示:當(dāng)x增大一個(gè)單位時(shí),個(gè)單位.8.1 成對(duì)數(shù)據(jù)的統(tǒng)計(jì)相關(guān)性
學(xué)習(xí)任務(wù) 1.了解變量間的相關(guān)關(guān)系.(數(shù)學(xué)抽象) 2.能根據(jù)散點(diǎn)圖,判斷兩個(gè)變量是否具有相關(guān)關(guān)系.(直觀想象) 3.了解相關(guān)系數(shù)的概念及公式,會(huì)判斷相關(guān)性的強(qiáng)弱.(數(shù)據(jù)分析、數(shù)學(xué)運(yùn)算)
在校園里,有這樣一種說法:“如果你的數(shù)學(xué)成績(jī)好,那么你的物理學(xué)習(xí)就不會(huì)有什么大問題.”按照這種說法,似乎學(xué)生的物理成績(jī)與數(shù)學(xué)成績(jī)之間存在著某種關(guān)系.我們把數(shù)學(xué)成績(jī)和物理成績(jī)看成是兩個(gè)變量,那么這兩個(gè)變量之間的關(guān)系是函數(shù)關(guān)系嗎?
知識(shí)點(diǎn)1 變量間的相關(guān)關(guān)系
相關(guān)關(guān)系的定義:兩個(gè)變量有關(guān)系,但又沒有確切到可由其中的一個(gè)去________決定另一個(gè)的程度,這種關(guān)系稱為相關(guān)關(guān)系.兩個(gè)變量之間的關(guān)系分為函數(shù)關(guān)系和相關(guān)關(guān)系.
1.相關(guān)關(guān)系與函數(shù)關(guān)系有什么異同點(diǎn)?
                                    
                                    
                                    
知識(shí)點(diǎn)2 散點(diǎn)圖、線性相關(guān)
(1)散點(diǎn)圖:為直觀地描述成對(duì)樣本數(shù)據(jù)中兩個(gè)變量間的關(guān)系,用橫軸表示其中的一個(gè)變量,縱軸表示另一個(gè)變量,則成對(duì)樣本數(shù)據(jù)都可以用直角坐標(biāo)系中的點(diǎn)表示出來,由這些點(diǎn)組成的統(tǒng)計(jì)圖叫做散點(diǎn)圖.
(2)散點(diǎn)圖的作用
如果散點(diǎn)圖中變量的對(duì)應(yīng)點(diǎn)分布在某條曲線的周圍,我們就可以得出結(jié)論:這兩個(gè)變量具有相關(guān)性,如圖(1)(2).如果變量的對(duì)應(yīng)點(diǎn)分布沒有規(guī)律,我們就可以得出結(jié)論:這兩個(gè)變量不具有相關(guān)性,如圖(3).
(3)正相關(guān)與負(fù)相關(guān)
從整體上看,當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值也呈現(xiàn)________的趨勢(shì),我們就稱這兩個(gè)變量正相關(guān);當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值呈現(xiàn)減小的趨勢(shì),則稱這兩個(gè)變量________.
(4)線性相關(guān)與曲線相關(guān)
一般地,如果兩個(gè)變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點(diǎn)落在________附近,我們就稱這兩個(gè)變量________相關(guān).
一般地,如果兩個(gè)變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個(gè)變量非線性相關(guān)或曲線相關(guān).
2.相關(guān)性可以如何分類?
                                    
                                    
                                    
知識(shí)點(diǎn)3 樣本相關(guān)系數(shù)
(1)正相關(guān)與負(fù)相關(guān)的特點(diǎn)
一般地,如果變量x和y正相關(guān),那么關(guān)于均值平移后的大多數(shù)散點(diǎn)將分布在________象限、________象限,對(duì)應(yīng)的成對(duì)數(shù)據(jù)同號(hào)的居多;如果變量x和y________,那么關(guān)于均值平移后的大多數(shù)散點(diǎn)將分布在第二象限、第四象限,對(duì)應(yīng)的成對(duì)數(shù)據(jù)異號(hào)的居多.
(2)樣本相關(guān)系數(shù)
,我們稱r為變量x和變量y的________.
①當(dāng)r>0時(shí),稱成對(duì)樣本數(shù)據(jù)________.這時(shí),當(dāng)其中一個(gè)數(shù)據(jù)的值變小時(shí),另一個(gè)數(shù)據(jù)的值通常也________;當(dāng)其中一個(gè)數(shù)據(jù)的值變大時(shí),另一個(gè)數(shù)據(jù)的值通常也________.
②當(dāng)r<0時(shí),稱成對(duì)樣本數(shù)據(jù)________.這時(shí),當(dāng)其中一個(gè)數(shù)據(jù)的值變小時(shí),另一個(gè)數(shù)據(jù)的值通常會(huì)________;當(dāng)其中一個(gè)數(shù)據(jù)的值變大時(shí),另一個(gè)數(shù)據(jù)的值通常會(huì)________.
(3)相關(guān)系數(shù)與相關(guān)程度
|r|的大小可以反映成對(duì)樣本數(shù)據(jù)之間線性相關(guān)的程度,|r|≤1.
當(dāng)r>0時(shí),稱成對(duì)樣本數(shù)據(jù)正相關(guān);當(dāng)r<0時(shí),稱成對(duì)樣本數(shù)據(jù)負(fù)相關(guān).
當(dāng)|r|越接近1時(shí),成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度________;
當(dāng)|r|越接近0時(shí),成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度________.
當(dāng)|r|=1時(shí),表明成對(duì)樣本數(shù)據(jù)都落在一條直線上;當(dāng)r=0時(shí),只表明成對(duì)樣本數(shù)據(jù)間沒有線性相關(guān)關(guān)系,但不排除它們之間有其他相關(guān)關(guān)系.
3.能否說“r越大,兩個(gè)變量間的相關(guān)程度越強(qiáng);r越小,兩個(gè)變量間的相關(guān)程度越弱”?
                                    
                                    
                                    
1.下列圖中的兩個(gè)變量是相關(guān)關(guān)系的是________.
2.若對(duì)甲、乙、丙3組不同的成對(duì)數(shù)據(jù)作線性相關(guān)性檢驗(yàn),得到這3組成對(duì)數(shù)據(jù)的樣本相關(guān)系數(shù)依次為0.83,0.72,-0.90,則線性相關(guān)程度最強(qiáng)的組是________(填“甲”“乙”或“丙”).
3.某公司欲知詩(shī)詞日歷費(fèi)用x(十萬(wàn)元)與詩(shī)詞日歷銷售量y(千本)之間的關(guān)系,從其所發(fā)行的詩(shī)詞日歷中隨機(jī)抽取了10張,得到如下的資料:
則y與x的相關(guān)系數(shù)r為________.
類型1 相關(guān)關(guān)系
【例1】 (1)(2023·蘭州高二檢測(cè))有下列關(guān)系:
①人的年齡與他(她)擁有的財(cái)富之間的關(guān)系;②曲線上的點(diǎn)與該點(diǎn)的坐標(biāo)之間的關(guān)系;③蘋果的產(chǎn)量與氣候之間的關(guān)系;④森林中的同一種樹木,其橫斷面直徑與高度之間的關(guān)系,其中有相關(guān)關(guān)系的是(  )
A.①②③  B.①②
C.②③ D.①③④
(2)(多選)某中學(xué)的興趣小組將在某座山測(cè)得海拔高度、氣壓和沸點(diǎn)的六組數(shù)據(jù)繪制成散點(diǎn)圖如圖所示,則下列說法正確的是(  )
A.沸點(diǎn)與海拔高度呈正相關(guān)
B.沸點(diǎn)與氣壓呈正相關(guān)
C.沸點(diǎn)與海拔高度呈負(fù)相關(guān)
D.氣壓與海拔高度呈負(fù)相關(guān)
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
 (1)根據(jù)直觀感覺判斷,這時(shí)要用到已有的知識(shí)或生活、學(xué)習(xí)中的經(jīng)驗(yàn)等.
(2)根據(jù)散點(diǎn)圖判斷,這時(shí)要由兩個(gè)變量相應(yīng)值的對(duì)應(yīng)關(guān)系,作出散點(diǎn)圖,通過觀察散點(diǎn)圖中各點(diǎn)是否分布在某條曲線的周圍,從而判斷變量之間是否具有相關(guān)關(guān)系.
[跟進(jìn)訓(xùn)練]
1.5位學(xué)生的數(shù)學(xué)成績(jī)和物理成績(jī)?nèi)缦卤恚?br/>學(xué)生 A B C D E
數(shù)學(xué) 80 75 70 65 60
物理 70 66 68 64 62
則數(shù)學(xué)成績(jī)與物理成績(jī)之間(  )
A.是函數(shù)關(guān)系
B.是相關(guān)關(guān)系,但相關(guān)性很弱
C.具有較好的相關(guān)關(guān)系,且是正相關(guān)
D.具有較好的相關(guān)關(guān)系,且是負(fù)相關(guān)
                                    
                                    
                                    
                                    
                                    
類型2 散點(diǎn)圖及其應(yīng)用
【例2】 下面是水稻產(chǎn)量與施化肥量的一組觀測(cè)數(shù)據(jù):
施化肥量 15 20 25 30 35 40 45
水稻產(chǎn)量 320 330 360 410 460 470 480
(1)將上述數(shù)據(jù)制成散點(diǎn)圖;
(2)你能從散點(diǎn)圖中發(fā)現(xiàn)施化肥量與水稻產(chǎn)量近似呈什么關(guān)系嗎?水稻產(chǎn)量會(huì)一直隨施化肥量的增加而增加嗎?
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
 (1)畫散點(diǎn)圖時(shí)應(yīng)注意合理選擇單位長(zhǎng)度,避免圖形過大或偏小,或者是點(diǎn)的坐標(biāo)在坐標(biāo)系中畫不準(zhǔn),使圖形失真,導(dǎo)致得出錯(cuò)誤結(jié)論.
(2)在這里利用散點(diǎn)圖直觀感知事物的形態(tài)與變化,理解事物間的關(guān)聯(lián)及變化規(guī)律,是數(shù)學(xué)核心素養(yǎng)直觀想象的具體體現(xiàn).
[跟進(jìn)訓(xùn)練]
2.某種樹木體積與樹木的樹齡之間有如下的對(duì)應(yīng)關(guān)系:
樹齡 2 3 4 5 6 7 8
體積 30 34 40 60 55 62 70
(1)請(qǐng)作出這些數(shù)據(jù)的散點(diǎn)圖;
(2)你能由散點(diǎn)圖發(fā)現(xiàn)樹木體積與樹木的樹齡近似呈什么關(guān)系嗎?
                                    
                                    
                                    
                                    
                                    
類型3 樣本相關(guān)系數(shù)及其應(yīng)用
 判斷線性相關(guān)的強(qiáng)弱
【例3】 某廠的生產(chǎn)原料耗費(fèi)x(單位:百萬(wàn)元)與銷售額y(單位:百萬(wàn)元)之間有如下的對(duì)應(yīng)關(guān)系:
x 2 4 6 8
y 30 40 50 70
(1)畫出(x,y)的散點(diǎn)圖;
(2)計(jì)算x與y之間的樣本相關(guān)系數(shù),并刻畫它們的相關(guān)程度.
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
 線性相關(guān)強(qiáng)弱的判斷方法
(1)散點(diǎn)圖:散點(diǎn)圖只是粗略作出判斷,其圖象越接近直線,相關(guān)性越強(qiáng).
(2)樣本相關(guān)系數(shù):樣本相關(guān)系數(shù)能夠較準(zhǔn)確地判斷相關(guān)的程度,其絕對(duì)值越大,相關(guān)性越強(qiáng).
[跟進(jìn)訓(xùn)練]
3.現(xiàn)隨機(jī)抽取某中學(xué)高一10名在校學(xué)生,他們?nèi)雽W(xué)時(shí)的數(shù)學(xué)成績(jī)x與入學(xué)后第一次考試的數(shù)學(xué)成績(jī)y如表所示.
學(xué)生號(hào) 1 2 3 4 5 6 7 8 9 10
x 120 108 117 104 103 110 104 105 99 108
y 84 64 84 68 69 68 69 46 57 71
請(qǐng)問:這10名學(xué)生的兩次數(shù)學(xué)成績(jī)是否具有較強(qiáng)的線性相關(guān)關(guān)系?
附:若|r|>0.75,則我們可以認(rèn)為y與x之間具有較強(qiáng)的線性相關(guān)關(guān)系.
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
 樣本相關(guān)系數(shù)的應(yīng)用
【例4】 以下是收集到的新房屋的銷售價(jià)格y(單位:萬(wàn)元)和房屋的大小x(單位:m2)的數(shù)據(jù).
房屋大小x/m2 115 110 80 135 105
銷售價(jià)格y/萬(wàn)元 24.8 21.6 18.4 29.2 22
(1)畫出數(shù)據(jù)的散點(diǎn)圖;
(2)求樣本相關(guān)系數(shù)r,并作出評(píng)價(jià).(精確到0.01,已知
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
 (1)當(dāng)相關(guān)系數(shù)|r|越接近1時(shí),兩個(gè)變量的相關(guān)關(guān)系越強(qiáng),當(dāng)相關(guān)系數(shù)|r|越接近0時(shí),兩個(gè)變量的相關(guān)關(guān)系越弱.
(2)樣本相關(guān)系數(shù)r有時(shí)也稱樣本線性相關(guān)系數(shù),|r|刻畫了樣本點(diǎn)集中于某條直線的程度.當(dāng)r=0時(shí),只表明成對(duì)數(shù)據(jù)間沒有線性相關(guān)關(guān)系,但不排除它們之間有其他相關(guān)關(guān)系.
[跟進(jìn)訓(xùn)練]
4.我國(guó)北方廣大農(nóng)村地區(qū)、一些城鎮(zhèn)以及部分大中型城市的周邊區(qū)域,還在大量采用分散燃煤和散燒煤取暖,既影響了居民基本生活的改善,也加重了北方地區(qū)冬季的霧霾天氣.推進(jìn)北方地區(qū)冬季清潔取暖,是重大民生工程、民心工程,關(guān)系北方地區(qū)廣大群眾溫暖過冬,關(guān)系霧霾天能不能減少,是能源生產(chǎn)和消費(fèi)革命、農(nóng)村生活方式革命的重要內(nèi)容.國(guó)家發(fā)改委制定了煤改氣、煤改電價(jià)格扶持新政策,從而使得煤改氣、煤改電用戶大幅度增加,下面條形圖反映了某省連續(xù)7個(gè)月的煤改氣、煤改電的用戶數(shù)量.
在給定坐標(biāo)系中作出煤改氣、煤改電用戶數(shù)量y隨月份t變化的散點(diǎn)圖,并用散點(diǎn)圖和樣本相關(guān)系數(shù)說明y與t之間具有線性相關(guān)性.
參考公式:樣本相關(guān)系數(shù)
                                    
                                    
                                    
                                    
                                    
1.下列選項(xiàng)中,兩變量間具有相關(guān)關(guān)系的是(  )
A.正方體的體積與棱長(zhǎng)
B.勻速行駛的汽車的行駛距離與時(shí)間
C.人的身高與視力
D.某人每日吸煙量與其身體健康情況
2.如圖所示的散點(diǎn)圖分別反映的變量間的相關(guān)關(guān)系是(  )
A.正相關(guān),負(fù)相關(guān),不相關(guān)
B.負(fù)相關(guān),不相關(guān),正相關(guān)
C.負(fù)相關(guān),正相關(guān),不相關(guān)
D.正相關(guān),不相關(guān),負(fù)相關(guān)
3.兩個(gè)變量x,y的樣本相關(guān)系數(shù)r1=0.785 9,兩個(gè)變量u,v的樣本相關(guān)系數(shù)r2=-0.956 8,則下列判斷正確的是(  )
A.變量x與y正相關(guān),變量u與v負(fù)相關(guān),變量x與y的線性相關(guān)性較強(qiáng)
B.變量x與y負(fù)相關(guān),變量u與v正相關(guān),變量x與y的線性相關(guān)性較強(qiáng)
C.變量x與y正相關(guān),變量u與v負(fù)相關(guān),變量u與v的線性相關(guān)性較強(qiáng)
D.變量x與y負(fù)相關(guān),變量u與v正相關(guān),變量u與v的線性相關(guān)性較強(qiáng)
r約為________.(精確到0.001)
回顧本節(jié)知識(shí),自主完成以下問題:
1.怎樣畫散點(diǎn)圖?
2.怎樣判斷兩個(gè)變量具有相關(guān)關(guān)系?
3.樣本相關(guān)系數(shù)r的大小與兩個(gè)變量的相關(guān)程度有何關(guān)系?
相關(guān)系數(shù)與向量夾角的余弦
當(dāng)n=2時(shí),相關(guān)系數(shù)的計(jì)算公式可改寫為
r=.
此時(shí),如果令a=(x1-,x2-),b=(y1-,y2-),則相關(guān)系數(shù)r等于向量a與b的夾角的余弦,即
r=cos 〈a,b〉=.
類似地,當(dāng)n=3時(shí),相關(guān)系數(shù)r仍等于兩個(gè)向量夾角的余弦,只不過此時(shí)兩個(gè)向量分別為
a=(x1-,x2-,x3-),b=(y1-,y2-,y3-).
一般地,a=(x1-,x2-,…,xn-),b=(y1-,y2-,…,yn-)都稱為n維向量,如果按照類似2維與3維的情況定義向量的內(nèi)積和模,則相關(guān)系數(shù)r總是等于兩個(gè)向量夾角的余弦.
8.1 成對(duì)數(shù)據(jù)的統(tǒng)計(jì)相關(guān)性
[必備知識(shí)·情境導(dǎo)學(xué)探新知]
知識(shí)點(diǎn)1 精確地
思考1 提示:相同點(diǎn):兩者均是指兩個(gè)變量間的關(guān)系.
不同點(diǎn):①函數(shù)關(guān)系是一種確定的關(guān)系,如圓的面積S與半徑r的關(guān)系,它可以用函數(shù)關(guān)系式S=πr2來表示;相關(guān)關(guān)系是一種非確定的關(guān)系,如人的體重y與身高x有關(guān),一般來說,身高越高,體重越重,但不能用一個(gè)函數(shù)關(guān)系式來嚴(yán)格地表示它們之間的關(guān)系.函數(shù)關(guān)系是兩個(gè)非隨機(jī)變量的關(guān)系,而相關(guān)關(guān)系是非隨機(jī)變量與隨機(jī)變量之間的關(guān)系.②函數(shù)關(guān)系是一種因果關(guān)系,而相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系.
知識(shí)點(diǎn)2 (3)增加 負(fù)相關(guān) (4)一條直線 線性
思考2 提示:(1)按變量間的增減性分為正相關(guān)和負(fù)相關(guān).
(2)按變量間是否有線性特征分為線性相關(guān)和非線性相關(guān)(曲線相關(guān)).
知識(shí)點(diǎn)3 (1)第一 第三 負(fù)相關(guān) (2)樣本相關(guān)系數(shù) 正相關(guān) 變小 變大 負(fù)相關(guān) 變大 變小 (3)越強(qiáng) 越弱
思考3 提示:不能.|r|越大,兩個(gè)變量間的相關(guān)程度越強(qiáng);|r|越小,兩個(gè)變量間的相關(guān)程度越弱.
課前自主體驗(yàn)
1.②③ [散點(diǎn)圖①中,所有的散點(diǎn)都在曲線上,所以①具有函數(shù)關(guān)系;散點(diǎn)圖②中,所有的散點(diǎn)都分布在一條直線的附近,所以②具有相關(guān)關(guān)系;散點(diǎn)圖③中,所有的散點(diǎn)都分布在一條曲線的附近,所以③具有相關(guān)關(guān)系;散點(diǎn)圖④中,所有的散點(diǎn)雜亂無(wú)章,沒有分布在一條曲線的附近,所以④沒有相關(guān)關(guān)系.]
2.丙 [樣本相關(guān)系數(shù)|r|越接近1,成對(duì)數(shù)據(jù)的線性相關(guān)程度就越強(qiáng),結(jié)合題中所給的3組成對(duì)數(shù)據(jù)的樣本相關(guān)系數(shù)知,-0.90的絕對(duì)值最接近1,所以丙組成對(duì)數(shù)據(jù)的線性相關(guān)程度最強(qiáng).]
3.0.3 [由題中數(shù)據(jù)可知
r==0.3.]
[關(guān)鍵能力·合作探究釋疑難]
例1 (1)D (2)BCD [(1)因?yàn)橄嚓P(guān)關(guān)系是一種不確定的關(guān)系,是非隨機(jī)變量與隨機(jī)變量之間的關(guān)系,②是一種函數(shù)關(guān)系,所以具有相關(guān)關(guān)系的有①③④.
(2)由圖1知?dú)鈮弘S海拔高度的增加而減小,由圖2知沸點(diǎn)隨氣壓的升高而升高,所以氣壓與海拔高度呈負(fù)相關(guān),D正確;沸點(diǎn)與氣壓呈正相關(guān),B正確;沸點(diǎn)與海拔高度呈負(fù)相關(guān),A錯(cuò)誤,C正確.]
跟進(jìn)訓(xùn)練
1.C [數(shù)學(xué)成績(jī)x和物理成績(jī)y的散點(diǎn)圖如圖所示.
從圖上可以看出數(shù)學(xué)成績(jī)和物理成績(jī)具有較好的相關(guān)關(guān)系,且成正相關(guān).]
例2 解:(1)散點(diǎn)圖如圖.
(2)從圖中可以發(fā)現(xiàn),當(dāng)施化肥量由小到大變化時(shí),水稻產(chǎn)量也由小變大,圖中的散點(diǎn)大致分布在一條直線的附近,因此施化肥量和水稻產(chǎn)量近似呈線性相關(guān)關(guān)系,但水稻產(chǎn)量只是在一定范圍內(nèi)隨著化肥施用量的增加而增加,不會(huì)一直隨施化肥量的增加而增加.
跟進(jìn)訓(xùn)練
2.解:(1)以x軸表示樹木的樹齡,y軸表示樹木的體積,可得相應(yīng)的散點(diǎn)圖如圖所示.
(2)由散點(diǎn)圖發(fā)現(xiàn)樹木體積隨著樹齡的增加呈現(xiàn)增加的趨勢(shì),且散點(diǎn)大致落在一條直線附近,所以樹木的體積與樹齡近似呈線性相關(guān)關(guān)系.
例3 解:(1)畫出(x,y)的散點(diǎn)圖如圖所示,
(2)=5,=47.5,
故樣本相關(guān)系數(shù)
=≈0.9827.
由樣本相關(guān)系數(shù)r≈0.9827,可以推斷出生產(chǎn)原料耗費(fèi)與銷售額這兩個(gè)變量正線性相關(guān),且相關(guān)程度很強(qiáng).
跟進(jìn)訓(xùn)練
3.解:由題意知,×(120+108+117+104+103+110+104+105+99+108)=107.8,
×(84+64+84+68+69+68+69+46+57+71)=68,
所以樣本相關(guān)系數(shù)
r=≈0.7506.
|r|>0.75,故我們可以認(rèn)為y與x之間具有較強(qiáng)的線性相關(guān)關(guān)系.
即這10名學(xué)生的兩次數(shù)學(xué)成績(jī)具有較強(qiáng)的線性相關(guān)關(guān)系.
例4 解:(1)畫出散點(diǎn)圖如圖所示.
(2)=109,=23.2,
==≈0.96,
由此可知,新房屋的銷售價(jià)格和房屋的大小這兩個(gè)變量正線性相關(guān),且相關(guān)程度很強(qiáng).
跟進(jìn)訓(xùn)練
4.解:作出散點(diǎn)圖如圖所示,
由散點(diǎn)圖可得y與t有較強(qiáng)的線性相關(guān)性.
由條形圖數(shù)據(jù)和參考數(shù)據(jù)得,
=39.75-4×9.24=2.79,
∴r≈≈0.99.
∵y與t的樣本相關(guān)系數(shù)近似為0.99,
∴y與t的線性相關(guān)性相當(dāng)高.
[學(xué)習(xí)效果·課堂評(píng)估夯基礎(chǔ)]
1.D [對(duì)于A,正方體的體積與棱長(zhǎng)是函數(shù)關(guān)系,不滿足題意;
對(duì)于B,勻速行駛的汽車的行駛距離與時(shí)間是函數(shù)關(guān)系,不滿足題意;
對(duì)于C,人的身高與視力沒有明顯的關(guān)系,不滿足題意;
對(duì)于D,某人每日吸煙量與其身體健康情況有相關(guān)關(guān)系,滿足題意.]
2.D [對(duì)于圖(1),圖中的點(diǎn)成帶狀分布,且從左下角到右上角上升,兩個(gè)變量正相關(guān);對(duì)于圖(2),圖中的點(diǎn)雜亂無(wú)章,沒有明顯的規(guī)律,兩個(gè)變量不相關(guān);對(duì)于圖(3),圖中的點(diǎn)成帶狀分布,且從左上角到右下角下降,兩個(gè)變量負(fù)相關(guān).故選D.]
3.C [由樣本相關(guān)系數(shù)r1=0.7859>0知x與y正相關(guān),
由樣本相關(guān)系數(shù)r2=-0.9568<0知u,v負(fù)相關(guān).
又|r1|<|r2|,
∴變量u與v的線性相關(guān)性比x與y的線性相關(guān)性強(qiáng).]
4.0.849 [
故r=≈0.849.]
課堂小結(jié)
1.提示:(1)建立平面直角坐標(biāo)系,兩軸的單位長(zhǎng)度可以不一致;
(2)將n個(gè)樣本點(diǎn)(xi,yi)(i=1,2,3,…,n)描在平面直角坐標(biāo)系中.
2.提示:(1)根據(jù)直觀感覺或生活經(jīng)驗(yàn)等判斷;
(2)根據(jù)成對(duì)數(shù)據(jù)的變化趨勢(shì)判斷;
(3)根據(jù)散點(diǎn)圖判斷:若散點(diǎn)圖中各點(diǎn)分布在一條直線或曲線附近,則變量具有相關(guān)關(guān)系.
3.提示:|r|越接近1,兩個(gè)變量間線性相關(guān)程度越大;|r|越接近0,兩個(gè)變量間線性相關(guān)程度越小.第2課時(shí) 回歸分析及非線性回歸模型
學(xué)習(xí)任務(wù) 1.了解殘差、殘差圖的概念.(數(shù)學(xué)抽象) 2.會(huì)通過分析殘差和利用R2判斷回歸模型的擬合效果.(數(shù)學(xué)運(yùn)算、數(shù)據(jù)分析) 3.了解非線性回歸模型,掌握對(duì)數(shù)函數(shù)模型、指數(shù)函數(shù)模型和冪函數(shù)模型的求解過程.(數(shù)學(xué)運(yùn)算、數(shù)學(xué)建模)
設(shè)某幼苗從觀察之日起,第x天的高度為y cm,測(cè)得的一些數(shù)據(jù)如表所示:
第x天 1 4 9 16 25 36 49
高度y/cm 0 4 7 9 11 12 13
作出這組數(shù)的散點(diǎn)圖近似描述y與x的關(guān)系,很顯然,這些散點(diǎn)不在一條直線附近.
你能求出這個(gè)函數(shù)模型嗎?
知識(shí)點(diǎn)1 殘差及殘差圖
(1)對(duì)于響應(yīng)變量Y,通過觀測(cè)得到的數(shù)據(jù)稱為________.通過經(jīng)驗(yàn)回歸方程得到的稱為________,觀測(cè)值減去預(yù)測(cè)值稱為________.殘差是隨機(jī)誤差的估計(jì)結(jié)果.通過對(duì)殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等.
(2)作圖時(shí)縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號(hào),或解釋變量的觀測(cè)值等,這樣作出的圖形稱為________.在殘差圖中,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,這樣的帶狀區(qū)域的寬度________,說明模型擬合精度越高.
(3)殘差分析:________是隨機(jī)誤差的估計(jì)結(jié)果,通過對(duì)殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為________.
知識(shí)點(diǎn)2 對(duì)模型刻畫數(shù)據(jù)效果的分析
(1)殘差圖法:在殘差圖中,如果殘差比較均勻地集中在以________,則說明經(jīng)驗(yàn)回歸方程較好地刻畫了兩個(gè)變量的關(guān)系.
(3)決定系數(shù)R2法:可以用R2=來比較兩個(gè)模型的擬合效果,R2越________,模型擬合效果越差,R2越________,模型擬合效果越好.
決定系數(shù)R2的取值范圍是什么?
                                    
                                    
知識(shí)點(diǎn)3 非線性回歸方程
(1)非線性回歸分析的思想
研究?jī)蓚€(gè)變量的關(guān)系時(shí),依據(jù)樣本點(diǎn)畫出散點(diǎn)圖,從整體上看,如果樣本點(diǎn)沒有分布在某個(gè)帶狀區(qū)域內(nèi),就稱這兩個(gè)變量之間不具有線性相關(guān)關(guān)系,此時(shí)不能直接利用經(jīng)驗(yàn)回歸方程來建立兩個(gè)變量之間的關(guān)系.
(2)非線性經(jīng)驗(yàn)回歸方程
當(dāng)回歸方程不是形如=x+(,∈R)時(shí),稱之為非線性經(jīng)驗(yàn)回歸方程.當(dāng)兩個(gè)變量不呈線性相關(guān)關(guān)系時(shí),依據(jù)樣本點(diǎn)的分布選擇合適的曲線方程來擬合數(shù)據(jù),可通過變量代換,利用線性回歸模型建立兩個(gè)變量間的非線性經(jīng)驗(yàn)回歸方程.
1.思考辨析(正確的畫“√”,錯(cuò)誤的畫“×”)
(1)殘差平方和越接近0,線性回歸模型的擬合效果越好. (  )
(2)在畫兩個(gè)變量的散點(diǎn)圖時(shí),響應(yīng)變量在x軸上,解釋變量在y軸上. (  )
(3)R2越小,線性回歸模型的擬合效果越好. (  )
(4)在殘差圖中,縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號(hào). (  )
2.在兩個(gè)變量y與x的回歸模型中,分別選擇了4個(gè)不同的模型,它們的決定系數(shù)R2如下,其中擬合效果最好的模型是(  )
A.模型1的決定系數(shù)R2為0.98
B.模型2的決定系數(shù)R2為0.80
C.模型3的決定系數(shù)R2為0.50
D.模型4的決定系數(shù)R2為0.25
3.從某省“雙一流”大學(xué)中隨機(jī)選出8名女大學(xué)生,得到其身高x(單位:cm)與體重y(單位:kg)的數(shù)據(jù)如下表:
x 165 165 157 170 175 165 155 170
y 48 57 50 54 64 61 43 59
若已知y與x的經(jīng)驗(yàn)回歸方程為=0.85x-85.71,則選取的女大學(xué)生身高為175 cm時(shí),相應(yīng)的殘差為________kg.
類型1 殘差與殘差分析
【例1】 (1)對(duì)變量x,y進(jìn)行回歸分析時(shí),依據(jù)得到的4個(gè)不同的回歸模型畫出殘差圖,則下列模型擬合精度最高的是(  )
A        B
C        D
(2)已知一系列樣本點(diǎn)(xi,yi)(i=1,2,3,…,n)的經(jīng)驗(yàn)回歸方程為=2x+,若樣本點(diǎn)(r,1)與(1,s)的殘差相同,則有(  )
A.r=s        B.s=2r
C.s=-2r+3 D.s=2r+1
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
 (1)殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適.這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精度越高,經(jīng)驗(yàn)回歸方程的預(yù)報(bào)精度越高.
(2)殘差是隨機(jī)誤差的估計(jì)值,i=y(tǒng)i-i.
[跟進(jìn)訓(xùn)練]
1.兩個(gè)線性相關(guān)變量x與y的統(tǒng)計(jì)數(shù)據(jù)如表所示:
x 9 9.5 10 10.5 11
y 11 10 8 6 5
其經(jīng)驗(yàn)回歸方程是=x+40,則相對(duì)應(yīng)于點(diǎn)(11,5)的殘差為(  )
A.0.1  B.0.2  C.0.3  D.0.4
                                    
                                    
                                    
                                    
                                    
2.已知某成對(duì)樣本數(shù)據(jù)的殘差圖如圖,則樣本點(diǎn)數(shù)據(jù)中可能不準(zhǔn)確的是從左到右第________個(gè).
                                    
                                    
                                    
                                    
類型2 殘差平方和與決定系數(shù)R2
【例2】 已知某種商品的價(jià)格x(單位:元)與需求量y(單位:件)之間的關(guān)系有如下一組數(shù)據(jù):
x 14 16 18 20 22
y 12 10 7 5 3
(1)求y關(guān)于x的經(jīng)驗(yàn)回歸方程;
(2)借助殘差平方和與R2說明回歸模型擬合效果的好壞.
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
 刻畫回歸效果的三種方法
(1)殘差圖法:殘差點(diǎn)比較均勻地落在水平帶狀區(qū)域內(nèi)說明選用的模型比較合適.
(3)決定系數(shù)R2法:R2=1-越接近1,表明模型的擬合效果越好.
[跟進(jìn)訓(xùn)練]
3.為研究質(zhì)量x(單位:g)對(duì)彈簧長(zhǎng)度y(單位:cm)的影響,對(duì)不同質(zhì)量的6個(gè)物體進(jìn)行測(cè)量,數(shù)據(jù)如表所示:
x 5 10 15 20 25 30
y 7.25 8.12 8.95 9.90 10.9 11.8
(1)作出散點(diǎn)圖并求經(jīng)驗(yàn)回歸方程;
(2)求出R2并說明回歸模型擬合的程度;
(3)進(jìn)行殘差分析.
                                    
                                    
                                    
                                    
                                    
類型3 非線性回歸分析
【例3】 為了研究某種細(xì)菌隨時(shí)間x變化,繁殖的個(gè)數(shù)y的變化,收集數(shù)據(jù)如表所示:
天數(shù)x/天 1 2 3 4 5 6
繁殖個(gè)數(shù)y/個(gè) 6 12 25 49 95 190
(1)用天數(shù)作解釋變量,繁殖個(gè)數(shù)作響應(yīng)變量,作出這些數(shù)據(jù)的散點(diǎn)圖,根據(jù)散點(diǎn)圖判斷:=+x與y=c1哪一個(gè)作為繁殖的個(gè)數(shù)y關(guān)于時(shí)間x變化的回歸方程類型為最佳?(給出判斷即可,不必說明理由)
3.5 62.83 3.53 17.5 596.505 12.04
(2)根據(jù)(1)的判斷最佳結(jié)果及表中的數(shù)據(jù),建立y關(guān)于x的回歸方程.
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
[母題探究]
(變?cè)O(shè)問)在本例條件不變的情況下,試估計(jì)第7天細(xì)菌繁殖個(gè)數(shù).
                                    
                                    
                                    
                                    
 解決非線性回歸問題的方法及步驟
(1)確定變量:確定解釋變量為x,響應(yīng)變量為y.
(2)畫散點(diǎn)圖:通過觀察散點(diǎn)圖并與學(xué)過的函數(shù)(冪、指數(shù)、對(duì)數(shù)函數(shù)、二次函數(shù))作比較,選取擬合效果好的函數(shù)模型.
(3)變量置換:通過變量置換把非線性回歸問題轉(zhuǎn)化為線性回歸問題.
(4)分析擬合效果:通過計(jì)算決定系數(shù)等來判斷擬合效果.
(5)寫出非線性回歸方程.
提醒:當(dāng)數(shù)據(jù)量較大時(shí),可采用計(jì)算器或者數(shù)學(xué)軟件來求回歸方程.
[跟進(jìn)訓(xùn)練]
4.(源自湘教版教材)實(shí)驗(yàn)中獲得了某化學(xué)品的化學(xué)反應(yīng)時(shí)間和轉(zhuǎn)化率的數(shù)據(jù)如表,試建立轉(zhuǎn)化率y關(guān)于反應(yīng)時(shí)間x的回歸方程(結(jié)果保留三位小數(shù)).
時(shí)間x/min 60 80 100 120 140 150 160 170
轉(zhuǎn)化率y/% 6.13 9.99 15.02 20.92 31.11 38.85 47.25 55.05
                                    
                                    
                                    
                                    
                                    
1.下面四個(gè)殘差圖中,可以滿足一元線性回歸模型中對(duì)隨機(jī)誤差的假定的是(  )
A        B
C        D
2.下列說法錯(cuò)誤的是(  )
A.殘差點(diǎn)分布的帶狀區(qū)域越窄,回歸方程的擬合效果越好
B.殘差平方和越小,決定系數(shù)R2越大
C.決定系數(shù)R2可以大于1
D.通過經(jīng)驗(yàn)回歸方程得到的預(yù)報(bào)值是響應(yīng)變量的可能取值的平均值,不一定是響應(yīng)變量的精確值
3.甲、乙、丙、丁四位同學(xué)各自對(duì)A,B兩變量的線性相關(guān)性作試驗(yàn),并用回歸分析的方法分別求得相關(guān)系數(shù)r與殘差平方和m如表:
甲 乙 丙 丁
r 0.82 0.78 0.69 0.85
m 106 115 124 103
則________同學(xué)的試驗(yàn)結(jié)果體現(xiàn)了A,B兩變量更強(qiáng)的線性相關(guān)性.
4.在研究?jī)蓚€(gè)變量的相關(guān)關(guān)系時(shí),觀察散點(diǎn)圖發(fā)現(xiàn)樣本點(diǎn)集中于某一條曲線y=ebx+a的周圍,令z=ln y,求得經(jīng)驗(yàn)回歸方程為=0.25x-2.58,則該模型的經(jīng)驗(yàn)回歸方程為________.
回顧本節(jié)知識(shí),自主完成以下問題:
1.對(duì)模型刻畫數(shù)據(jù)效果的分析有哪些常見方法?
2.決定系數(shù)R2與相關(guān)系數(shù)r一樣嗎?
第2課時(shí) 回歸分析及非線性回歸模型
[必備知識(shí)·情境導(dǎo)學(xué)探新知]
知識(shí)點(diǎn)1 (1)觀測(cè)值 預(yù)測(cè)值 殘差 (2)殘差圖 越窄 (3)殘差 殘差分析
知識(shí)點(diǎn)2 (1)橫軸為對(duì)稱軸的水平帶狀區(qū)域內(nèi) (3)小 大
思考 提示:0≤R2≤1.
課前自主體驗(yàn)
1.(1)√ (2)× (3)× (4)√
2.A [R2越大擬合效果越好.]
3.0.96 [當(dāng)x=175cm時(shí),=0.85×175-85.71=63.04(kg),
∴相應(yīng)的殘差=64-63.04=0.96(kg).]
[關(guān)鍵能力·合作探究釋疑難]
例1 (1)A (2)C [(1)用殘差圖判斷模型的擬合效果,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說明這樣的模型比較合適,帶狀區(qū)域的寬度越窄,說明模型的擬合精度越高.
(2)樣本點(diǎn)(r,1)的殘差為1-2r-,
樣本點(diǎn)(1,s)的殘差為s--2.
依題意得1-2r-=s--2,
故s=-2r+3.]
跟進(jìn)訓(xùn)練
1.B [由于x+40過樣本中心點(diǎn)(10,8),
所以8=10+40,則=-3.2,
因此=-3.2x+40.
當(dāng)x=11時(shí),=-3.2×11+40=4.8,
所以殘差=5-=5-4.8=0.2.]
2.6 [原始數(shù)據(jù)中的可疑數(shù)據(jù)往往是殘差絕對(duì)值過大的那個(gè)數(shù)據(jù),即偏離平衡位置過大.]
例2 解:(1)×(14+16+18+20+22)=18,×(12+10+7+5+3)=7.4,
所以===-1.15,
=7.4+1.15×18=28.1,
所以所求經(jīng)驗(yàn)回歸方程是=-1.15x+28.1.
(2)列出殘差表為
yi- 0 0.3 -0.4 -0.1 0.2
yi- 4.6 2.6 -0.4 -2.4 -4.4
所以回歸模型的擬合效果很好.
跟進(jìn)訓(xùn)練
3.解:(1)散點(diǎn)圖如圖所示.
樣本點(diǎn)分布在一條直線附近,y與x具有線性相關(guān)關(guān)系.
由表中數(shù)據(jù),得×(5+10+15+20+25+30)=17.5,
=×(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487
計(jì)算得≈0.183,≈6.285.
故所求經(jīng)驗(yàn)回歸方程為=6.285+0.183x.
(2)列表如下:
yi- 0.05 0.005 -0.08 -0.045 0.04 0.025
yi- -2.237 -1.367 -0.537 0.413 1.413 2.313
所以R2=1-≈0.9991,
回歸模型的擬合效果較好.
(3)由殘差表中的數(shù)值可以看出第3個(gè)樣本點(diǎn)的殘差比較大,需要確認(rèn)在采集這個(gè)數(shù)據(jù)的時(shí)候是否有人為的錯(cuò)誤,如果有的話,需要糾正數(shù)據(jù),重新建立回歸模型;由表中數(shù)據(jù)可以看出殘差點(diǎn)比較均勻地落在寬度不超過0.15的狹窄的水平帶狀區(qū)域中,說明選用的線性回歸模型的精度較高,由以上分析可知,彈簧長(zhǎng)度與所掛物體的質(zhì)量成線性關(guān)系.
例3 解:(1)作出散點(diǎn)圖,如圖1所示.
由散點(diǎn)圖看出樣本點(diǎn)分布在一條指數(shù)函數(shù)y=c1的周圍,于是選擇y=c1.
(2)令z=lny,則x+.
x 1 2 3 4 5 6
z 1.79 2.48 3.22 3.89 4.55 5.25
相應(yīng)的散點(diǎn)圖如圖2.
從圖2可以看出,變換后的樣本點(diǎn)分布在一條直線附近,因此可以用經(jīng)驗(yàn)回歸方程來擬合.
=1.115,得=0.69x+1.115,
則有=e0.69x+1.115.
母題探究
解:∵=e0.69x+1.115,
∴當(dāng)x=7時(shí),≈382(個(gè)),
即第7天細(xì)菌繁殖個(gè)數(shù)約為382個(gè).
跟進(jìn)訓(xùn)練
4.解:根據(jù)收集的數(shù)據(jù)作散點(diǎn)圖(圖1).
觀察散點(diǎn)圖可知,樣本點(diǎn)并沒有分布在某條直線附近,因而變量y與x之間沒有明顯的線性相關(guān)關(guān)系,所以不能直接利用線性回歸模型來刻畫這兩個(gè)變量之間的關(guān)系.根據(jù)已有的數(shù)學(xué)知識(shí),可以認(rèn)為樣本點(diǎn)分布在指數(shù)曲線y=c1的附近,其中c1和c2是待定參數(shù).
為估計(jì)參數(shù)c1和c2,在y=c1的兩端取對(duì)數(shù),得到lny=lnc1+c2x.
再令z=lny,a=lnc1,b=c2,則得到直線方程
z=bx+a.
將題表中的數(shù)據(jù)進(jìn)行代換,得到的數(shù)據(jù)見下表.
x 60 80 100 120 140 150 160 170
z (=lny) 1.813 2.302 2.709 3.041 3.438 3.660 3.855 4.008
圖2是根據(jù)上表中數(shù)據(jù)作出的散點(diǎn)圖.
從圖2中可以看出,變換后的樣本點(diǎn)分布在一條直線的附近,說明z和x之間具有線性相關(guān)關(guān)系,因此可以用線性回歸方程來擬合.對(duì)上表中的數(shù)據(jù),用最小二乘法可得線性回歸方程為=0.019x+0.686.
再利用y=ez可得到轉(zhuǎn)化率y關(guān)于反應(yīng)時(shí)間x的非線性回歸方程為=e0.686·e0.019x≈1.986e0.019x.
[學(xué)習(xí)效果·課堂評(píng)估夯基礎(chǔ)]
1.A [由殘差圖顯示的分布情況即可看出,圖A顯示的殘差分布比較集中,且成帶狀分布,滿足一元線性回歸模型中對(duì)隨機(jī)誤差的假定.]
2.C [由R2的計(jì)算公式,知B正確,C錯(cuò)誤;A,D均正確.]
3.丁 [由題表可知,丁同學(xué)的相關(guān)系數(shù)r最大且殘差平方和m最小,故丁同學(xué)的試驗(yàn)結(jié)果體現(xiàn)了A,B兩變量更強(qiáng)的線性相關(guān)性.]
4.=e0.25x-2.58 [由=0.25x-2.58得ln=0.25x-2.58,所以=e0.25x-2.58.]
課堂小結(jié)
1.提示:殘差圖法,殘差平方和法和R2法.
2.提示:在含有一個(gè)解釋變量的線性回歸模型中,決定系數(shù)R2恰好等于相關(guān)系數(shù)r的平方.在線性回歸模型中有0≤R2≤1,因此R2和兩個(gè)變量的相關(guān)系數(shù)r都能刻畫用線性回歸模型擬合數(shù)據(jù)的效果.|r|越大,R2就越大,線性回歸模型擬合數(shù)據(jù)的效果就越好.8.3.1 分類變量與列聯(lián)表
8.3.2 獨(dú)立性檢驗(yàn)
學(xué)習(xí) 任務(wù) 1.了解2×2列聯(lián)表、隨機(jī)變量χ2的意義.(數(shù)學(xué)抽象) 2.理解獨(dú)立性檢驗(yàn)中P(χ2≥xα)的具體含義.(數(shù)學(xué)抽象) 3.掌握獨(dú)立性檢驗(yàn)的方法和步驟.(數(shù)據(jù)分析) 4.通過典型案例,學(xué)習(xí)統(tǒng)計(jì)方法,并能用這些方法解決一些實(shí)際問題.(數(shù)學(xué)建模、數(shù)據(jù)分析)
任意抽取某市的一名學(xué)生,記A:喜歡長(zhǎng)跑;B:是女生.
(1)你能得出P(A),P(B),P(AB)這三者的準(zhǔn)確值嗎?
(2)如果要判斷A與B是否獨(dú)立,該怎么辦?
知識(shí)點(diǎn)1 數(shù)值變量與分類變量
數(shù)值變量:數(shù)值變量的取值為________,其大小和運(yùn)算都有實(shí)際含義.
分類變量:這里所說的變量和值不一定是具體的數(shù)值,例如:性別變量,其取值為男和女兩種,我們經(jīng)常會(huì)使用一種特殊的隨機(jī)變量,以區(qū)別不同的現(xiàn)象或性質(zhì),這類隨機(jī)變量稱為________,分類變量的取值可以用________表示.
知識(shí)點(diǎn)2 列聯(lián)表與等高堆積條形圖
(1)2×2列聯(lián)表
①定義:列出的兩個(gè)分類變量的________,稱為列聯(lián)表.
②2×2列聯(lián)表,一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的取值分別為{0,1},其樣本頻數(shù)列聯(lián)表為:
X Y 合計(jì)
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合計(jì) a+c b+d n=a+b+c+d
最后一行的前兩個(gè)數(shù)分別是事件{Y=0}和{Y=1}的頻數(shù);最后一列的前兩個(gè)數(shù)分別是事件{X=0}和{X=1}的頻數(shù);中間的四個(gè)數(shù)a,b,c,d是事件{X=x,Y=y(tǒng)}(x,y=0,1)的頻數(shù);右下角格中的數(shù)n為樣本容量.
(2)等高堆積條形圖
等高堆積條形圖和表格相比,更能直觀地反映出兩個(gè)分類變量間是否相互影響,常用等高堆積條形圖展示列聯(lián)表數(shù)據(jù)的________特征,依據(jù)________的原理,我們可以推斷結(jié)果.
2×2列聯(lián)表用于研究?jī)深愖兞恐g是否相互獨(dú)立,它適用于分析兩類變量之間的關(guān)系,是對(duì)兩類變量進(jìn)行獨(dú)立性檢驗(yàn)的基礎(chǔ).
知識(shí)點(diǎn)3 獨(dú)立性檢驗(yàn)
(1)零假設(shè):設(shè)X和Y為定義在Ω上,取值于{0,1}的成對(duì)分類變量.由于{X=0}和{X=1},{Y=0}和{Y=1}都是互為對(duì)立事件,故要判斷事件{X=1}和{Y=1)之間是否有關(guān)聯(lián),需要判斷假定關(guān)系H0:________是否成立.
(2)獨(dú)立性檢驗(yàn)的公式
χ2=________________,其中n=________,用隨機(jī)變量χ2取值的大小作為判斷零假設(shè)H0是否成立的依據(jù),當(dāng)它比較大時(shí)推斷H0不成立,否則認(rèn)為H0成立.
(3)臨界值:對(duì)任何小概率值α,可以找到相應(yīng)的正實(shí)數(shù)xα,使P(χ2≥xα)=α.稱xα為α的臨界值.臨界值可作為判斷χ2大小的標(biāo)準(zhǔn).概率值α越小,臨界值xα越大.
(4)小概率值α的檢驗(yàn)規(guī)則:當(dāng)χ2≥xα?xí)r,推斷H0不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過α.
當(dāng)χ2(5)χ2獨(dú)立性檢驗(yàn)中幾個(gè)常用的小概率值和相應(yīng)的臨界值.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
1.思考辨析(正確的畫“√”,錯(cuò)誤的畫“×”)
(1)分類變量中的變量與函數(shù)中的變量是同一概念. (  )
(2)列聯(lián)表中的數(shù)據(jù)是兩個(gè)分類變量的頻數(shù). (  )
(3)列聯(lián)表、頻率分析法、等高堆積條形圖都可初步分析兩個(gè)分類變量是否有關(guān)系.
(  )
(4)在獨(dú)立性檢驗(yàn)中,若χ2越大,則兩個(gè)分類變量有關(guān)系的可能性越大. (  )
(5)2×2列聯(lián)表是借助兩個(gè)分類變量之間頻率大小差異說明兩個(gè)變量之間是否有關(guān)聯(lián)關(guān)系. (  )
(6)應(yīng)用獨(dú)立性檢驗(yàn)的基本思想對(duì)兩個(gè)變量間的關(guān)系作出的推斷一定是正確的.
(  )
2.某校為了檢驗(yàn)高中數(shù)學(xué)新課程改革的成果,在兩個(gè)班進(jìn)行教學(xué)方式的對(duì)比試驗(yàn),兩個(gè)月后進(jìn)行了一次檢測(cè),試驗(yàn)班與對(duì)照班的成績(jī)統(tǒng)計(jì)如2×2列聯(lián)表所示(單位:人),則其中m=________,n=________.
班級(jí) 成績(jī) 合計(jì)
80分及80分以上 80分以下
試驗(yàn)班 32 18 50
對(duì)照班 24 m 50
合計(jì) 56 44 n
3.根據(jù)表格計(jì)算:
性別 不看電視 看電視
男 37 85
女 35 143
χ2≈________(保留3位小數(shù)).
類型1 列聯(lián)表與等高堆積條形圖
【例1】 (1)根據(jù)如圖所示的等高堆積條形圖可知喝酒與患胃病________關(guān)系.(填“有”或“沒有”)
(2)網(wǎng)絡(luò)對(duì)現(xiàn)代人的生活影響較大,尤其是對(duì)青少年,為了解網(wǎng)絡(luò)對(duì)中學(xué)生學(xué)習(xí)成績(jī)的影響,某地區(qū)教育主管部門從轄區(qū)初中生中隨機(jī)抽取了1 000人調(diào)查,發(fā)現(xiàn)其中經(jīng)常上網(wǎng)的有200人,這200人中有80人期末考試不及格,而另外800人中有120人不及格.利用等高堆積條形圖判斷,學(xué)生學(xué)習(xí)成績(jī)與經(jīng)常上網(wǎng)有關(guān)嗎?
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
 1.利用2×2列聯(lián)表分析兩變量間關(guān)系的步驟
(1)根據(jù)題中數(shù)據(jù)獲得2×2列聯(lián)表;
(2)根據(jù)頻率特征,即將與的值相比,直觀地反映出兩個(gè)分類變量間是否相互影響.
2.利用等高堆積條形圖判斷兩個(gè)分類變量是否相關(guān)的步驟:
[跟進(jìn)訓(xùn)練]
1.某學(xué)校對(duì)高三學(xué)生作了一項(xiàng)調(diào)查,發(fā)現(xiàn):在平時(shí)的模擬考試中,性格內(nèi)向的學(xué)生426人中有332人在考前心情緊張,性格外向的學(xué)生594人中有213人在考前心情緊張.作出等高堆積條形圖,利用圖形判斷考前心情緊張與性格類別是否有關(guān)系.
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
類型2 由χ2進(jìn)行獨(dú)立性檢驗(yàn)
 分類變量“相關(guān)的檢驗(yàn)”
【例2】 (源自湘教版教材)為了考察某種新疫苗預(yù)防疾病的作用,科學(xué)家對(duì)動(dòng)物進(jìn)行試驗(yàn),所得數(shù)據(jù)(單位:只)如下表所示:
是否接種疫苗 發(fā)病 沒發(fā)病 合計(jì)
接種疫苗 8 15 23
沒接種疫苗 18 9 27
合計(jì) 26 24 50
能否作出接種疫苗與預(yù)防疾病有關(guān)的結(jié)論?
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
 用χ2進(jìn)行“相關(guān)的檢驗(yàn)”步驟
(1)零假設(shè):即先假設(shè)兩變量間沒關(guān)系.
(2)計(jì)算χ2:套用χ2的公式求得χ2值.
(3)查臨界值:結(jié)合所給小概率值α查得相應(yīng)的臨界值xα.
(4)下結(jié)論:比較χ2與xα的大小,并作出結(jié)論.
[跟進(jìn)訓(xùn)練]
2.在某醫(yī)院,因?yàn)榛夹呐K病而住院的600名男性病人中,有200人禿頂,而另外750名不是因?yàn)榛夹呐K病而住院的男性病人中有150人禿頂.
(1)填寫下列禿頂與患心臟病列聯(lián)表:
是否 禿頂 患病 合計(jì)
患心臟病 患其他病
禿頂
不禿頂
合計(jì)
據(jù)表中數(shù)據(jù)估計(jì)禿頂病患中患心臟病的概率P1和不禿頂病患中患心臟病的概率P2,并用兩個(gè)估計(jì)概率判斷禿頂與患心臟病是否有關(guān);
(2)依據(jù)α=0.001的獨(dú)立性檢驗(yàn),分析禿頂與患心臟病有關(guān)嗎?請(qǐng)說明理由.
注:χ2=.
α 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.706 3.841 5.024 6.635 7.879 10.828
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
 分類變量“無(wú)關(guān)的檢驗(yàn)”
【例3】 某省進(jìn)行高中新課程改革,為了解教師對(duì)新課程教學(xué)模式的使用情況,某教育機(jī)構(gòu)對(duì)某學(xué)校的教師關(guān)于新課程教學(xué)模式的使用情況進(jìn)行了問卷調(diào)查,共調(diào)查了50人,其中有老教師20人,青年教師30人.老教師對(duì)新課程教學(xué)模式贊同的有10人,不贊同的有10人;青年教師對(duì)新課程教學(xué)模式贊同的有24人,不贊同的有6人.
(1)根據(jù)以上數(shù)據(jù)建立一個(gè)2×2列聯(lián)表;
(2)試根據(jù)小概率值α=0.01的獨(dú)立性檢驗(yàn),分析對(duì)新課程教學(xué)模式的贊同情況與教師年齡是否有關(guān)系.
附:
χ2=
α 0.025 0.01 0.005
xα 5.024 6.635 7.879
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
 獨(dú)立性檢驗(yàn)的關(guān)注點(diǎn)
(1)χ2計(jì)算公式較復(fù)雜,一是公式要清楚;二是代入數(shù)值時(shí)不能張冠李戴;三是計(jì)算時(shí)要細(xì)心.
(2)判斷時(shí)把計(jì)算結(jié)果與臨界值比較,其值越大,有關(guān)的可信度越高.
[跟進(jìn)訓(xùn)練]
3.為了解某挑戰(zhàn)賽中是否接受挑戰(zhàn)與受邀者的性別是否有關(guān)系(假設(shè)每個(gè)人是否接受挑戰(zhàn)互不影響),某機(jī)構(gòu)進(jìn)行了隨機(jī)抽樣調(diào)查,得到如下調(diào)查數(shù)據(jù)(單位:人):
性別 挑戰(zhàn) 合計(jì)
接受挑戰(zhàn) 不接受挑戰(zhàn)
男性 45 15 60
女性 25 15 40
合計(jì) 70 30 100
試根據(jù)小概率值α=0.1的獨(dú)立性檢驗(yàn),分析比賽中是否接受挑戰(zhàn)與受邀者的性別是否有關(guān).
附:χ2=.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
                                    
                                    
                                    
                                    
                                    
類型3 獨(dú)立性檢驗(yàn)的綜合應(yīng)用
【例4】 第24屆冬奧會(huì)已于2022年2月4日至2月22日在北京市和河北省張家口市聯(lián)合舉行,這是中國(guó)歷史上第一次舉辦冬季奧運(yùn)會(huì).為了宣傳冬奧會(huì),讓更多的人了解喜愛冰雪項(xiàng)目,某校高三年級(jí)舉辦了冬奧會(huì)知識(shí)競(jìng)賽(總分:100分),并隨機(jī)抽取了n名中學(xué)生的成績(jī),繪制成如圖所示的頻率分布直方圖.已知前三組的頻率成等差數(shù)列,第一組和第五組的頻率相同.
(1)求實(shí)數(shù)a,b的值,并估計(jì)這n名中學(xué)生的成績(jī)的平均值;(同一組中的數(shù)據(jù)用該組區(qū)間的中點(diǎn)值作代表)
(2)已知抽取的n名中學(xué)生中,男、女生人數(shù)相等,男生喜歡花樣滑冰的人數(shù)占男生人數(shù)的,女生喜歡花樣滑冰的人數(shù)占女生人數(shù)的,且在犯錯(cuò)誤的概率不大于0.05的前提下,認(rèn)為中學(xué)生喜歡花樣滑冰與性別有關(guān),求n的最小值.
參考數(shù)據(jù)及公式如下:
α 0.05 0.01 0.001
xα 3.841 6.635 10.828
χ2=,n=a+b+c+d.
[思路導(dǎo)引] (1)
(2)—
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
 獨(dú)立性檢驗(yàn)綜合應(yīng)用的方法策略
(1)獨(dú)立性檢驗(yàn)在實(shí)際中有著廣泛的應(yīng)用,是對(duì)實(shí)際生活中數(shù)據(jù)進(jìn)行分析的一種方法,通過這種分析得出的結(jié)論對(duì)實(shí)際生活有著重要的指導(dǎo)作用.
(2)近幾年高考中較少單獨(dú)考查獨(dú)立性檢驗(yàn),經(jīng)常與統(tǒng)計(jì)、概率、頻率分布表、頻率分布直方圖等知識(shí)融合在一起考查.一般需要根據(jù)條件列出2×2列聯(lián)表,計(jì)算χ2值,從而解決問題.
[跟進(jìn)訓(xùn)練]
4.某學(xué)校研究性學(xué)習(xí)小組對(duì)該校高三學(xué)生視力情況進(jìn)行調(diào)查,在高三的全體1 000名學(xué)生中隨機(jī)抽取了100名學(xué)生的體檢表,并得到如圖所示的頻率分布直方圖.
(1)若頻率分布直方圖中后四組的頻數(shù)成等差數(shù)列,試估計(jì)全年級(jí)視力在5.0以下的人數(shù);
(2)學(xué)習(xí)小組成員發(fā)現(xiàn),學(xué)習(xí)成績(jī)突出的學(xué)生,近視的比較多,為了研究學(xué)生的視力與學(xué)習(xí)成績(jī)是否有關(guān)系,對(duì)年級(jí)名次在1~50名和951~1 000名的學(xué)生進(jìn)行了調(diào)查,得到下面的2×2列聯(lián)表,根據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),能否認(rèn)為視力與學(xué)習(xí)成績(jī)有關(guān)聯(lián)?
視力 學(xué)習(xí)成績(jī) 合計(jì)
名次在1~50名 名次在951~1 000名
近視 41 32 73
不近視 9 18 27
合計(jì) 50 50 100
(3)在(2)中調(diào)查的100名學(xué)生中,按照分層抽樣在不近視的學(xué)生中抽取了6人,進(jìn)一步調(diào)查他們良好的護(hù)眼習(xí)慣,并且在這6人中任取2人,求抽取的2人中,恰有1人年級(jí)名次在1~50名的概率.
附:χ2=.
α 0.05 0.01 0.005 0.001
xα 3.841 6.635 7.879 10.828
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
1.下列不是分類變量的是(  )
A.近視  B.成績(jī)  C.血壓  D.飲酒
2.假設(shè)有兩個(gè)分類變量X與Y,它們的可能取值分別為{0,1},其2×2列聯(lián)表為
X Y 合計(jì)
Y=0 Y=1
X=0 10 18 28
X=1 m 26 m+26
合計(jì) 10+m 44 54+m
當(dāng)m取下面何值時(shí),X與Y的關(guān)系最弱(  )
A.8 B.9
C.14 D.19
3.某校期中考試后,按照甲、乙兩個(gè)班學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀和良好統(tǒng)計(jì)人數(shù)后,得到如下列聯(lián)表:
班級(jí) 成績(jī) 合計(jì)
優(yōu)秀 良好
甲班 11 34 45
乙班 8 37 45
合計(jì) 19 71 90
則χ2約為(  )
A.0.600 B.0.828
C.2.712 D.6.004
4.下表是某校某屆本科志愿報(bào)名時(shí),對(duì)其中304名學(xué)生進(jìn)入高校時(shí)是否知道想學(xué)專業(yè)的調(diào)查表:
性別 想學(xué)專業(yè) 合計(jì)
知道想學(xué)專業(yè) 不知道想學(xué)專業(yè)
男生 63 117 180
女生 42 82 124
合計(jì) 105 199 304
根據(jù)表中數(shù)據(jù),則下列說法正確的是_______________.
(填序號(hào))
①性別與知道想學(xué)專業(yè)有關(guān);
②性別與知道想學(xué)專業(yè)無(wú)關(guān);
③女生比男生更易知道想學(xué)專業(yè).
回顧本節(jié)知識(shí),自主完成以下問題:
1.在χ2運(yùn)算后,得到χ2的值為29.78,在判斷變量相關(guān)時(shí),P(χ2≥6.635)≈0.01和P(χ2≥7.879)≈0.005,哪種說法是正確的?
2.利用小概率值α獨(dú)立性檢驗(yàn)的依據(jù)是什么?
8. 3.1 分類變量與列聯(lián)表
8.3.2 獨(dú)立性檢驗(yàn)
[必備知識(shí)·情境導(dǎo)學(xué)探新知]
知識(shí)點(diǎn)1 實(shí)數(shù) 分類變量 實(shí)數(shù)
知識(shí)點(diǎn)2 (1)頻數(shù)表 (2)頻率 頻率穩(wěn)定于概率
知識(shí)點(diǎn)3 (1)P(Y=1|X=0)=P(Y=1|X=1) (2) a+b+c+d
課前自主體驗(yàn)
1.(1)× (2)√ (3)√ (4)√ (5)√ (6)×
2.26 100 [由題意得解得m=26,n=100.]
3.4.514 [χ2=≈4.514.]
[關(guān)鍵能力·合作探究釋疑難]
例1 (1)有 [從等高堆積條形圖上可以明顯地看出喝酒患胃病的頻率遠(yuǎn)遠(yuǎn)大于不喝酒患胃病的頻率,所以由所給等高堆積條形圖可知,喝酒與患胃病有關(guān)系.]
(2)解:根據(jù)題目所給的數(shù)據(jù)得到如下2×2列聯(lián)表:
學(xué)習(xí) 成績(jī) 上網(wǎng) 合計(jì)
經(jīng)常 不經(jīng)常
不及格 80 120 200
及格 120 680 800
合計(jì) 200 800 1000
得出等高堆積條形圖如圖所示:
比較圖中陰影部分高可以發(fā)現(xiàn)經(jīng)常上網(wǎng)不及格的頻率明顯高于經(jīng)常上網(wǎng)及格的頻率,因此可以認(rèn)為學(xué)習(xí)成績(jī)與經(jīng)常上網(wǎng)有關(guān).
跟進(jìn)訓(xùn)練
1.解:作列聯(lián)表如下:
考前 心情 性格 合計(jì)
內(nèi)向 外內(nèi)
緊張 332 213 545
不緊張 94 381 475
合計(jì) 426 594 1020
相應(yīng)的等高堆積條形圖如圖所示.
圖中陰影部分表示考前心情緊張與考前心情不緊張中性格內(nèi)向的比例.
從圖中可以看出考前心情緊張的樣本中性格內(nèi)向占的比例比考前心情不緊張樣本中性格內(nèi)向占的比例高,可以認(rèn)為考前心情緊張與性格類別有關(guān).
例2 解:提出統(tǒng)計(jì)假設(shè)H0:接種疫苗與預(yù)防疾病無(wú)關(guān).
根據(jù)列聯(lián)表中的數(shù)據(jù),可以求得
χ2=≈5.059,
由于5.024<5.059<6.635,查臨界值表可知,我們至少有97.5%的把握認(rèn)為接種疫苗與預(yù)防疾病有關(guān),即疫苗有效.
跟進(jìn)訓(xùn)練
2.解:(1)
是否 禿頂 患病 合計(jì)
患心臟病 患其他病
禿頂 200 150 350
不禿頂 400 600 1000
合計(jì) 600 750 1350
P1=,P2=.
由于P1遠(yuǎn)大于P2,所以判斷禿頂與患心臟病有關(guān).
(2)零假設(shè)為H0:禿頂與患心臟病無(wú)關(guān).
由題可知
χ2=≈30.86>10.828=x0.001,
所以依據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),我們推斷H0不成立,即認(rèn)為禿頂與患心臟病有關(guān).
例3 解:(1)2×2列聯(lián)表如表所示:
教師年齡 對(duì)新課程教學(xué)模式 合計(jì)
贊同 不贊同
老教師 10 10 20
青年教師 24 6 30
合計(jì) 34 16 50
(2)零假設(shè)為H0:對(duì)新課程教學(xué)模式的贊同情況與教師年齡無(wú)關(guān).
由題可知
χ2=≈4.963<6.635=x0.01,
根據(jù)小概率值α=0.01的獨(dú)立性檢驗(yàn),沒有充分證據(jù)推斷H0不成立,因此可以以為H0成立,即認(rèn)為對(duì)新課程教學(xué)模式的贊同情況與教師年齡無(wú)關(guān).
跟進(jìn)訓(xùn)練
3.解:零假設(shè)H0:是否接受挑戰(zhàn)與受邀者的性別無(wú)關(guān).
根據(jù)列聯(lián)表中的數(shù)據(jù),可以求得
χ2=≈1.786.
因?yàn)?.786<2.706,所以沒有充分的證據(jù)顯示比賽中是否接受挑戰(zhàn)與受邀者的性別有關(guān).
例4 解:(1)由題意知得
則各組頻率依次為0.05,0.25,0.45,0.2,0.05.
∴=0.05×50+0.25×60+0.45×70+0.2×80+0.05×90=69.5(分).
(2)設(shè)男生人數(shù)為x,依題意可得2×2列聯(lián)表如下:
性別 花樣滑冰 合計(jì)
喜歡 不喜歡
男 x x x
女 x x x
合計(jì) x x 2x
χ2=x>3.841,
∴x≥29.
又x=4k,k∈N*,且各組的頻數(shù)為正整數(shù),
故xmin=32,nmin=64.
跟進(jìn)訓(xùn)練
4.解:(1)由圖可知第一組有3人,第二組有7人,第三組有27人.
因?yàn)楹笏慕M的頻數(shù)成等差數(shù)列,且它們的和為90,公差小于0,
所以后四組的頻數(shù)依次為27,24,21,18.
所以視力在5.0以下的人數(shù)為3+7+27+24+21=82(或者100-18=82),故全年級(jí)視力在5.0以下的人數(shù)約為1000×=820.
(2)零假設(shè)H0:視力與學(xué)習(xí)成績(jī)相互獨(dú)立,即視力與學(xué)習(xí)成績(jī)無(wú)關(guān).
根據(jù)2×2列聯(lián)表中的數(shù)據(jù)可得
χ2=≈4.110>3.841=x0.05.
根據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),我們推斷H0不成立,即認(rèn)為視力與學(xué)習(xí)成績(jī)有關(guān)系,此推斷犯錯(cuò)誤的概率不大于0.05.
(3)依題意得,6人中年級(jí)名次在1~50名的有2人,年級(jí)名次在951~1000名的有4人,則從6人中任取2人的情況有=15種,
恰有1人年級(jí)名次在1~50名的有=8種,所以所求概率為.
[學(xué)習(xí)效果·課堂評(píng)估夯基礎(chǔ)]
1.B [近視變量有近視與不近視兩種類別,血壓變量有異常、正常兩種類別,
飲酒變量有飲酒與不飲酒兩種類別,
成績(jī)不是分類變量,它的取值不一定有兩種.]
2.C [由10×26=18m,解得m≈14.4,所以當(dāng)m=14時(shí),X與Y的關(guān)系最弱.]
3.A [根據(jù)列聯(lián)表中的數(shù)據(jù),
可得χ2=≈0.600.]
4.② [零假設(shè)為H0:性別與知道想學(xué)專業(yè)無(wú)關(guān),由表中數(shù)據(jù)得χ2=≈0.041<2.706=x0.1,依據(jù)α=0.1的獨(dú)立性檢驗(yàn),沒有充分證據(jù)推斷H0不成立,因此可以認(rèn)為H0成立,即認(rèn)為性別與知道想學(xué)專業(yè)無(wú)關(guān).]
課堂小結(jié)
1.提示:兩種說法均正確.P(χ2≥6.635)≈0.01的含義是在犯錯(cuò)誤的概率不超過0.01的前提下認(rèn)為兩個(gè)變量相關(guān);而P(χ2≥7.879)≈0.005的含義是在犯錯(cuò)誤的概率不超過0.005的前提下認(rèn)為兩個(gè)變量相關(guān).
2.提示:如果χ2≥xα我們推斷H0不成立.即認(rèn)為兩個(gè)分類變量不獨(dú)立,且該推斷犯錯(cuò)誤的概率不超過α.如果χ2類型1 線性回歸分析
1.回歸分析是對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法.其基本步驟為通過散點(diǎn)圖和經(jīng)驗(yàn)選擇經(jīng)驗(yàn)回歸方程的類型,然后通過一定的規(guī)則確定出相應(yīng)的經(jīng)驗(yàn)回歸方程,通過一定的方法進(jìn)行檢驗(yàn),最后應(yīng)用于實(shí)際或?qū)︻A(yù)報(bào)變量進(jìn)行預(yù)測(cè).
2.主要培養(yǎng)數(shù)學(xué)建模和數(shù)據(jù)分析的素養(yǎng).
【例1】 下面給出了根據(jù)我國(guó)2016~2022年水果人均占有量y(單位:kg)和年份代碼x繪制的散點(diǎn)圖和經(jīng)驗(yàn)回歸方程的殘差圖(2016~2022年的年份代碼x分別為1~7).
(1)根據(jù)散點(diǎn)圖分析y與x之間的相關(guān)關(guān)系;
經(jīng)驗(yàn)回歸方程;
(3)根據(jù)經(jīng)驗(yàn)回歸方程的殘差圖,分析經(jīng)驗(yàn)回歸方程的擬合效果.(精確到0.01)
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
類型2 獨(dú)立性檢驗(yàn)
1.獨(dú)立性檢驗(yàn)研究的問題是有多大把握認(rèn)為兩個(gè)分類變量之間有關(guān)系.為此需先列出2×2 列聯(lián)表,從表格中可以直觀地得到兩個(gè)分類變量是否有關(guān)系.另外等高堆積條形圖能更直觀地反映兩個(gè)分類變量之間的情況.獨(dú)立性檢驗(yàn)的思想是可以先假設(shè)二者無(wú)關(guān)系,求隨機(jī)變量χ2的值,若χ2大于臨界值,則拒絕假設(shè),否則,接受假設(shè).
2.通過計(jì)算χ2的值,進(jìn)而分析相關(guān)性結(jié)論的可信程度,提升數(shù)學(xué)運(yùn)算、數(shù)據(jù)分析的素養(yǎng).
【例2】 某校鼓勵(lì)即將畢業(yè)的大學(xué)生到西部偏遠(yuǎn)地區(qū)去支教,該校學(xué)生就業(yè)部針對(duì)即將畢業(yè)的男、女生是否愿意到西部支教進(jìn)行問卷調(diào)查,得到的情況如表所示:
性別 支教 合計(jì)
愿意去支教 不愿意去支教
女生 20
男生 40
合計(jì) 70 100
(1)完成上述2×2列聯(lián)表;
(2)根據(jù)表中的數(shù)據(jù),試根據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),分析愿意去西部支教是否與性別有關(guān).
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
類型3 概率與統(tǒng)計(jì)的綜合應(yīng)用
1.概率與統(tǒng)計(jì)作為考查學(xué)生應(yīng)用意識(shí)的重要載體,已成為近幾年高考的一大亮點(diǎn)和熱點(diǎn),它與其他知識(shí)融合、滲透,情境新穎,充分體現(xiàn)了概率與統(tǒng)計(jì)的工具性和交匯性.
2.主要培養(yǎng)數(shù)據(jù)分析和數(shù)學(xué)運(yùn)算學(xué)科素養(yǎng).
【例3】 某公司對(duì)40名試用員工進(jìn)行業(yè)務(wù)水平測(cè)試,根據(jù)測(cè)試成績(jī)?cè)u(píng)定是否正式錄用以及正式錄用后的崗位等級(jí),測(cè)試分筆試和面試兩個(gè)環(huán)節(jié).筆試環(huán)節(jié)所有40名試用員工全部參加;參加面試環(huán)節(jié)的員工由公司按規(guī)則確定.公司對(duì)40名試用員工的筆試得分(筆試得分都在[75,100]內(nèi))進(jìn)行了統(tǒng)計(jì)分析,得到如下頻率分布直方圖和2×2列聯(lián)表.
業(yè)務(wù)水平 性別 合計(jì)
男 女
優(yōu)(得分不低于90分) 8
良(得分低于90分) 12
合計(jì) 40
(1)請(qǐng)完成上面的2×2列聯(lián)表,并依據(jù)α=0.10的獨(dú)立性檢驗(yàn),分析“試用員工的業(yè)務(wù)水平優(yōu)良與否”與性別是否有關(guān);
(2)公司決定:在筆試環(huán)節(jié)中得分低于85分的試用員工直接淘汰,得分不低于85分的試用員工都正式錄用.筆試得分在[95,100]內(nèi)的崗位等級(jí)直接定為一級(jí)(不必參加面試環(huán)節(jié));筆試得分在[90,95)內(nèi)的崗位等級(jí)初定為二級(jí),但有的概率在面試環(huán)節(jié)將二級(jí)晉升為一級(jí);筆試得分在[85,90)內(nèi)的崗位等級(jí)初定為三級(jí),但有的概率在面試環(huán)節(jié)將三級(jí)晉升為二級(jí).規(guī)定所有被正式錄用且崗位等級(jí)初定為二級(jí)和三級(jí)的員工都需參加面試.已知甲、乙為該公司的兩名試用員工,將頻率視為概率.
①若甲已被公司正式錄用,求甲的最終崗位等級(jí)為一級(jí)的概率;
②若乙在筆試環(huán)節(jié)的崗位等級(jí)初定為二級(jí),求甲的最終崗位等級(jí)不低于乙的最終崗位等級(jí)的概率.
參考公式:χ2=n=a+b+c+d.
α 0.15 0.10 0.05 0.010
xα 2.072 2.706 3.841 6.635
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
類型4 化歸與轉(zhuǎn)化思想在非線性回歸分析中的應(yīng)用
1.轉(zhuǎn)化與化歸思想主要體現(xiàn)在非線性回歸分析中.在實(shí)際問題中,并非所有的變量關(guān)系均滿足線性關(guān)系,故要選擇適當(dāng)?shù)暮瘮?shù)模型去擬合樣本數(shù)據(jù),再通過代數(shù)變換,把非線性問題線性化.
2.主要培養(yǎng)數(shù)學(xué)建模和數(shù)學(xué)運(yùn)算的素養(yǎng).
【例4】 (2023·江西上饒期末)某企業(yè)新研發(fā)了一種產(chǎn)品,產(chǎn)品的成本由原料成本及非原料成本組成.每件產(chǎn)品的非原料成本y(元)與生產(chǎn)該產(chǎn)品的數(shù)量x(千件)有關(guān),經(jīng)統(tǒng)計(jì)得到如下數(shù)據(jù):
x 1 2 3 4
y 56.5 31 22.75 17.8
x 5 6 7 8
y 15.95 14.5 13 12.5
對(duì)以上數(shù)據(jù)進(jìn)行分析后,考慮用反比例函數(shù)模型y=a+和指數(shù)型函數(shù)模型y=cedx也分別對(duì)兩個(gè)變量的關(guān)系進(jìn)行擬合.已求得用指數(shù)型函數(shù)模型擬合的經(jīng)驗(yàn)回歸方程為y=48.376×e-0.195x,ln y與x的樣本相關(guān)系數(shù)r1=-0.929.
(1)求用反比例函數(shù)模型擬合的y關(guān)于x的經(jīng)驗(yàn)回歸方程(系數(shù)保留整數(shù));
(2)用樣本相關(guān)系數(shù)判斷這兩個(gè)模型中哪一個(gè)的擬合效果更好(精確到0.001),并用其估計(jì)產(chǎn)量為10千件時(shí)每件產(chǎn)品的非原料成本;
(3)根據(jù)企業(yè)長(zhǎng)期研究表明,非原料成本y服從正態(tài)分布N(μ,σ2),用樣本平均數(shù)作為μ的估計(jì)值,用樣本標(biāo)準(zhǔn)差s作為σ的估計(jì)值,若非原料成本y在[μ-σ,μ+σ]之外,說明該成本異常,并稱落在[μ-σ,μ+σ]之外的成本為異樣成本,此時(shí)需要尋找出現(xiàn)異樣成本的原因.試判斷上述非原料成本數(shù)據(jù)是否需要尋找出現(xiàn)異樣成本的原因.
參考數(shù)據(jù):
0.34 0.115 1.53 184 5 777.555
93.06 30.705 13.9
參考公式:在經(jīng)驗(yàn)回歸方程中,=,,
樣本相關(guān)系數(shù)r= .
[嘗試解答]                                     
                                    
                                    
                                    
                                    
                                    
章末綜合提升
例1 解:(1)根據(jù)散點(diǎn)圖可知,散點(diǎn)均勻分布在一條直線附近,且隨著x的增大,y增大,故y與x成線性相關(guān),且為正相關(guān).
(2)依題意,(1+2+3+4+5+6+7)=4,
=≈7.89,
=≈153.43-7.89×4=121.87,
所以y關(guān)于x的經(jīng)驗(yàn)回歸方程為
=7.89x+121.87.
(3)由殘差圖可以看出,殘差對(duì)應(yīng)點(diǎn)分布在水平帶狀區(qū)域內(nèi),且寬度較窄,說明擬合效果較好,經(jīng)驗(yàn)回歸方程的預(yù)測(cè)精度較高.
例2 解:(1)2×2列聯(lián)表如下:
性別 支教 合計(jì)
愿意去支教 不愿意去支教
女生 30 20 50
男生 40 10 50
合計(jì) 70 30 100
(2)零假設(shè)H0:支教與性別相互獨(dú)立,即是否愿意去西部支教與性別無(wú)關(guān).根據(jù)2×2列聯(lián)表中的數(shù)據(jù),
可得χ2=≈4.762>3.841=x0.05,
根據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),我們推斷H0不成立,
即認(rèn)為是否愿意去西部支教與性別有關(guān)聯(lián),因此推斷犯錯(cuò)誤的概率不大于0.05.
根據(jù)2×2列聯(lián)表中的數(shù)據(jù)計(jì)算,
女生愿意去支教與不愿意去支教的頻率分別為=0.6,=0.4;
男生愿意去支教與不愿意去支教的頻率分別為=0.8,=0.2.
由=2可見,女生不愿意去支教的頻率是男生不愿意去支教的頻率的2倍.
于是,根據(jù)頻率穩(wěn)定于概率的原理,我們可以認(rèn)為女生不愿意去支教的概率明顯大于男生不愿意去支教的概率,即是否愿意去西部支教明顯與性別有關(guān).
例3 解:(1)由題圖可知,得分不低于90分的人數(shù)為40×(0.04+0.02)×5=12,所以補(bǔ)充完整的2×2列聯(lián)表如下:
業(yè)務(wù)水平 性別 合計(jì)
男 女
優(yōu)(得分不低于90分) 8 4 12
良(得分低于90分) 16 12 28
合計(jì) 24 16 40
零假設(shè)為H0:“試用員工的業(yè)務(wù)水平優(yōu)良與否”與性別無(wú)關(guān).
計(jì)算得χ2=≈0.317<2.706=x0.10,
根據(jù)小概率值α=0.10的獨(dú)立性檢驗(yàn),沒有充分證據(jù)推斷H0不成立,即認(rèn)為“試用員工的業(yè)務(wù)水平優(yōu)良與否”與性別無(wú)關(guān).
(2)由題圖可知,不低于85分的試用員工的人數(shù)為40×(0.06+0.04+0.02)×5=24,
崗位等級(jí)直接定為一級(jí)的概率為,
崗位等級(jí)初定為二級(jí)的概率為,
崗位等級(jí)初定為三級(jí)的概率為.
①甲的最終崗位等級(jí)為一級(jí)的概率為×.
②若乙的最終崗位等級(jí)為二級(jí),則甲的最終崗位等級(jí)為一級(jí)或二級(jí),其概率為1-;
若乙的最終崗位等級(jí)為一級(jí),則甲的最終崗位等級(jí)為一級(jí),其概率為.
故甲的最終崗位等級(jí)不低于乙的最終崗位等級(jí)的概率為.
例4 解:(1)令u=,則y=a+可轉(zhuǎn)化為y=a+bu.
易得=23,
所以==50,
所以=23-50×0.34=6,
所以=6+50u,
所以y關(guān)于x的經(jīng)驗(yàn)回歸方程為=6+.
(2)設(shè)y與的樣本相關(guān)系數(shù)為r2,
==≈≈0.993.
因?yàn)閨r1|<|r2|,所以這兩個(gè)模型中反比例函數(shù)模型的擬合效果更好.
把x=10代入回歸方程=6+=6+=11,
所以產(chǎn)量為10千件時(shí)每件產(chǎn)品的非原料成本約為11元.
(3)因?yàn)椋?3,所以μ=23,
易得樣本標(biāo)準(zhǔn)差s=
==≈≈13.9,
所以σ=13.9,所以非原料成本y服從正態(tài)分布N(23,13.92),
所以[μ-σ,μ+σ]=[23-13.9,23+13.9]=[9.1,36.9].
因?yàn)?6.5在[μ-σ,μ+σ]之外,所以此非原料成本數(shù)據(jù)需要尋找出現(xiàn)異樣成本的原因.

展開更多......

收起↑

資源列表

<pre id="tfb94"><li id="tfb94"></li></pre>

<bdo id="tfb94"><rt id="tfb94"></rt></bdo>
  • <menu id="tfb94"><dl id="tfb94"></dl></menu><i id="tfb94"><acronym id="tfb94"><sub id="tfb94"></sub></acronym></i>

    1. 主站蜘蛛池模板: 庐江县| 新乡市| 罗定市| 广灵县| 景德镇市| 大同县| 黄龙县| 阳泉市| 吉安县| 松桃| 通城县| 竹溪县| 始兴县| 边坝县| 广西| 达拉特旗| 中西区| 仲巴县| 庆城县| 河北区| 类乌齐县| 大城县| 探索| 大邑县| 湛江市| 镇平县| 中阳县| 香河县| 三穗县| 绍兴县| 称多县| 上高县| 平山县| 长沙市| 金平| 友谊县| 莱西市| 庆云县| 南岸区| 临武县| 内乡县|