資源簡介 (共15張PPT)1.回歸直線與回歸直線方程我們常常用一條直線來反映所給出的散點圖的分布趨勢,找出與散點圖中各點散布趨勢相似的直線,使各點經過或充分靠近該直線,這樣所得到的直線就可以比較科學地反映實際問題中兩個變量之間的相關關系.這條直線叫作回歸直線,這條直線的方程叫作回歸直線方程.2.回歸分析(1)由散點圖求出回歸直線并進行統計推斷的過程叫作回歸分析.(2)在回歸分析中,被預測或被解釋的變量稱為因變量,用y表示.用來預測或解釋因變量的變量稱為自變量,用x表示.4.2 一元線性回歸模型1 | 回歸直線方程1.一元線性回歸方程如果具有相關關系的兩個變量x,y可用方程y=a+bx來近似刻畫,則稱此式為y關于x的一元線性回歸方程,其中a,b稱為回歸系數.由于我們是利用樣本數據(一組觀測值)去估計總體的回歸直線方程,因此我們在a,b,y的上方加記號“ ”以區別實際的a,b,y,此時得到估計的回歸直線方程形式為 = + x,它是根據樣本數據求出的回歸方程的估計.2.一元線性回歸模型(1)當自變量x取值xi(i=1,2,…,n)時,我們將根據回歸直線方程估計出的 與實際觀測值yi的誤差,即yi- =yi-( + xi)(i=1,2,…,n),稱為隨機誤差,記作ei.(2)我們把yi= + xi+ei(i=1,2,…,n)這一描述因變量y如何依賴于自變量x和隨機誤差ei的方程稱為一元線性回歸模型.2 | 一元線性回歸模型3.最小二乘法(1)用隨機誤差的平方和即Q= 作為總隨機誤差來刻畫各估計值與實際值之間的誤差.若總隨機誤差最小,則這條直線就是所要求的回歸直線.由于平方又叫二乘方,所以這種使“隨機誤差平方和最小”的方法叫作最小二乘法.(2)( , )稱為樣本中心,回歸直線一定過樣本中心.(3) 此時,用最小二乘法得到的回歸直線方程為 = + x,其中 是回歸直線在y軸上的截距, 是回歸直線的斜率.一般地,運用一元線性回歸模型思想解決實際問題的基本步驟如下:(1)確定研究對象,明確哪個變量是因變量,哪個變量是自變量;(2)運用相關系數的計算公式,分析自變量與因變量之間的關系;(3)運用最小二乘原理估計一元線性回歸方程的系數,建立一元線性回歸方程;(4)根據一元線性回歸方程進行預測.知識拓展 研究兩個變量的關系時,依據樣本畫出散點圖,從整體上看,如果樣本點沒有分布在一條直線附近,就稱這兩個變量之間不具有線性相關關系.當兩個變量不具有線性相關關系時,依據樣本點的分布選擇合適的曲線方程來擬合數據,可通過變量代換,利用一元線性回歸模型建立兩個變量間的非線性回歸方程.常見的非線性回歸方程的轉換方式如下:3 | 一元線性回歸模型的應用曲線方程 曲線(曲線的一部分) 變換公式 變換后的線性函數y=axb c=ln a, v=ln x, u=ln y u=c+bvy=aebx c=ln a, u=ln y u=c+bxy=a c=ln a, v= , u=ln y u=c+bvy=a+bln x v=ln x y=a+bv1.在一元線性回歸模型中,變量y由變量x唯一確定嗎 不是.變量y的值由x和隨機誤差e共同確定,即自變量x只能解釋部分y的變化.2.在回歸分析中,利用回歸直線方程求出的函數值一定是真實值嗎 不一定.利用回歸直線方程求出的值只是預報值.3.對于散點圖中的點沒有均勻分布在某條直線附近或毫無規則可言的兩個變量,用最小二乘法能求出對應的回歸直線方程嗎 能.但求得的回歸直線方程并不能反映兩個變量間的關系.知識辨析1.回歸直線方程中系數的兩種求法(1)公式法:利用公式求出回歸系數 , .(2)待定系數法:利用回歸直線必過樣本中心( , )求回歸系數 , .2.回歸分析的兩種題型及解題策略(1)利用回歸直線方程進行預測:把回歸直線方程看作一次函數的解析式,求函數值.(2)利用回歸直線判斷正、負相關:決定兩個變量是正相關關系還是負相關關系的是回歸系數 .1回歸直線方程的求解與應用 典例 某地隨著經濟的發展,農民收入逐年增長,下表是該地一農商銀行連續五年的儲蓄存款(年底余額):為了研究時計算方便,工作人員將上表的數據進行了處理,令t=x-2 016,z=y-6,得到下表:年份x 2017 2018 2019 2020 2021儲蓄存款y(百億元) 6 7.5 8 9.5 11時間代號t 1 2 3 4 5z 0 1.5 2 3.5 5(1)求z關于t的回歸直線方程 = t+ ;(2)通過(1)中的方程,求出y關于x的回歸直線方程;(3)用所求回歸方程預測到2024年年底,該農商銀行的儲蓄存款可達多少.附:對于回歸直線方程 = x+ ,其系數 = , = - .解析 (1)依題意,得 =3, = ,所以 = = = = , = - = - ×3=- ,所以z關于t的回歸直線方程為 = t- .所以 -6= (x-2 016)- ,整理得 = x- ,即y關于x的回歸直線方程為 = x- .(3)當x=2 024時, = =14.4,因此,預測到2024年年底,該農商銀行的儲蓄存款可達14.4百億元.(2)由(1)可知 = t- ,因為t=x-2 016,z=y-6,建立非線性回歸模型的基本步驟(1)確定研究對象,明確涉及的變量;(2)畫出確定好的變量間的散點圖,觀察它們之間的關系(是否存在非線性關系);(3)由經驗確定非線性回歸方程的類型(如我們觀察到數據呈非線性關系,一般選用反比例函數型、指數函數型、對數函數型模型等);(4)通過換元,將非線性回歸模型轉化為一元線性回歸模型;(5)按照公式計算回歸直線方程中的參數,得到回歸直線方程;(6)消去新元,得到非線性回歸方程.2 非線性回歸分析 典例 某電器企業統計了近10年的年利潤額y(千萬元)與投入的年廣告費用x(十萬元)的相關數據,得到散點圖如圖,對數據做出如下處理:令ui=ln xi,vi=ln yi,得到相關數據如表所示: uivi ui vi 30.5 15 15 46.5(1)從①y=bx+a;②y=m·xk(m>0,k>0);③y=cx2+dx+e(c≠0)中選擇一個作為年利潤額y關于年廣告費用x的回歸方程模型,不必說明理由;(2)根據(1)中選擇的回歸方程模型,求出y關于x的回歸方程;(3)要使年利潤額突破1億,預計下一年應至少投入多少廣告費用.(結果保留到萬元)參考數據: ≈3.678 8,3.678 83≈49.787.參考公式:在回歸直線方程 = u+ 中, = = - .思路點撥 (1)根據題中散點圖確定回歸方程模型.(2)對y=m·xk兩邊同時取自然對數,利用最小二乘法求k,m,由此得到回歸方程.(3)令y=e >10,解出x的范圍,進而確定結果.解析 (1)由題中散點圖知,年利潤額y關于年廣告費用x的回歸方程模型并不是直線型的,而是曲線型的,所以選擇回歸方程模型y=m·xk(m>0,k>0)更好.(2)對y=m·xk兩邊同時取自然對數,得ln y=kln x+ln m,即v=ku+ln m.由題表中數據得 = = = ,ln = - =1.5- ×1.5=1,∴ =e,∴年利潤額y關于年廣告費用x的回歸方程為y=e .(3)由(2)知y=e .令y=e >10,得 > ,即 >3.678 8,∴x>3.678 83≈49.787,∴x≈49.8(十萬元),又∵49.8十萬元=498萬元,∴預計下一年應至少投入498萬元廣告費用.第4章 統計4.2 一元線性回歸模型4.2.1 回歸直線方程4.2.2 一元線性回歸模型的應用 題組一 回歸直線方程及其應用1.(多選)關于回歸分析,下列說法正確的是( )A.回歸分析是研究兩個具有相關關系的變量的方法B.運用最小二乘法求得的回歸直線一定經過樣本中心(,)C.回歸模型中一定存在隨機誤差D.散點圖能明確反映變量間的關系2.色差和色度是衡量毛絨玩具質量優劣的重要指標,現抽檢一批該產品,測得如下數據:色差x 21 23 25 27 29 31色度y 15 16 17 21 22 23已知該產品的色差和色度之間滿足線性相關關系,且=0.25x+,現有一對測量數據(32,21.25),則該組數據的隨機誤差為( )A.0.65 B.0.75 C.-0.75 D.0.953.(多選)設某大學的女生體重y(單位:kg)與身高x(單位:cm)具有線性相關關系,根據一組樣本數據(xi,yi)(i=1,2,…,n),用最小二乘法建立的回歸直線方程為=0.85x-85.71,則下列結論中正確的是( )A.y與x具有正的線性相關關系B.若該大學女生的平均身高為168 cm,則平均體重約為57.09 kgC.若該大學某女生身高增加1 cm,則其體重約增加0.85 kgD.若該大學某女生身高為170 cm,則可斷定其體重必為58.79 kg4.若根據5名兒童的年齡x(歲)和體重y(kg)的數據用最小二乘法得到體重關于年齡的回歸直線方程是=2x+18,已知這5名兒童的年齡(歲)分別是3,5,2,6,4,則這5名兒童的平均體重是 kg. 5.為保護生態環境,某地區從2016年開始大力推出新能源汽車,每年抽取1 000輛汽車進行調查.下表所示的是2016年至2020年抽取的1 000輛汽車中新能源汽車的輛數y與年份代碼x的相關數據:年份 2016 2017 2018 2019 2020年份代碼x 1 2 3 4 5新能源汽 車輛數y 30 50 70 100 110(1)建立y關于x的回歸直線方程;(2)假設該地區2022年共有30萬輛汽車,用樣本估計總體,估計該地區2022年有多少輛新能源汽車.參考公式:回歸直線方程=x+中,=6.某科技公司研發了一項新產品A,經過市場調研,對公司1月份至6月份間該產品的銷售量及銷售單價進行統計,銷售單價x(千元)和銷售量y(千件)之間的一組數據如下表所示:月份i 1 2 3 4 5 6銷售 單價xi 9 9.5 10 10.5 11 8銷售 量yi 11 10 8 6 5 15(1)試根據1至5月份的數據,建立y關于x的回歸直線方程;(2)用6月份的數據進行檢驗,若由回歸直線方程得到的估計數據與實際數據的誤差的絕對值不超過0.65,則認為所得到的回歸直線方程是理想的,試問(1)中所得到的回歸直線方程是否理想 參考公式:回歸直線方程=x+中,=題組二 非線性回歸分析7.某種微生物的繁殖速度y與生長環境中營養物質的濃度x相關,在一定條件下可用回歸模型y=2lg x進行擬合.在這個條件下,要使y增加2個單位,則應該使x( )A.增加1個單位B.增加2個單位C.增加到原來的2倍D.增加到原來的10倍8.用模型y=cekx擬合一組數據時,為了求出回歸方程,令z=ln y,變換后得到線性回歸方程=2x+0.5,則c= . 9.某工廠每日生產一種產品x(x≥1)噸,每日生產的該產品當日銷售完畢,日銷售額為y萬元,產品價格隨著產量的變化而變化,經過一段時間的產銷,得到了x,y的一組統計數據,如下表:日產量 x(噸) 1 2 3 4 5日銷售額 y(萬元) 5 12 16 19 21(1)請判斷y=bx+a與y=dln x+c中哪個模型更適合刻畫x,y之間的關系,并從函數增長趨勢方面給出簡單的理由;(2)根據你的判斷及下面的公式和數據,求出y關于x的回歸方程,并估計當日產量為6噸時,日銷售額是多少.(結果保留整數)參考公式:回歸直線方程=x+中,=參考數據:≈0.96,5ln 1+12ln 2+16ln 3+19ln 4+21ln 5≈86,ln 6≈1.8,(ln 1)2+(ln 2)2+(ln 3)2+(ln 4)2+(ln 5)2≈6.2.10.我國為全面建設社會主義現代化國家,制定了從2021年到2025年的“十四五”規劃.某企業為響應國家號召,匯聚科研力量,加強科技創新,準備增加研發資金,現該企業為了解年研發資金投入額x(單位:億元)對年盈利額y(單位:億元)的影響,研究了“十二五”和“十三五”規劃發展期間共10年的年研發資金投入額xi和年盈利額yi的數據.通過對比分析,建立了兩個函數模型:①y=α+βx2;②y=eλx+t,其中α,β,λ,t均為常數,e為自然對數的底數.令ui=,vi=ln yi(i=1,2,…,10),經計算得如下數據:26 215 652 680 5.36(ui-)(yi-)11 250 130(xi-)(vi-)2.6 12(1)請從相關系數的角度分析哪一個模型的擬合程度更好;(2)根據(1)的選擇及表中數據,建立y關于x的回歸方程(回歸系數精確到0.01).附:相關系數rxy=.能力提升練 題組一 回歸直線方程及其應用1.下圖是某地區2010年至2019年污染天數y與年份x的折線圖,根據2010年至2014年的數據,2015年至2019年的數據,2010年至2019年的數據分別得到回歸直線方程=x+,=x+,=x+,則( )A.<<,<<B.<<,<<C.<<,<<D.<<,<<2.(多選)某企業實施節能降耗技術改造,在生產某產品的過程中記錄的產量x(噸)與相應的生產能耗y(噸)的幾組對應數據如表,現發現表中有個數據看不清,已知y關于x的回歸直線方程為=6x+8,則下列說法正確的是( )x 2 3 4 5 6y 19 25 38 44A.看不清的數據“ ”的值為34B.x,y具有正相關關系,相關系數r=6C.第三個樣本點對應的隨機誤差e3=2D.據此模型,產量為7噸時,相應的生產能耗約為50噸3.某機構統計了某市5個地區的外來務工人員數與他們選擇留在當地過年的人數占比,得到如下的表格:A區 B區 C區 D區 E區外來務工 人員數 5 000 4 000 3 500 3 000 2 500留在當地 過年的人 數占比 80% 90% 80% 80% 84%根據這5個地區的數據求得留在當地過年人數y與外來務工人員數x的回歸直線方程為=0.813 5x+.該市對外來務工人員中選擇留在當地過年的人員每人補貼1 000元,該市F區有10 000名外來務工人員,根據回歸直線方程估計F區需要給外來務工人員中選擇留在當地過年的人員的補貼總額為 萬元.(參考數據:0.813 5×36≈29.29) 4.某商場對A商品近30天的銷售情況進行整理,得到如下數據,經統計分析,日銷售量y(件)與時間t(天)之間具有線性相關關系.時間t(天) 2 4 6 8 10日銷售量y(件) 38 37 32 33 30(1)請根據表格提供的數據,用最小二乘法原理求出y關于t的回歸直線方程=t+;(2)已知A商品近30天內的日銷售價格z(元)與時間t(天)的關系式為z=(t∈N).根據(1)中求出的回歸直線方程,預測t為何值時,A商品的日銷售額最大.參考公式:回歸直線方程=t+中,=,=-.5.垃圾是人類日常生活和生產中產生的廢棄物,由于產出量大,成分復雜多樣,且具有污染性,所以需要進行無害化、減量化處理.某市為調查該市各地產生的垃圾數量,采用簡單隨機抽樣的方法抽取了20個縣城進行分析,得到樣本數據(xi,yi)(i=1,2,…,20),其中xi和yi分別表示第i個縣城的人口(單位:萬人)和該縣年垃圾產生總量(單位:萬噸),并計算得xi=80,yi=4 000,(xi-)2=80,(yi-)2=8 000,(xi-)(yi-)=700.(1)請用相關系數說明該組數據中y與x之間的關系可用一元線性回歸模型進行擬合(若|rxy|>0.8,則認為y與x之間高度相關,可用一元線性回歸模型擬合它們的關系);(2)求y關于x的回歸直線方程;(3)某科研機構研發了兩款垃圾處理機器,其中甲款機器每臺售價100萬元,乙款機器每臺售價80萬元,下表是以往兩款垃圾處理機器的使用年限統計表:使用年限 總計1年 2年 3年 4年甲款臺數 5 20 15 10 50乙款臺數 15 20 10 5 50根據以往經驗可知,某縣城環保機構每年可獲得政府補貼的垃圾處理費用為50萬元.僅考慮購買機器的成本和每臺機器的使用年限(使用年限均為整年),若該機構計劃購買其中一款垃圾處理機器,以使用年限的頻率估計概率,該機構選擇購買哪一款垃圾處理機器更劃算 參考公式:相關系數rxy=.在回歸直線方程=x+中,=,=-.題組二 非線性回歸分析6.某保險公司根據官方公布的2011—2020年的營業收入,制成表格如下:表1年份 2011 2012 2013 2014 2015年份 序號x 1 2 3 4 5營業 收入y (億元) 0.52 9.36 33.6 132 352年份 2016 2017 2018 2019 2020年份 序號x 6 7 8 9 10營業 收入y (億元) 571 912 1 207 1 682 2 135由表1,得到下面的散點圖:根據已有的函數知識,某同學選用二次函數模型y=bx2+a(b和a均為常數)來擬合y和x的關系.這時,可以令t=x2,得y=bt+a,由表1可得t與y的相關數據如表2.表2t 1 4 9 16 25y 0.52 9.36 33.6 132 352t 36 49 64 81 100y 571 912 1 207 1 682 2 135(1)根據表2中數據,建立y關于t的回歸直線方程(系數精確到個位數);(2)根據(1)中得到的回歸直線方程估計2023年的營業收入以及營業收入首次超過4 000億元的年份.參考公式:回歸直線方程=u+中,=,=-.參考數據:=38.5,≈703.45,≈1.051×104,(ti-)(yi-)≈2.327×105.答案與分層梯度式解析第4章 統計4.2 一元線性回歸模型4.2.1 回歸直線方程4.2.2 一元線性回歸模型的應用基礎過關練1.ABC 2.B 由題意得==26,==19,故樣本中心為(26,19),將(26,19)代入回歸直線方程得=12.5,所以=0.25x+12.5,把x=32代入,得=20.5,故隨機誤差為21.25-20.5=0.75.故選B.方法總結 回歸直線不一定過樣本點,但一定過樣本中心(,),常利用這一結論列方程求回歸直線方程中的系數.3.ABC ∵0.85>0,∴y與x具有正的線性相關關系,A正確;把x=168代入回歸直線方程得=57.09,故B正確;設當身高增加1 cm時,對應的體重的估計值為' kg,則'-=0.85(x+1)-85.71-0.85x+85.71=0.85,C正確;當x=170時,=0.85×170-85.71=58.79,故體重的估計值為58.79 kg,D錯誤.故選ABC.4.答案 26解析 由題意得==4,由于回歸直線必過樣本中心(,),所以=2+18=2×4+18=26,故這5名兒童的平均體重是26 kg.5.解析 (1)由題表中數據可得==3,==72,故===21,=-=72-21×3=9,所以=21x+9.(2)當x=7時,=21×7+9=156,所以估計該地區2022年共有新能源汽車300 000×=46 800(輛).6.解析 (1)易得=×(9+9.5+10+10.5+11)=10,=×(11+10+8+6+5)=8,所以===-3.2,=-=8-(-3.2)×10=40,所以y關于x的回歸直線方程為=-3.2x+40.(2)當x=8時,=-3.2×8+40=14.4,則|-y6|=|14.4-15|=0.6<0.65,故可以認為(1)中所得到的回歸直線方程是理想的.7.D 設y的增加量為Δy=y2-y1,x的增加量為Δx=x2-x1,可得Δy=2lg x2-2lg x1=2lg =2,解得=10,故要使得y增加2個單位,x應增加到原來的10倍.8.答案 解析 由z=ln y,得ln =2x+0.5,所以=e2x+0.5=e0.5·e2x,所以c=e0.5=.9.解析 (1)y=dln x+c更適合刻畫x,y之間的關系.理由:由題表中的數據可知,x的值每增加1,函數值y的增加量分別為7,4,3,2,增加得越來越緩慢,符合對數函數型模型的增長規律,與一元線性回歸模型的均勻增長存在較大差異,故y=dln x+c更適合刻畫x,y之間的關系.(2)令z=ln x,由題意得===14.6,所以=≈=10,=-=14.6-10×0.96=5,所以y關于z的回歸直線方程為=10z+5,所以y關于x的回歸方程為=10ln x+5.當x=6時,日銷售額為10ln 6+5≈23(萬元).10.解析 (1)若選擇模型①y=α+βx2,由題意知ui=,則y與u的相關系數ruy==≈0.87.若選擇模型②y=eλx+t,由題意知vi=ln yi,則v與x的相關系數rxv===≈0.92,因為0.87<0.92,所以從相關系數的角度分析,模型y=eλx+t的擬合程度更好.(2)由y=eλx+t得ln y=λx+t,即v=λx+t.==≈0.18,=-=5.36-×26=0.56,故v關于x的回歸直線方程為=0.18x+0.56,故ln =0.18x+0.56,即=e0.18x+0.56,故y關于x的回歸方程為=e0.18x+0.56.能力提升練1.C 由題中統計圖可知2010年至2014年,y隨著x的增加平緩下降,2015年至2019年,y隨著x的增加迅速下降,根據回歸直線方程=x+中,的幾何意義可知,>,<<0,由題圖中點的分布可知,∈(,),∈(,),所以<<,<<.故選C.2.ACD 對于A,易得==4,由回歸直線必過樣本中心(,),得=6+8=32,則“ ”=32×5-(19+25+38+44)=34,A正確;對于B,由回歸直線方程及題表中數據知,x,y具有正相關關系,但相關系數的絕對值不超過1,B錯誤;對于C,第三個樣本點對應的隨機誤差e3=y3-=34-(6×4+8)=2,C正確;對于D,x=7時,=6×7+8=50(噸),D正確.故選ACD.3.答案 818.6解析 由題意得,==3 600,=×(5 000×0.8+4 000×0.9+3 500×0.8+3 000×0.8+2 500×0.84)=2 980,因為回歸直線一定過樣本中心(,),所以2 980=0.813 5×3 600+,解得≈51,即=0.813 5x+51.當x=10 000時,=0.813 5×10 000+51=8 186,所以估計補貼總額為8 186×0.1=818.6(萬元).4.解析 (1)根據題意得=×(2+4+6+8+10)=6,=×(38+37+32+33+30)=34,=22+42+62+82+102=220,tiyi=2×38+4×37+6×32+8×33+10×30=980,所以===-1,=-=34-(-1)×6=40,故y關于t的回歸直線方程為=-t+40.(2)設日銷售額為L元,則L=當0當20≤t≤30,t∈N時,L=(-t+100)(-t+40)=t2-140t+4 000=(t-70)2-900,易知當t=20時,L取得最大值,且Lmax=1 600.綜上所述,當t=20時,Lmax=1 600,所以估計t=20時,A商品的日銷售額最大,為1 600元.5.解析 (1)由題意知,相關系數rxy====0.875.因為|0.875|>0.8,所以y與x之間高度相關,可用一元線性回歸模型進行擬合.(2)由題意可得,===8.75,=-=-8.75×=200-8.75×4=165,所以=8.75x+165.(3)設該機構購買一臺甲款垃圾處理機器抵消政府補貼后的垃圾處理費用為X萬元,則X的分布列為X -50 0 50 100P 0.1 0.4 0.3 0.2則E(X)=-50×0.1+0×0.4+50×0.3+100×0.2=30.設該機構購買一臺乙款垃圾處理機器抵消政府補貼后的垃圾處理費用為Y萬元,則Y的分布列為Y -30 20 70 120P 0.3 0.4 0.2 0.1則E(Y)=-30×0.3+20×0.4+70×0.2+120×0.1=25.因為E(X)>E(Y),所以該機構選擇購買甲款垃圾處理機器更劃算.6.解析 (1)易得=≈≈22,=-≈703.45-22×38.5≈-144,故y關于t的回歸直線方程為=22t-144.(2)2023年對應的t的值為169,故該年的營業收入為=22×169-144=3 574(億元),所以估計2023年的營業收入為3 574億元.依題意,有22t-144>4 000,解得t>188.4,即x2>188.4.因為13<<14,所以估計營業收入首次超過4 000億元的年份序號為14,即2024年. 展開更多...... 收起↑ 資源列表 4.2 一元線性回歸模型.docx 4.2 一元線性回歸模型.pptx 縮略圖、資源來源于二一教育資源庫