資源簡介 (共58張PPT)7.1一元線性回歸在現實生活中,反映量與量之間的函數關系非常普遍,但也存在一些量與量之間不滿足函數關系,如人的身高與體重.一般說來,人的身高越高,體重就越重,二者確實有關系.但是身高相同的人,體重卻不一定相同,也就是說,給定身高h沒有唯一的體重m與之對應.在現實生活中,這樣的例子還有很多,如人的年齡與血壓、農作物的施肥量與產量等.實例分析1.1直線擬合為了了解人的身高與體重的關系,我們隨機抽取9名15歲的男生,測得他們的身高(單 位:cm)、體重(單位:kg)如表7-1:表7-1編號 1 2 3 4 5 6 7 8 9身高/cm 165 157 155 175 168 157 178 160 163體重/kg 52 44 45 55 54 47 62 50 53從表7-1中不難看出,同一身高157 cm對應著不同的體重44 kg和47 kg,即體重不是身高的函數.如果把身高看作橫坐標、體重看作縱坐標,在平面直角坐標系中畫出對應的點(如圖7 - 1),就會發現,隨著身高的增長,體重基本上呈現直線增加的趨勢.1.在圖7-1中,每個點對應的一對數據(xi, yi ),稱為成對數據.這些點構成的圖稱為散點圖.2.從散點圖上可以看出,如果變量之間存在著某種關系,這些點會有一個大致趨勢,這種趨勢通常可以用一條光滑的曲線來近似地描述.這樣近似描述的過程稱為曲線擬合。3.若在兩個變量x和y的散點圖中,所有點看上去都在一條直線附近波動,此時就可以用一條直線 來近似地描述這兩個量之間的關系,稱之為直線擬合.那么,應當如何求出這條直線呢?方法1 選取散點圖中的兩個點,使得其余的點在這兩個點所連直線兩側分布得盡可能一樣多,如有人選取了(165,52)和(168,54)這兩個成對數據,得到直線方程為2x-3y-174 = 0.因此,一個身高166 cm的15歲男生,他的體重大致為52.667kg.方法2 將所有的點分成兩部分,一部分是身高在165 cm以下的,一部分是身高在 165 cm以上(含165 cm)的;然后每部分的點求一個平均點:165cm以下的身高、體重的平均數(取整近似)作為一個平均點,即(158,48),165 cm以上(含165 cm)的身高、體重的平均數(取整近似)作為另一個平均點,即(172,56);最后將這兩點連接成一條直線,得到直線方程為4x-7y-296 = 0,因此,一個身高166 cm的15歲男生,他的體重大致為52.571 kg.上面兩種方法都有一定的道理.用方法1,若x=175 cm,則可計算 y≈58.667 kg;用方法2,若x=175 cm,則可計算y≈714 kg.每一種方法均與實際觀測值有偏差.在實際應 用時,我們通常選擇本章第1.2節中介紹的方法進行處理.散點圖說明1.定義:將兩個變量所對應的點在平面直角坐標系中描出來, 這些點就組成了變量之間的一個圖, 這種圖叫散點圖.2.散點圖的畫法:把成對的兩個變量分別作為橫坐標和縱坐標, 把每對數值對應的點在平面直角坐標系中畫出來.3.散點圖的作用:(1)從散點圖可以看出, 如果變量之間存在某種關系, 這些點會有一個集中的大致趨勢, 這種趨勢通常可以用一條光滑的曲線來近似, 這樣近似的過程稱為曲線擬合.若如果變量x和y的散點圖中, 所有點看上去都在一條直線附近波動, 則稱變量間是線性相關的.此時, 我們可用一條直線來近似.xyo(2)若所有點看上去都在某條曲線(不是一條直線)附近波動, 則稱此相關為非線性相關的.此時, 我們可用一條曲線來擬合.如果所有的點在散點圖中沒有顯示任何關系, 則稱變量間是不相關的.xyoxyo例2.一般來說, 一個人的身高越高, 他的右手就越大, 相應地, 他的右手一拃長就越長, 因此, 人的身高與右手一拃長之間存在著一定的關系. 為了對這個問題進行調查, 我們收集了某中學2003年高三年級96名學生的身高與右手一拃長的數據如表.(P48)(1)根據表中的數據, 制成散點圖. 你能從散點圖中發現身高與右手一拃長之間的近似關系嗎 o身高/cm右手一拃長/cm15015516016517017518018519019510152025女生男生4.例題與練習例2.一般來說, 一個人的身高越高, 他的右手就越大, 相應地, 他的右手一拃長就越長, 因此, 人的身高與右手一拃長之間存在著一定的關系. 為了對這個問題進行調查, 我們收集了某中學2003年高三年級96名學生的身高與右手一拃長的數據如表.(P48)(2)如果近似成線性關系, 請畫出一條直線來近似地表示這種線性關系.女生男生o身高/cm右手一拃長/cm15015516016517017518018519019510152025(3)如果一個學生的身高是188cm, 你能估計他的右手一拃長大概有多長嗎 18821例2.一般來說, 一個人的身高越高, 他的右手就越大, 相應地, 他的右手一拃長就越長, 因此, 人的身高與右手一拃長之間存在著一定的關系. 為了對這個問題進行調查, 我們收集了某中學2003年高三年級96名學生的身高與右手一拃長的數據如表.(P48)(2)如果近似成線性關系, 請畫出一條直線來近似地表示這種線性關系.o身高/cm右手一拃長/cm15015516016517017518018519019510152025(3)如果一個學生的身高是188cm, 你能估計他的右手一拃長大概有多長嗎 18822 平均點例2.一般來說, 一個人的身高越高, 他的右手就越大, 相應地, 他的右手一拃長就越長, 因此, 人的身高與右手一拃長之間存在著一定的關系. 為了對這個問題進行調查, 我們收集了某中學2003年高三年級96名學生的身高與右手一拃長的數據如表.(P48)(2)如果近似成線性關系, 請畫出一條直線來近似地表示這種線性關系.o身高/cm右手一拃長/cm15015516016517017518018519019510152025(3)如果一個學生的身高是188cm, 你能估計他的右手一拃長大概有多長嗎 18822.7例.一般來說, 一個人的身高越高, 他的右手就越大, 相應地, 他的右手一拃長就越長, 因此, 人的身高與右手一拃長之間存在著一定的關系. 為了對這個問題進行調查, 我們收集了某中學2003年高三年級96名學生的身高與右手一拃長的數據如表.(P48)(3)如果一個學生的身高是188cm, 你能估計他的右手一拃長大概有多長嗎 o身高/cm右手一拃長/cm16018.016218016616817017217417617816418218.519.019.520.020.521.021.5(2)如果近似成線性關系, 請畫出一條直線來近似地表示這種線性關系.例1 某種木材體積與樹木的樹齡之間有如下的對應關系:(1)請作出這些數據的散點圖;樹齡 2 3 4 5 6 7 8體積 30 34 40 60 55 62 70解 以x軸表示樹木的樹齡,y軸表示樹木的體積,可得相應的散點圖如圖所示:(2)你能由散點圖發現木材體積與樹木的樹齡近似成什么關系嗎?解 由散點圖發現木材體積隨著樹齡的增加而呈增加的趨勢,且散點落在一條直線附近,所以木材的體積與樹齡成線性關系.練習: 以下四個散點圖中,兩個變量的關系適合用直線擬合描述的是( )A.①② B.①③ C.②③ D.③④解析 ①③中的點分布在一條直線附近,適合直線擬合描述.B例2 某品牌服裝的廣告費支出x(單位:萬元)與銷售額y(單位:萬元)之間有如下的對應數據:廣告費支出x 2 4 6 8 10銷售額y 64 138 205 285 360(1)試畫出散點圖,并判斷廣告費支出x與銷售額y是否具有線性相關關系;(2)若取過點(2,64)和點(8,285)的直線作為擬合直線,試預測當x=10和15時銷售額y的值是多少?(結果保留一位小數)解 (1)根據題中數據畫出散點圖如圖觀察散點圖,可以發現5個樣本點從整體上看大致在一條直線附近,所以變量x,y之間具有線性相關關系.(2)過點(2,64)和點(8,285)的直線方程是221x-6y-58=0.令x=10,則221×10-6y-58=0,∴ y≈358.7;令x=15,則221×15-6y-58=0,∴ y≈542.8,即當x=10時,銷售額y的值大約是358.7萬元;當x=15時,銷售額y的值大約是542.8萬元.反思 利用擬合直線進行預測時應注意的問題(1)首先要理解線性相關和擬合直線方程的意義.(2)利用擬合直線方程求得的預測值只是實際問題的一個估計值,因此在回答結論時不能說成是準確值,而只能用“大約”等詞來回答.1.2 一元線性回歸方程對于給定的兩個變量x和y(如身高和體重),可以把其成對的觀測值(x1,y1),(x2,y2),…,(xn,yn)表示為平面直角坐標系中的n個點.現在希望找到一條直線Y = a +bX,使得對每一個xi(i=1,2, …,n),由這個直線方程計算出來的值a+bi與實際觀測值yi的差異盡可能小.為此,希望[y1-(a+b1)]2+[y2-(a+b2)]2+…+[yn-(a+bn)]2達到最小.換句話說,我們希望a,b的取值能使上式達到最小.這個方法稱為最小二乘法.為了直觀起見,先考慮3對數據(x1,y1),(x2,y2),(x3,y3),即:求a,b的值,使得偏差yi-(a+bi)(i= 1,2,3)的平方和最小,即[y1-(a+b1)]2+[y2-(a+b2)]2+[y3-(a+b3)]2達到最小.下面我們用向量的方法解決這個問題.首先,用向量的語言描述問題.要用向量的語言描述偏差yi-(a+bi)(i= 1,2,3),容易想到將偏差作為向量的分量, 即向量的坐標(y1-(a+b1),y2-(a+b2),y3-(a+b3)).這樣,問題就等價于:求的a,b值,使得向量(y1-(a+b1),y2-(a+b2),y3-(a+b3))的長度最小.在這里需要強調的是:身高和體重之間并沒有函數關系,我們得到的線性回歸方程只是對其變化趨勢的一種近似描述.對一個給定身高的人,人們可以用這個方程來估計這個人的體重,這是十分有意義的.…………………①先來討論3個樣本點的情況補充:怎樣使達到最小值?函數法求線性回歸方程:利用配方法可得同樣使用配方法可以得到,當假設我們已經得到兩個具有相關關系的變量的一組數據且回歸方程是:y=bx+a,^其中,a,b是待定參數。當變量x取 時它與實際收集到的 之間的偏差是oxywww.*易知,截距 和斜率 分別是使取最小值時 的值。由于這正是我們所要推導的公式。在上式中,后兩項和 無關,而前兩項為非負數,因此要使Q取得最小值,當且僅當前兩項的值均為0,即有**用同樣的方法我們可以推導出n個點的線性回歸方程的系數:牢記公式1、所求直線方程叫做回歸直線方程;相應的直線叫做回歸直線。2、對兩個變量進行的線性分析叫做線性回歸分析。回歸直線方程最小二乘法:稱為樣本點的中心。www.2、求回歸直線方程的步驟:(3)代入公式(4)寫出直線方程為y=bx+a,即為所求的回歸直線方程。^例1 在本章1.1節的練習中,從散點圖可以看出,某小賣部6天賣出熱茶的杯數Y(單位:杯)與當天氣溫X(單位:°C)之間存在近似的線性關系.數據如表7-2.(1)試用最小二乘法求岀Y關于X的線性回歸方程;(2)如果某天的氣溫是-3℃,請預測這天可能會賣出熱茶多少杯.1.思考辨析(正確的畫“√”,錯誤的畫“×”)(1)利用散點圖可以直觀判斷兩個變量的關系是否可以用線性表示.( )(2)線性回歸方程適用于一切樣本和總體.( )(3)線性回歸方程一般都有局限性.( )(4)線性回歸方程一定過樣本中的某一點.( )√×√×鞏固提升2.如果記錄了x,y的幾組數據分別為(0,1),(1,3),(2,5),(3,7),那么y關于x的線性回歸直線必過點( )A.(2,2) B.(1.5,2) C.(1,2) D.(1.5,4)答案:D3.隨機抽樣中測得四個樣本點為(1,2),(2,3),(3,4),(4,5),則y與x之間的線性回歸方程為( )A.y=x+1 B.y=x+2C.y=2x+1 D.y=x-1答案:A例3 在本章1.1節的練習中,從散點圖可以看出,某小賣部6天賣出熱茶的杯數Y(單位:杯)與當天氣溫X(單位:°C)之間存在近似的線性關系.數據如表7-2.(1) 試用最小二乘法求岀Y關于X的線性回歸方程;(2) 如果某天的氣溫是-3℃,請預測這天可能會賣出熱茶多少杯.解(1)從散點圖7-6中可以看岀,表7-2中的兩個變量有近似的線性關系.例4 某項研究發現某地的PM10濃度與車流量之間有線性相關關系.現采集到該地一周內車流量x與PM10濃度y的數據如下表:時間 車流量x(單位:萬輛) PM10濃度y(單位:μg/m3)星期一 25.4 35.7星期二 24.6 34.5星期三 23.5 35.2星期四 24.4 33.6星期五 25.8 36.1星期六 19.7 30.9星期日 20.3 29.4解析:(1)如圖所示.月份代碼t 1 2 3 4 5 6 7銷售量y(萬件) y1 y2 y3 y4 y5 y6 y7例5 某地區2013年至2019年農村居民家庭人均純收入Y(單位:千元)的數據如下表:(1)求Y關于T的線性回歸方程;年份 2013 2014 2015 2016 2017 2018 2019年份代號T 1 2 3 4 5 6 7人均純收入Y 2.9 3.3 3.6 4.4 4.8 5.2 5.9解 由所給數據計算得=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,所求線性回歸方程為Y=0.5T+2.3.(2)利用(1)中的線性回歸方程,分析2013年至2019年該地區農村居民家庭人均純收入的變化情況,并預測該地區2022年農村居民家庭人均純收入.解 由(1)知, =0.5>0,故2013年至2019年該地區農村居民家庭人均純收入逐年增加,平均每年增加0.5千元.將2022年的年份代號代入(1)中的線性回歸方程,得0.5×10+2.3=7.3,故預測該地區2022年農村居民家庭人均純收入為7.3千元.反思感悟 (1)解決問題時應首先對X,Y進行相關性檢驗,如果兩個變量之間本身不具有相關關系或者它們之間的相關關系不顯著,即使求出線性回歸方程進行估計和預測的量也是不可信的.x 0 1 2 3y 1 3 5 7D1.已知x,y之間的一組數據如下表,則y與x的線性回歸方程y=a+bx必經過點 ( )A.(2,2) B.(1.5,0) C.(1,2) D.(1.5,4)AA4.某連鎖經營公司所屬5個零售店某月的銷售額和利潤額資料如下表:(1)畫出銷售額和利潤額的散點圖.(2)若銷售額和利潤額具有相關關系,計算利潤額y對銷售額x的線性回歸方程.商店名稱 A B C D E銷售額(x)/千萬元 3 5 6 7 9利潤額(y)/百萬元 2 3 3 4 5i xi yi xi2 xiyi1 3 2 9 62 5 3 25 153 6 3 36 184 7 4 49 285 9 5 81 45合計 30 17 200 112(2)數據如下表:可以求得b=0.5,a=0.4線性回歸方程為:/千萬元解:(1)/百萬元(1)散點圖如圖所示:2.線性回歸方程的系數:1.最小二乘法的思想. 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫