資源簡介 9.1.2 線性回歸方程(強基課——梯度進階式教學)課時目標1.結合具體實例,了解線性回歸模型的含義,了解模型參數的統計意義,了解最小二乘原理,掌握線性回歸模型參數的最小二乘法.2.針對實際問題,會用線性回歸模型進行預測.1.隨機誤差具有線性相關關系的兩個變量的取值x,y,y的值不能由x確定,在此,我們將兩者之間的關系表示為y=a+bx+ε,其中 是確定性函數, 稱為隨機誤差. 2.隨機誤差產生的主要原因(1)所用的 不恰當引起的誤差; (2)忽略了 ; (3)存在 誤差. 3.線性回歸模型中a,b值的求法將y= 稱為線性回歸模型. a,b的估計值為,,則其中=xi,=yi.4.回歸直線和線性回歸方程直線=+x稱為回歸直線,此直線方程稱為線性回歸方程,其中稱為 ,稱為 ,稱為 . [基點訓練]1.判斷正誤(正確的劃“√”,錯誤的劃“×”)(1)在線性回歸模型中,ε是bx+a預報真實值y的隨機誤差,它是一個可觀測的量. ( )(2)用最小二乘法求出的可能是正的,也可能是負的. ( )(3)隨機誤差平方和越大,線性回歸模型的擬合效果越好. ( )(4)線性回歸方程=x+必過點(,). ( )2.用最小二乘法得到一組數據(xi,yi)(i=1,2,3,4,5,6)的線性回歸方程為=2x+3,若xi=30,則yi= ( )A.11 B.13C.63 D.783.某醫學科研所對人體脂肪含量與年齡這兩個變量研究得到一組隨機樣本數據,運用Excel軟件計算得=0.577x-0.448(x為人的年齡,y為人體脂肪含量).對年齡為37歲的人來說,下面說法正確的是 ( )A.年齡為37歲的人體脂肪含量一定為20.90B.年齡為37歲的人體脂肪含量約為21.01C.年齡為37歲的人群中的人體脂肪含量平均為20.90D.年齡為37歲的人群中的大部分人的人體脂肪含量約為31.5題型(一) 回歸方程與樣本中心[例1] 為了研究某班學生的腳長x(單位:厘米)和身高y(單位:厘米)的關系,從該班隨機抽取10名學生,根據測量數據的散點圖可以看出y與x之間有線性相關關系,設其線性回歸方程為=x+.已知xi=225,yi=1 600,=4,該班某學生的腳長為24,據此估計其身高為 ( )A.162 B.166C.170 D.174聽課記錄:[思維建模]已知線性回歸方程=x+,有以下結論(1)表示x每增加1個單位,y的平均變化量,>0為正相關,<0為負相關.(2)回歸直線過樣本中心點(,),其他測量值不一定滿足方程.(3)由方程得到的值為預測值,有一定的偏差,但有一定的指導作用. [針對訓練]1.已知變量x和y的統計數據如表:x 1 2 3 4 5y 6 6 7 8 8根據上表可得線性回歸方程為=0.6x+,據此可以預測當x=8時,= ( )A.8.5 B.9C.9.5 D.102.[多選]根據某班學生的物理成績y,數學成績x,得到y與x具備線性相關關系,并求得其線性回歸方程為=22.05+0.625x,則下列說法正確的是 ( )A.x與y正相關,說明數學成績優秀對物理的學習有一定的促進作用B.某同學數學考了96分,可以預測他的物理成績約為82分C.某同學數學因為其他原因沒考,則他物理能考22.05分D.數學每提高1分,物理大約會提高0.625分題型(二) 求線性回歸方程[例2] 全球新能源汽車產量呈上升趨勢.以下為2018~2023年全球新能源汽車的銷售量情況統計.年份 2018 2019 2020 2021 2022 2023年份編號x 1 2 3 4 5 6銷售量y/ 百萬輛 2.02 2.21 3.13 6.70 10.80 14.14若y與x的相關關系擬用線性回歸模型表示,回答如下問題:(1)求變量y與x的相關系數r(結果精確到0.01);(2)求y關于x的線性回歸方程,并據此預測2025年全球新能源汽車的銷售量.參考數據:xiyi=181.30,=380.231,≈4.2, ≈11.2.聽課記錄:[思維建模]1.求線性回歸方程的基本步驟(1)列出散點圖,從直觀上分析數據間是否存在線性相關關系;(2)計算:xiyi;(3)代入公式求出=x+中參數,的值;(4)寫出線性回歸方程并對實際問題作出估計.[注意] 只有在散點圖大致呈線性相關關系時,求出的線性回歸方程才有實際意義,否則求出的線性回歸方程毫無意義.2.使用線性回歸方程進行預測時,需注意以下問題(1)線性回歸方程只適用于所研究的樣本的總體.(2)線性回歸方程一般都有時效性.(3)自變量的取值不能離樣本數據的范圍太遠,一般自變量的取值在樣本數據范圍內. [針對訓練]3.市場調查員小王統計了某款拖把的銷售單價x(單位:元)與月銷量y(單位:個)之間的一組數據如下表所示:單價x/元 18 19 20 21 22月銷量y/個 570 520 420 320 270(1)根據以往經驗,y與x具有線性相關關系,求y關于x的線性回歸方程;(2)若這款拖把的進貨價為14元/個,根據(1)中回歸方程,求該拖把月利潤最大時拖把的單價為多少元.(結果精確到0.1元)題型(三) 求非線性回歸方程[例3] 某大型現代化農場在種植某種大棚有機無公害的蔬菜時,為創造更大價值,提高畝產量,積極開展技術創新活動,該農場采用了延長光照時間的方案,選取了20間大棚(每間一畝)進行試點,得到各間大棚產量數據并繪制成散點圖.光照時長為x(單位:小時),大棚蔬菜產量為y(單位:千斤/每畝),記w=ln x.(1)根據散點圖判斷,y=a+bx與y=c+dln x,哪一個適宜作為大棚蔬菜產量y關于光照時長x的回歸方程類型(給出判斷即可,不必說明理由);(2)根據(1)的判斷結果及表中數據,建立y關于x的回歸方程(結果保留小數點后兩位);(3)根據實際種植情況,發現上述回歸方程在光照時長位于6~14小時內擬合程度良好,利用(2)中所求方程估計當光照時長為e2小時時(e為自然對數的底數),大棚蔬菜畝產量約為多少.參考數據:聽課記錄:[思維建模] 非線性回歸問題的解題步驟(1)根據原始數據作出散點圖;(2)根據散點圖選擇恰當的擬合函數;(3)作恰當的變換,將其轉化成線性回歸方程求解;(4)在上面的基礎上通過相應的變換,即可得非線性回歸方程. [針對訓練]4.紅蜘蛛是柚子的主要害蟲之一,能對柚子樹造成嚴重傷害,每只紅蜘蛛的平均產卵數y(個)和平均溫度x(℃)有關,現收集了以往某地的7組數據,得到下面的散點圖及一些統計量的值.參考數據(z=ln y)5 215 17 713 714 27 81.3 3.6(1)根據散點圖判斷,y=bx+a與y=cedx(其中e=2.718…為自然對數的底數)哪一個更適合作為平均產卵數y(個)關于平均溫度x(℃)的回歸方程類型;(給出判斷即可,不必說明理由)(2)由(1)的判斷結果及表中數據,求出y關于x的回歸方程.(計算結果精確到0.1)9.1.2 線性回歸方程 課前環節1.a+bx ε 2.(1)確定性函數 (2)某些因素的影響 (3)觀測 3.a+bx+ε - 4.回歸截距 回歸系數 回歸值[基點訓練]1.(1)× (2)√ (3)× (4)√2. 選D 依題意,因為xi=30,所以==5,因為線性回歸方程=2x+3一定過點(),所以=2+3=2×5+3=13,所以yi=6×13=78.3.選C 當x=37時,=0.577×37-0.448=20.901≈20.90,由此估計,年齡為37歲的人群中的人體脂肪含量平均為20.90. 課堂環節[題型(一)][例1] 選B 根據題意,得=xi=×225=22.5,=yi=×1 600=160,=4,由(22.5,160)在=x+上,得160=4×22.5+,即=70,故=4x+70,令x=24,得=4×24+70=166,即該學生身高約為166 cm.[針對訓練]1.選D ==3,==7,則7=0.6×3+,∴=5.2,∴=0.6x+5.2,∴當x=8時,預測=0.6×8+5.2=10.故選D.2.選ABD 因為=22.05+0.625x,0.625>0,所以x與y正相關,A正確;將x=96代入方程,得約為82,B正確;用數學成績預測物理成績時,應用正常情況下的數學成績,故C錯誤;由的意義易知D正確.[題型(二)][例2] 解: (1)因為==3.5,==6.5,所以-6=1+4+9+16+25+36-6×12.25=17.5, -6=380.231-6×6.52=126.731,所以r==≈≈0.95.(2)由題意得===2.56,所以=-=6.5-3.5×2.56=-2.46,得y關于x的線性回歸方程為=2.56x-2.46,所以可以預測2025年全球新能源汽車的銷售量為2.56×8-2.46=18.02百萬輛.[針對訓練]3.解: (1)由表中數據得=×(18+19+20+21+22)=20,=×(570+520+420+320+270)=420,∴====-80,∴=-=420+80×20=2 020,故y關于x的線性回歸方程為=-80x+2 020.(2)設每月的總利潤為Q,則Q(x)=(-80x+2 020)(x-14)=-80x2+3 140x-28 280,∵拋物線y=Q(x)的對稱軸方程為x==19.625≈19.6,∴該拖把月利潤最大時,拖把的單價約為19.6元.[題型(三)][例3] 解:(1)根據散點圖,開始的點在某條直線旁,但后面的點會越來越偏離這條直線,因此y=c+dln x更適宜作為大棚蔬菜產量y關于光照時長x的回歸方程類型.(2)記w=ln x,則y=c+dw,===5.12,===2.6,==≈3.26,=-=5.12-3.26×2.6≈-3.36,所以=3.26w-3.36,即=3.26ln x-3.36.(3)當x=e2時,=3.26ln e2-3.36=3.16,即大棚蔬菜畝產量約為3.16千斤.[針對訓練]4.解: (1)由散點圖可以判斷,隨溫度升高,產卵數增長速度變快,符合指數函數模型的增長,所以y=cedx更適宜作為平均產卵數y關于平均溫度x的回歸方程類型.(2)將y=cedx兩邊同時取自然對數,可得ln y=ln c+dx,令z=ln y,由題中的數據可得,xizi-7 =33.6,-7=112,所以===0.3,則ln c=-=3.6-0.3×27=-4.5,所以z關于x的線性回歸方程為z=0.3x-4.5,故y關于x的回歸方程為y=e0.3x-4.5.6 / 7(共62張PPT)9.1.2線性回歸方程(強基課——梯度進階式教學)課時目標1.結合具體實例,了解線性回歸模型的含義,了解模型參數的統計意義,了解最小二乘原理,掌握線性回歸模型參數的最小二乘法.2.針對實際問題,會用線性回歸模型進行預測.CONTENTS目錄123課前環節/預知教材·自主落實主干基礎課堂環節/題點研究·遷移應用融會貫通課時跟蹤檢測課前環節/預知教材·自主落實主干基礎1.隨機誤差具有線性相關關系的兩個變量的取值x,y,y的值不能由x確定,在此,我們將兩者之間的關系表示為y=a+bx+ε,其中 是確定性函數,稱為隨機誤差.2.隨機誤差產生的主要原因(1)所用的 不恰當引起的誤差;(2)忽略了 ;(3)存在 誤差.a+bx某些因素的影響確定性函數ε觀測3.線性回歸模型中a,b值的求法將y= 稱為線性回歸模型.a,b的估計值為,則其中= xi,= yi.a+bx+ε4.回歸直線和線性回歸方程直線=+x稱為回歸直線,此直線方程稱為線性回歸方程,其中稱為 ,稱為 ,稱為 .回歸截距回歸系數回歸值1.判斷正誤(正確的劃“√”,錯誤的劃“×”)(1)在線性回歸模型中,ε是bx+a預報真實值y的隨機誤差,它是一個可觀測的量. ( )(2)用最小二乘法求出的可能是正的,也可能是負的. ( )(3)隨機誤差平方和越大,線性回歸模型的擬合效果越好. ( )(4)線性回歸方程=x+必過點(). ( )基點訓練×√×√2.用最小二乘法得到一組數據(xi,yi)(i=1,2,3,4,5,6)的線性回歸方程為=2x+3,若 xi=30,則 yi=( )A.11 B.13 C.63 D.78解析:依題意,因為 xi=30,所以==5,因為線性回歸方程=2x+3一定過點(),所以=2+3=2×5+3=13,所以 yi=6×13=78.√3.某醫學科研所對人體脂肪含量與年齡這兩個變量研究得到一組隨機樣本數據,運用Excel軟件計算得=0.577x-0.448(x為人的年齡,y為人體脂肪含量).對年齡為37歲的人來說,下面說法正確的是( )A.年齡為37歲的人體脂肪含量一定為20.90B.年齡為37歲的人體脂肪含量約為21.01C.年齡為37歲的人群中的人體脂肪含量平均為20.90D.年齡為37歲的人群中的大部分人的人體脂肪含量約為31.5√解析:當x=37時,=0.577×37-0.448=20.901≈20.90,由此估計,年齡為37歲的人群中的人體脂肪含量平均為20.90.課堂環節/題點研究·遷移應用融會貫通題型(一) 回歸方程與樣本中心[例1] 為了研究某班學生的腳長x(單位:厘米)和身高y(單位:厘米)的關系,從該班隨機抽取10名學生,根據測量數據的散點圖可以看出y與x之間有線性相關關系,設其線性回歸方程為=x+.已知 xi=225,yi=1 600,=4,該班某學生的腳長為24,據此估計其身高為( )A.162 B.166C.170 D.174√解析:根據題意,得= xi=×225=22.5,= yi=×1 600=160,=4,由(22.5,160)在=x+上,得160=4×22.5+,即=70,故=4x+70,令x=24,得=4×24+70=166,即該學生身高約為166 cm.[思維建模]已知線性回歸方程=x+,有以下結論(1)表示x每增加1個單位,y的平均變化量,>0為正相關,<0為負相關.(2)回歸直線過樣本中心點(),其他測量值不一定滿足方程.(3)由方程得到的值為預測值,有一定的偏差,但有一定的指導作用.針對訓練1.已知變量x和y的統計數據如表:根據上表可得線性回歸方程為=0.6x+,據此可以預測當x=8時,=( )A.8.5 B.9C.9.5 D.10√x 1 2 3 4 5y 6 6 7 8 8解析:==3,==7,則7=0.6×3+,∴=5.2,∴=0.6x+5.2,∴當x=8時,預測=0.6×8+5.2=10.故選D.2.[多選]根據某班學生的物理成績y,數學成績x,得到y與x具備線性相關關系,并求得其線性回歸方程為=22.05+0.625x,則下列說法正確的是( )A.x與y正相關,說明數學成績優秀對物理的學習有一定的促進作用B.某同學數學考了96分,可以預測他的物理成績約為82分C.某同學數學因為其他原因沒考,則他物理能考22.05分D.數學每提高1分,物理大約會提高0.625分√√√解析:因為=22.05+0.625x,0.625>0,所以x與y正相關,A正確;將x=96代入方程,得約為82,B正確;用數學成績預測物理成績時,應用正常情況下的數學成績,故C錯誤;由的意義易知D正確.題型(二) 求線性回歸方程[例2] 全球新能源汽車產量呈上升趨勢.以下為2018~2023年全球新能源汽車的銷售量情況統計.若y與x的相關關系擬用線性回歸模型表示,回答如下問題:年份 2018 2019 2020 2021 2022 2023年份編號x 1 2 3 4 5 6銷售量y/ 百萬輛 2.02 2.21 3.13 6.70 10.80 14.14(1)求變量y與x的相關系數r(結果精確到0.01);參考數據: xiyi=181.30, =380.231,≈4.2, ≈11.2.解:因為==3.5,==6.5,所以 -6=1+4+9+16+25+36-6×12.25=17.5, -6=380.231-6×6.52=126.731,所以r==≈≈0.95.(2)求y關于x的線性回歸方程,并據此預測2025年全球新能源汽車的銷售量.解:由題意得= ==2.56,所以=-=6.5-3.5×2.56=-2.46,得y關于x的線性回歸方程為=2.56x-2.46,所以可以預測2025年全球新能源汽車的銷售量為2.56×8-2.46=18.02百萬輛. [思維建模]1.求線性回歸方程的基本步驟(1)列出散點圖,從直觀上分析數據間是否存在線性相關關系;(2)計算: xiyi;(3)代入公式求出=x+中參數的值;(4)寫出線性回歸方程并對實際問題作出估計.[注意] 只有在散點圖大致呈線性相關關系時,求出的線性回歸方程才有實際意義,否則求出的線性回歸方程毫無意義.2.使用線性回歸方程進行預測時,需注意以下問題(1)線性回歸方程只適用于所研究的樣本的總體.(2)線性回歸方程一般都有時效性.(3)自變量的取值不能離樣本數據的范圍太遠,一般自變量的取值在樣本數據范圍內.針對訓練3.市場調查員小王統計了某款拖把的銷售單價x(單位:元)與月銷量y(單位:個)之間的一組數據如下表所示:(1)根據以往經驗,y與x具有線性相關關系,求y關于x的線性回歸方程;單價x/元 18 19 20 21 22月銷量y/個 570 520 420 320 270解:由表中數據得=×(18+19+20+21+22)=20,=×(570+520+420+320+270)=420,∴= ===-80,∴=-=420+80×20=2 020,故y關于x的線性回歸方程為=-80x+2 020.(2)若這款拖把的進貨價為14元/個,根據(1)中回歸方程,求該拖把月利潤最大時拖把的單價為多少元.(結果精確到0.1元)解:設每月的總利潤為Q,則Q(x)=(-80x+2 020)(x-14)=-80x2+3 140x-28 280,∵拋物線y=Q(x)的對稱軸方程為x==19.625≈19.6,∴該拖把月利潤最大時,拖把的單價約為19.6元.題型(三) 求非線性回歸方程[例3] 某大型現代化農場在種植某種大棚有機無公害的蔬菜時,為創造更大價值,提高畝產量,積極開展技術創新活動,該農場采用了延長光照時間的方案,選取了20間大棚(每間一畝)進行試點,得到各間大棚產量數據并繪制成散點圖.光照時長為x(單位:小時),大棚蔬菜產量為y(單位:千斤/每畝),記w=ln x.(1)根據散點圖判斷,y=a+bx與y=c+dln x,哪一個適宜作為大棚蔬菜產量y關于光照時長x的回歸方程類型(給出判斷即可,不必說明理由);參考數據:解:根據散點圖,開始的點在某條直線旁,但后面的點會越來越偏離這條直線,因此y=c+dln x更適宜作為大棚蔬菜產量y關于光照時長x的回歸方程類型.(2)根據(1)的判斷結果及表中數據,建立y關于x的回歸方程(結果保留小數點后兩位);解:記w=ln x,則y=c+dw,= ==5.12,= ==2.6,= =≈3.26,=-=5.12-3.26×2.6≈-3.36,所以=3.26w-3.36,即=3.26ln x-3.36.(3)根據實際種植情況,發現上述回歸方程在光照時長位于6~14小時內擬合程度良好,利用(2)中所求方程估計當光照時長為e2小時時(e為自然對數的底數),大棚蔬菜畝產量約為多少.解:當x=e2時,=3.26ln e2-3.36=3.16,即大棚蔬菜畝產量約為3.16千斤.[思維建模]非線性回歸問題的解題步驟(1)根據原始數據作出散點圖;(2)根據散點圖選擇恰當的擬合函數;(3)作恰當的變換,將其轉化成線性回歸方程求解;(4)在上面的基礎上通過相應的變換,即可得非線性回歸方程.針對訓練4.紅蜘蛛是柚子的主要害蟲之一,能對柚子樹造成嚴重傷害,每只紅蜘蛛的平均產卵數y(個)和平均溫度x(℃)有關,現收集了以往某地的7組數據,得到下面的散點圖及一些統計量的值.(1)根據散點圖判斷,y=bx+a與y=cedx(其中e=2.718…為自然對數的底數)哪一個更適合作為平均產卵數y(個)關于平均溫度x(℃)的回歸方程類型;(給出判斷即可,不必說明理由)解:由散點圖可以判斷,隨溫度升高,產卵數增長速度變快,符合指數函數模型的增長,所以y=cedx更適宜作為平均產卵數y關于平均溫度x的回歸方程類型.參考數據(z=ln y)5 215 17 713 714 27 81.3 3.6(2)由(1)的判斷結果及表中數據,求出y關于x的回歸方程.(計算結果精確到0.1)解:將y=cedx兩邊同時取自然對數,可得ln y=ln c+dx,令z=ln y,由題中的數據可得, xizi-7 =33.6, -7=112,所以= ==0.3,則ln c=-=3.6-0.3×27=-4.5,所以z關于x的線性回歸方程為z=0.3x-4.5,故y關于x的回歸方程為y=e0.3x-4.5.課時跟蹤檢測134567892A級——綜合提能1.船員人數y關于船的噸位x的線性回歸方程是=95+0.06x.如果兩艘輪船噸位相差1 000噸,則船員平均人數相差( )A.40 B.57C.60 D.95解析:由于船員人數y關于船的噸位x的線性回歸方程是=95+0.06x,兩艘輪船噸位相差1 000噸,所以船員平均人數的差值是0.06×1 000=60.√1567892342.已知一組數據(xi,yi)(i=1,2,…,20)滿足線性關系,且線性回歸方程為=10x+30,若=3,則 yi=( )A.30 B.60C.630 D.1 200解析:易知樣本數據的中心點()在線性回歸方程=10x+30上,易知= xi=3,所以=10×3+30=60,即==60,可得 yii=1 200.√1567893423.某地區為研究居民用電量y(單位:度)與氣溫x(單位:℃)之間的關系,隨機統計了某4天的用電量與當天的氣溫,并得到了如下數據:由表中數據得到的線性回歸方程為=x+,若=-1.6,則的值為( )A.27 B.29 C.34 D.36解析:由已知==7.5,==17,所以17=-1.6×7.5+,解得=29.√氣溫x/℃ 3 6 9 12用電量y/度 24 20 14 101567893424.某地種植超級雜交稻,產量從第一期大面積畝產760千克,到第二期畝產810千克,第三期畝產860千克,第四期畝產1 030千克.將第一期視為第二期的父代,第二期視為第三期的父代,或第一期視為第三期的祖父代,并且認為子代的產量與父代的產量有關,請用線性回歸分析的方法預測第五期畝產為 千克. 附:用最小二乘法求得線性回歸方程為=x+,其中= ,=-.1 384156789342解析:設父代產量為xi(i=1,2,3),子代產量為yi(i=1,2,3),則=×(760+810+860)=810,=×(810+860+1 030)=900,所以 (xi-)(yi-)=(-50)×(-90)+0×(-40)+50×130=11 000,=(760-810)2+(810-810)2+(860-810)2=5 000,所以= ==2.2,=-=900-2.2×810=-882,156789342則線性回歸方程為=2.2x-882.當x=1 030時,=1 030×2.2-882=1 384,所以預測第五期畝產為1 384千克.1567893425.已知變量x與y的一組樣本數據(x1,y1),(x2,y2), …,(x6,y6)滿足x1x2x3x4x5x6=e24.6,y1y2y3y4y5y6=e18.3,對各樣本數據求對數,再利用線性回歸分析的方法得到ln y=1+bln x.若變量z=2y-0.5x,則當z的預測值最大時,變量x的取值約為 .(e2≈7.4,結果保留1位小數) 29.6156789342解析:由已知可得ln x1+ln x2+ln x3+ln x4+ln x5+ln x6=24.6,所以×(ln x1+ln x2+ln x3+ln x4+ln x5+ln x6)=4.1,同理×(ln y1+ln y2+ln y3+ln y4+ln y5+ln y6)=3.05,代入ln y=1+bln x,得3.05=1+4.1b,所以b=0.5,所以y=e,則z=2e-0.5x,令t=,則z(t)=-0.5t2+2et=-(t-2e)2+2e2,當t=2e時,z取最大值,此時x=4e2≈29.6.1567893426.“保護環境,人人有責”,在政府和有關企業的努力下,某地區近幾年新能源汽車的購買情況如下表所示:(1)計算y與x的相關系數r(保留三位小數);年份x 2019 2020 2021 2022 2023新能源汽車的 購買數量y(萬輛) 0.40 0.70 1.10 1.50 1.80156789342參考公式r= ,= ,=-.參考數據:≈3.605 6, (xi-)(yi-)=3.6.156789342解:==2 021,==1.10,=(-2)2+(-1)2+02+12+22=10,=(-0.7)2+(-0.4)2+02+0.42+0.72=1.3,r= =≈≈0.998.156789342(2)求y關于x的線性回歸方程,并預測該地區2025年新能源汽車的購買數量.解:由(1)知= ==0.36,=-=1.1-0.36×2 021=-726.46,所以y關于x的線性回歸方程是=0.36x-726.46,當x=2 025時,=0.36×2 025-726.46=2.54(萬輛),所以預測該地區2025年新能源汽車的購買數量約為2.54萬輛.1567893427.隨著科技的發展,手機的功能已經非常強大,各類APP讓用戶的生活質量得到極大提升的同時,也帶來了一些問題,如有不少青少年沉迷于手機游戲,對青少年健康成長帶來不小的影響.為了引導青少年抵制不良游戲,適度參與益智游戲,某游戲公司開發了一款益智游戲,在內測時收集了玩家對每一關的平均過關時間,如表:關卡x 1 2 3 4 5 6平均過關 時間y(秒) 51 79 121 130 237 353156789342(1)通過散點圖分析,可用模型y=ea+bx擬合y與x的關系,試求y關于x的回歸方程(系數a,b精確到0.01) ;參考公式:對于一組數據(xi,yi)(i=1,2,3, …,n),其線性回歸方程=x+的斜率和截距的最小二乘估計公式分別為= ,=-.156789342參考數據:ui =29.299, xi ui =109.066,其中ui=ln yi.y 51 79 121 130 237 353ln y 3.932 4.369 4.796 4.868 5.468 5.866156789342解:令ln y=u,由y=ea+bx,得ln y=a+bx,即u=a+bx,==3.5,= =≈4.883,=12+22+32+42+52+62=91,所以= ≈≈0.373,所以=-≈4.883-0.373×3.5=3.577 5,故≈0.37,≈3.58,所以=e3.58+0.37x.156789342(2)從表中6關過關時間中隨機抽取2個,求這兩個過關時間均低于6關過關時間的平均數的概率.解:=≈161.8,由題意知,過關時間低于161.8秒的為第1,2,3,4關,記作a,b,c,d,超過161.8秒的為第5,6關,記作A,B,從中任取兩個的樣本點有ab,ac,ad,aA,aB,bc,bd,bA,bB,cd,cA,cB,dA,dB,AB,共15個.其中均低于161.8秒的有ab,ac,ad,bc,bd,cd,共6個,故所求概率P==.156789342B級——應用創新8.[多選]下列說法正確的是( )A.若隨機變量X服從兩點分布,且P(X=0)=,則E(X)=B.某人在10次射擊中,擊中目標次數為X,X~B(10,0.7),當X=7時概率最大C.在線性回歸方程=-0.3x+10中,當自變量每增加1個單位時,因變量將平均減少0.3個單位D.設隨機變量X~B(n,p),若D(X)≤3恒成立,則n的最大值為12√√√156789342解析:對于A,因為隨機變量X服從兩點分布且P(X=0)=,所以P(X=1)=,所以E(X)=0×+1×=,故A錯誤.對于B,P(X=k)=·0.7k·0.310-k,由得解得6.7≤k≤7.7,所以k=7,即當X=7時概率最大,故B正確.156789342對于C,在線性回歸方程=-0.3x+10中,當自變量每增加1個單位時,因變量將平均減少0.3個單位,故C正確.對于D,因為隨機變量X~B(n,p),D(X)≤3恒成立,所以D(X)=np(1-p)≤3恒成立,所以np(1-p)=n(p-p2)=-n+≤≤3,所以n≤12,故D正確.故選BCD.1567893429.設某幼苗從觀察之日起,第x天的高度為y cm,測得的一些數據如表所示:作出這組數據的散點圖發現:y(cm)與x(天)之間近似滿足關系式y=b+a,其中a,b均為大于0的常數.(1)試借助線性回歸模型,根據所給數據,用最小二乘法對a,b作出估計,并求出y關于x的回歸方程;第x天 1 4 9 16 25 36 49高度y/cm 0 4 7 9 11 12 13156789342附:對于一組數據(v1,μ1),(v2,μ2), …,(vn,μn),其線性回歸方程=+v的斜率和截距的最小二乘估計分別為= ,=-.156789342解:令μ=,則y=bμ+a,根據已知數據表得則==4,==8,可得 μiyi=1×0+2×4+3×7+4×9+5×11+6×12+7×13=283,x 1 4 9 16 25 36 49μ= 1 2 3 4 5 6 7y 0 4 7 9 11 12 13156789342=1+4+9+16+25+36+49=140,所以= ==,因為線性回歸方程=μ+過點(),則=-=-,所以y關于x的回歸方程為=-.156789342(2)在作出的這組數據的散點圖中,甲同學隨機圈取了其中的4個點,記這4個點中幼苗的高度大于的點的個數為ξ,其中為表格中所給的幼苗高度的平均數,試求隨機變量ξ的分布列和數學期望.解:由題意可知7天中幼苗高度大于=8的有4天,小于等于8的有3天,從散點圖中任取4個點,即從這7天中任取4天,所以這4個點中幼苗的高度大于的點的個數ξ的可能取值為1,2,3,4,則P(ξ=1)==,P(ξ=2)==,P(ξ=3)==,P(ξ=4)==,156789342所以隨機變量ξ的概率分布為E(ξ)=1×+2×+3×+4×=.ξ 1 2 3 4P課時跟蹤檢測(三十七) 線性回歸方程A級——綜合提能1.船員人數y關于船的噸位x的線性回歸方程是=95+0.06x.如果兩艘輪船噸位相差1 000噸,則船員平均人數相差 ( )A.40 B.57C.60 D.952.已知一組數據(xi,yi)(i=1,2,…,20)滿足線性關系,且線性回歸方程為=10x+30,若=3,則yi= ( )A.30 B.60C.630 D.1 2003.某地區為研究居民用電量y(單位:度)與氣溫x(單位:℃)之間的關系,隨機統計了某4天的用電量與當天的氣溫,并得到了如下數據:氣溫x/℃ 3 6 9 12用電量y/度 24 20 14 10由表中數據得到的線性回歸方程為=x+,若=-1.6,則的值為 ( )A.27 B.29C.34 D.364.某地種植超級雜交稻,產量從第一期大面積畝產760千克,到第二期畝產810千克,第三期畝產860千克,第四期畝產1 030千克.將第一期視為第二期的父代,第二期視為第三期的父代,或第一期視為第三期的祖父代,并且認為子代的產量與父代的產量有關,請用線性回歸分析的方法預測第五期畝產為 千克. 附:用最小二乘法求得線性回歸方程為=x+,其中=,=-.5.已知變量x與y的一組樣本數據(x1,y1),(x2,y2),…,(x6,y6)滿足x1x2x3x4x5x6=e24.6,y1y2y3y4y5y6=e18.3,對各樣本數據求對數,再利用線性回歸分析的方法得到ln y=1+bln x.若變量z=2y-0.5x,則當z的預測值最大時,變量x的取值約為 .(e2≈7.4,結果保留1位小數) 6.“保護環境,人人有責”,在政府和有關企業的努力下,某地區近幾年新能源汽車的購買情況如下表所示:年份x 2019 2020 2021 2022 2023新能源汽車的 購買數量y(萬輛) 0.40 0.70 1.10 1.50 1.80(1)計算y與x的相關系數r(保留三位小數);(2)求y關于x的線性回歸方程,并預測該地區2025年新能源汽車的購買數量.參考公式r,=,=-.參考數據:≈3.605 6,(xi-)(yi-)=3.6.7.隨著科技的發展,手機的功能已經非常強大,各類APP讓用戶的生活質量得到極大提升的同時,也帶來了一些問題,如有不少青少年沉迷于手機游戲,對青少年健康成長帶來不小的影響.為了引導青少年抵制不良游戲,適度參與益智游戲,某游戲公司開發了一款益智游戲,在內測時收集了玩家對每一關的平均過關時間,如表:關卡x 1 2 3 4 5 6平均過關 時間y(秒) 51 79 121 130 237 353(1)通過散點圖分析,可用模型y=ea+bx擬合y與x的關系,試求y關于x的回歸方程(系數a,b精確到0.01);(2)從表中6關過關時間中隨機抽取2個,求這兩個過關時間均低于6關過關時間的平均數的概率.參考公式:對于一組數據(xi,yi)(i=1,2,3, …,n),其線性回歸方程=x+的斜率和截距的最小二乘估計公式分別為=,=-.參考數據:y 51 79 121 130 237 353ln y 3.932 4.369 4.796 4.868 5.468 5.866ui=29.299,xiui=109.066,其中ui=ln yi.B級——應用創新8.[多選]下列說法正確的是 ( )A.若隨機變量X服從兩點分布,且P(X=0)=,則E(X)=B.某人在10次射擊中,擊中目標次數為X,X~B(10,0.7),當X=7時概率最大C.在線性回歸方程=-0.3x+10中,當自變量每增加1個單位時,因變量將平均減少0.3個單位D.設隨機變量X~B(n,p),若D(X)≤3恒成立,則n的最大值為129.設某幼苗從觀察之日起,第x天的高度為y cm,測得的一些數據如表所示:第x天 1 4 9 16 25 36 49高度y/cm 0 4 7 9 11 12 13作出這組數據的散點圖發現:y(cm)與x(天)之間近似滿足關系式y=b+a,其中a,b均為大于0的常數.(1)試借助線性回歸模型,根據所給數據,用最小二乘法對a,b作出估計,并求出y關于x的回歸方程;(2)在作出的這組數據的散點圖中,甲同學隨機圈取了其中的4個點,記這4個點中幼苗的高度大于的點的個數為ξ,其中為表格中所給的幼苗高度的平均數,試求隨機變量ξ的分布列和數學期望.附:對于一組數據(v1,μ1),(v2,μ2), …,(vn,μn),其線性回歸方程=+v的斜率和截距的最小二乘估計分別為=,=-.課時跟蹤檢測(三十七)1.選C 由于船員人數y關于船的噸位x的線性回歸方程是=95+0.06x,兩艘輪船噸位相差1 000噸,所以船員平均人數的差值是0.06×1 000=60.2. 選D 易知樣本數據的中心點()在線性回歸方程=10x+30上,易知=xi=3,所以=10×3+30=60,即==60,可得yii=1 200.3.選B 由已知==7.5,==17,所以17=-1.6×7.5+,解得=29.4.解析: 設父代產量為xi(i=1,2,3),子代產量為yi(i=1,2,3),則=×(760+810+860)=810,=×(810+860+1 030)=900,所以(xi-)(yi-)=(-50)×(-90)+0×(-40)+50×130=11 000,=(760-810)2+(810-810)2+(860-810)2=5 000,所以===2.2,=-=900-2.2×810=-882,則線性回歸方程為=2.2x-882.當x=1 030時,=1 030×2.2-882=1 384,所以預測第五期畝產為1 384千克.答案:1 3845.解析:由已知可得ln x1+ln x2+ln x3+ln x4+ln x5+ln x6=24.6,所以×(ln x1+ln x2+ln x3+ln x4+ln x5+ln x6)=4.1,同理×(ln y1+ln y2+ln y3+ln y4+ln y5+ln y6)=3.05,代入ln y=1+bln x,得3.05=1+4.1b,所以b=0.5,所以y=e,則z=2e-0.5x,令t=,則z(t)=-0.5t2+2et=-(t-2e)2+2e2,當t=2e時,z取最大值,此時x=4e2≈29.6.答案:29.66.解: (1)==2 021,==1.10,=(-2)2+(-1)2+02+12+22=10,=(-0.7)2+(-0.4)2+02+0.42+0.72=1.3,r==≈≈0.998.(2)由(1)知===0.36,=-=1.1-0.36×2 021=-726.46,所以y關于x的線性回歸方程是=0.36x-726.46,當x=2 025時,=0.36×2 025-726.46=2.54(萬輛),所以預測該地區2025年新能源汽車的購買數量約為2.54萬輛.7.解: (1)令ln y=u,由y=ea+bx,得ln y=a+bx,即u=a+bx,==3.5,==≈4.883, x =12+22+32+42+52+62=91,所以=≈≈0.373,所以=-≈4.883-0.373×3.5=3.577 5,故≈0.37,≈3.58,所以=e3.58+0.37x.(2)=≈161.8,由題意知,過關時間低于161.8秒的為第1,2,3,4關,記作a,b,c,d,超過161.8秒的為第5,6關,記作A,B,從中任取兩個的樣本點有ab,ac,ad,aA,aB,bc,bd,bA,bB,cd,cA,cB,dA,dB,AB,共15個.其中均低于161.8秒的有ab,ac,ad,bc,bd,cd,共6個,故所求概率P==.8.選BCD 對于A,因為隨機變量X服從兩點分布且P(X=0)=,所以P(X=1)=,所以E(X)=0×+1×=,故A錯誤.對于B,P(X=k)=·0.7k·0.310-k,由得解得6.7≤k≤7.7,所以k=7,即當X=7時概率最大,故B正確.對于C,在線性回歸方程=-0.3x+10中,當自變量每增加1個單位時,因變量將平均減少0.3個單位,故C正確.對于D,因為隨機變量X~B(n,p),D(X)≤3恒成立,所以D(X)=np(1-p)≤3恒成立,所以np(1-p)=n(p-p2)=-n+≤≤3,所以n≤12,故D正確.故選BCD.9.解: (1)令μ=,則y=bμ+a,根據已知數據表得x 1 4 9 16 25 36 49μ= 1 2 3 4 5 6 7y 0 4 7 9 11 12 13則==4,==8,可得μiyi=1×0+2×4+3×7+4×9+5×11+6×12+7×13=283,=1+4+9+16+25+36+49=140,所以===,因為線性回歸方程=μ+過點(),則=-=-,所以y關于x的回歸方程為=-.(2)由題意可知7天中幼苗高度大于=8的有4天,小于等于8的有3天,從散點圖中任取4個點,即從這7天中任取4天,所以這4個點中幼苗的高度大于的點的個數ξ的可能取值為1,2,3,4,則P(ξ=1)==,P(ξ=2)==,P(ξ=3)==,P(ξ=4)==,所以隨機變量ξ的概率分布為ξ 1 2 3 4PE(ξ)=1×+2×+3×+4×=.4 / 4 展開更多...... 收起↑ 資源列表 9.1.2 線性回歸方程.docx 9.1.2 線性回歸方程.pptx 課時跟蹤檢測(三十七) 線性回歸方程.docx 縮略圖、資源來源于二一教育資源庫