資源簡介 4.3 統計模型4.3.1 一元線性回歸模型基礎過關練題組一 變量間的相關關系1.(多選題)對于任意給定的兩個變量的統計數據,下列說法錯誤的是( )A.一定可以分析出兩個變量之間的關系B.一定可以用一條直線近似地表示兩者之間的關系C.一定可以作出散點圖D.一定可以用確定的表達式表示兩者之間的關系2.觀察下列散點圖,則①正相關,②負相關,③不相關與圖中的甲、乙、丙三個散點圖相對應的是( )A.①②③ B.②①③C.①③② D.③①②3.下表給出了5組數據,選出4組數據使得x與y的線性相關程度最大,且保留第1組數據(-5,-3),則在余下的4組數據中應去掉( )第i組 1 2 3 4 5xi -5 -4 -3 -2 4yi -3 -2 4 -1 6A.第2組數據 B.第3組數據C.第4組數據 D.第5組數據題組二 回歸直線方程及其應用4.根據表中的數據,用最小二乘法得到y關于x的回歸直線方程為=14x-14,則表中n的值為( )x 2 3 4 5 6y 20 n 40 60 70A.15.5 B.20 C.20.5 D.255.已知變量x和y的統計數據如下表:x 6 7 8 9 10y 3.5 4 5 5.5 7如果由表中數據可得回歸直線方程為,那么,當x=10時,殘差為 .(注:殘差=觀測值-預測值) 6.對有關數據的分析可知,每立方米混凝土的水泥用量x(單位:kg)與28天后混凝土的抗壓強度y(單位:kg/cm2)之間具有線性相關關系,其回歸直線方程為=0.30x+9.99.根據建設項目的需要,28天后混凝土的抗壓強度不得低于89.7 kg/cm2,則每立方米混凝土的水泥用量最少應為 kg. 7.銷售費用預算是以銷售收入預算為基礎,通過分析銷售收入、銷售利潤和銷售費用的關系,力求實現銷售費用的最有效使用.根據往年的相關數據顯示,某高新技術企業的年銷售費用占年銷售收入的8%~10%為合理區間,當年銷售費用超出年銷售收入的10%時,說明企業的銷售環節出現一定的問題,需要加強銷售管理.該企業的年銷售費用x(單位:千萬元)和年銷售收入y(單位:千萬元)的相關數據如下表所示:2018 2019 2020 2021 2022 2023x 3 5 6 8 9 11y 31 50 54 86 85 114(1)通過數據分析,該企業的年銷售費用x與年銷售收入y之間符合線性相關關系,求出回歸直線方程;(2)若該企業2024年的年銷售費用的預算為12千萬元,試預測2024年的年銷售收入,并判斷2024年的年銷售費用的預算是否在合理區間內.(精確到0.01千萬元)參考數據:xiyi=3 374.參考公式:中,.8.千百年來,人們一直在通過不同的方式傳遞信息.在古代,烽火狼煙、飛鴿傳書、快馬驛站等通信方式被人們廣泛應用;第二次工業革命后,科技的進步帶動了電訊事業的發展,電報、電話的發明讓通信領域發生了翻天覆地的變化;之后,計算機和互聯網的出現則使得“千里眼”“順風耳”變為現實.現在,5G的到來給人們的生活帶來了顛覆性的變革.某科技創新公司基于領先技術的支持,5G經濟收入在短期內逐月攀升,該創新公司在1月份至5月份的5G經濟收入y(單位:百萬元)關于月份x的數據如下表:時間x/月份 1 2 3 4 5收入y/百萬元 10 15 19 23 28(1)根據上表中的數據,求出y關于x的回歸直線方程,并預測該公司6月份的5G經濟收入;(2)從這5個月中隨機抽取3個月,記月收入超過15百萬元的月份個數為X,求X的分布列和數學期望.參考公式:回歸直線方程中,.題組三 相關系數9.對四組數據進行統計,獲得以下散點圖,關于其相關系數的比較正確的是( )A.r2C.r410.為了比較甲、乙、丙、丁四組數據的線性相關性強弱,某同學分別計算了甲、乙、丙、丁四組數據的線性相關系數,求得的數值依次為-0.98,-0.27,0.36,0.93,則這四組數據中線性相關性最強的是 組數據. 11.人口結構的變化,能明顯影響住房需求.當一個地區青壯年人口占比高時,住房需求就會增加,而當一個地區老齡化嚴重時,住房需求就會下降.某機構隨機選取了某個地區的10個城市,統計了每個城市的老齡化率x和空置率y,如下表所示:城市 1 2 3 4 5 6 7 8 9 10老齡 化率x 0.17 0.2 0.18 0.05 0.21 0.09 0.19 0.3 0.17 0.24空置 率y 0.06 0.13 0.09 0.05 0.09 0.08 0.11 0.15 0.16 0.28(1)若老齡化率不低于0.2,則該城市為超級老齡化城市,根據表中數據,估計該地區城市為超級老齡化城市的概率;(2)估計該地區城市的老齡化率x和空置率y的相關系數.(結果精確到0.01)參考公式:相關系數r=.參考數據:≈0.04,≈0.04,xiyi=0.241 3,yi=1.2.題組四 非線性回歸分析12.某工廠每日生產一種產品x(x≥1)噸,每日生產的該產品當日銷售完畢,日銷售額為y萬元,產品價格隨著產量的變化而變化,經過一段時間的產銷,得到了x,y的一組統計數據,如下表:日產量x/噸 1 2 3 4 5日銷售額y/萬元 5 12 16 19 21(1)請判斷y=bx+a與y=dln x+c中哪個模型更適合刻畫x,y之間的關系,并從函數增長趨勢方面給出簡單的理由;(2)根據你的判斷及下面的公式和數據,求出y關于x的回歸方程,并估計當日產量為6噸時,日銷售額是多少.(結果保留整數)參考公式:回歸直線方程中,.參考數據:≈0.96,5ln 1+12ln 2+16ln 3+19ln 4+21ln 5≈86,ln 6≈1.8,(ln 1)2+(ln 2)2+(ln 3)2+(ln 4)2+(ln 5)2≈6.2.能力提升練題組一 回歸直線方程及其應用1.已知x,y的對應值如下表所示:x 0 2 4 6 8y 1 m+1 2m+1 3m+3 11y與x具有較好的線性相關關系,可用回歸直線方程=1.3x+0.6近似刻畫,則在y的取值中任取2個均不大于9的概率為( )A.2.(多選題)已知由樣本數據點集合{(xi,yi)|i=1,2,3,…,n}求得回歸直線方程為=1.5x+0.5,且=3,現發現數據點(1.2,2.2)和(4.8,7.8)誤差較大,去除后重新求得回歸直線的斜率為1.2,則( )A.變量x與y具有正相關關系B.去除后y的估計值增加速度變快C.去除后與去除前均值不變D.去除后的回歸直線方程為=1.2x+1.43.某二手汽車經銷商對其所經營的某型號二手汽車的使用年數x(0使用年數x 2 4 6 8 10銷售價格y/萬元 16 13 9 7 5(1)根據表中數據,用最小二乘法求y關于x的回歸直線方程;(2)已知每輛該型號汽車的收購價格w(萬元)與使用年數x(0附:回歸直線方程中,.4.大氣污染物PM2.5(大氣中直徑小于或等于2.5 μm的顆粒物)的濃度超過一定的限度會影響人的身體健康.為了研究PM2.5的濃度受車流量影響的程度,某校數學建模社團選擇了學校附近5個監測點,統計每個監測點24 h內的車流量x(單位:千輛),同時在低空相同的高度測定每個監測點該時間段內的PM2.5的平均濃度y(單位:μg/m3),得到的數據如表所示:監測點編號 1 2 3 4 5x 1.3 1.2 1.6 1.0 0.9y 66 72 113 34 35(1)建立y關于x的一元線性回歸模型,并用相關系數加以說明(一般地,相關系數的絕對值在0.8以上(含0.8)認為線性相關性較強,否則認為線性相關性較弱);(2)我國規定空氣中PM2.5的濃度安全標準為24 h平均濃度為75 μg/m3,該地為使PM2.524 h平均濃度不超過68.6 μg/m3,擬對車流量作適當控制,請你根據本題數據估計車流量控制的最大值;(3)從5個監測點中抽取3個,記PM2.5的平均濃度不超過68.6 μg/m3的個數為X,求X的分布列和數學期望.參考公式:回歸直線方程中,;相關系數r=題組二 非線性回歸分析5.為研究某池塘中水生植物的覆蓋水塘面積x(單位:dm2)與水生植物的株數y(單位:株)之間的相關關系,收集了4組數據,用模型y=cekx(c>0)去擬合x與y的關系,設z=ln y,x與z的數據如表格所示,得到x關于z的回歸直線方程為,則=( )x 3 4 6 7z 2 2.5 4.5 7A.-2 B.-1 C.e-2 D.e-16.某公司為確定下一年度投入某種產品的宣傳費,需了解年宣傳費x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響,于是對近8年的年宣傳費xi和年銷售量yi(i=1,2,…,8)的數據作了初步處理,得到如圖所示的散點圖及一些統計量的值.46.6 563 6.8 289.8 1.61 469 108.8注:表中wi=wi.(1)根據散點圖判斷,y=a+bx與y=c+d哪一個適合作為年銷售量y關于年宣傳費x的回歸方程類型;(給出判斷即可,不必說明理由)(2)根據(1)的判斷結果及表中數據,建立y關于x的回歸方程;(3)已知這種產品的年利潤z與年宣傳費x,年銷售量y之間的關系為z=0.2y-x,根據(2)的結果回答下列問題:①當年宣傳費x=49時,年銷售量及年利潤的預測值是多少 ②當年宣傳費x為何值時,年利潤的預測值最大 附:回歸直線方程u中,.7.某企業新研發了一種產品,產品的成本由原料成本及非原料成本組成.每批產品的非原料總成本y(元)與生產該產品的數量x(千件)有關,經統計得到如下數據:x/千件 1 2 3 4 5 6 7y/元 6 11 21 34 66 101 196根據以上數據,繪制如圖所示的散點圖.觀察散點圖,可知兩個變量不具有線性相關關系,現考慮用對數函數模型y=a+bln x和指數函數模型y=c·dx分別對兩個變量的關系進行擬合.(1)根據散點圖判斷,y=a+bln x與y=c·dx(c,d均為大于零的常數)哪一個適宜作為非原料總成本y關于生產該產品的數量x的回歸方程類型(給出判斷即可,不必說明理由);(2)根據(1)的判斷結果及表中的數據,建立y關于x的回歸方程;(3)已知每件產品的原料成本為10元,若該產品的總成本不得高于123 470元,請估計最多能生產多少千件產品.參考數據:100.544 62.14 1.54 140 2 535 50.12 3.47其中vi=lg yi,.參考公式:回歸直線方程u中,.答案與分層梯度式解析4.3 統計模型4.3.1 一元線性回歸模型基礎過關練1.ABD 2.C 3.B 4.B 9.B1.ABD 給出兩個變量的統計數據,總可以作出相應的散點圖,但不一定能分析出兩個變量之間的關系,更不一定符合線性相關,即不一定能用一條直線近似地表示兩者之間的關系,故A、B中說法不正確,C中說法正確.兩個變量之間不一定具有函數關系,故D中說法不正確.故選ABD.2.C3.B 畫出散點圖如圖所示,由圖可知,應去掉第3組數據(-3,4),故選B.4.B 由題表中的數據計算可得,,因為回歸直線過點,所以=14×4-14,解得n=20.故選B.5.答案 0.3解析 =5,所以=5-0.85×8=-1.8,所以=0.85x-1.8,所以當x=10時,=0.85×10-1.8=6.7,所以殘差為7-6.7=0.3.6.答案 265.7解析 由題意,得0.30x+9.99≥89.7,解得x≥265.7,故每立方米混凝土的水泥用量最少應為265.7 kg.7.解析 (1)由已知得,=70.又xiyi=3 374,=336,所以,所以,所以該企業的年銷售費用x與年銷售收入y之間的回歸直線方程為.(2)2024年的年銷售收入的預測值≈121.67(千萬元).因為12÷121.67×100%≈9.9%,所以2024年的年銷售費用的預算在合理區間內.8.解析 (1)由題意得,=19,=12+22+32+42+52=55,=10+30+57+92+140=329,所以,,故y關于x的回歸直線方程為.當x=6時,,所以預測該公司6月份的5G經濟收入為百萬元.(2)這5個月中,月收入超過15百萬元的月份有3個,所以X的所有可能取值為1,2,3,P(X=1)=,所以X的分布列為X 1 2 3P所以E(X)=1×.9.B 由題中的散點圖可以看出,圖1和圖3是正相關,則相關系數大于0,即r1>0,r3>0;圖2和圖4是負相關,則相關系數小于0,即r2<0,r4<0.又圖3和圖4中的點相對于圖1和圖2中的點更加集中,所以r3更接近于1,r4更接近于-1,所以r410.答案 甲解析 因為|r|值越接近1,隨機變量之間的線性相關程度越強,且|-0.98|>0.93>0.36>|-0.27|,所以甲組數據的線性相關性最強.11.解析 (1)由題表中的數據可知,調查的10個城市中,老齡化率不低于0.2的有4個,所以估計該地區城市為超級老齡化城市的概率為=0.4.(2)由題表中的數據得,=0.12,則r=≈=≈0.63.故該地區城市的老齡化率x和空置率y的相關系數約為0.63.12.解析 (1)y=dln x+c更適合刻畫x,y之間的關系.理由:由題表中的數據可知,x的值每增加1,函數值y的增加量分別為7,4,3,2,增加得越來越緩慢,符合對數函數模型的增長規律,與一元線性回歸模型的均勻增長存在較大差異,故y=dln x+c更適合刻畫x,y之間的關系.(2)令z=ln x,由題意得=14.6,所以≈=10,≈14.6-10×0.96=5,所以y關于z的回歸直線方程為=10z+5,所以y關于x的回歸方程為=10ln x+5.當x=6時,=10ln 6+5≈10×1.8+5=23.估計當日產量為6噸時,日銷售額為23萬元.能力提升練1.B 2.ACD 5.C1.B 由題表得=4,,因為回歸直線一定過點(),所以1.3×4+0.6=,解得m=2,所以y的取值分別為1,3,5,9,11,從這5個數中任取2個均不大于9的概率P=.2.ACD 由y關于x的回歸直線方程為=1.5x+0.5,知=1.5>0,∴變量x與y具有正相關關系,故A正確;∵1.2<1.5,∴去除后y的估計值增加速度變慢,故B錯誤;去除前的均值=3,去除的兩個數據點的橫坐標的平均數為3,則去除后與去除前均值不變,由回歸直線恒過樣本點的中心,可得去除前+0.5=1.5×3+0.5=5,而去除的兩個數據點的縱坐標的平均數為5,則去除后與去除前均值不變,故C正確;設去除后的回歸直線方程為,把去除后樣本點的中心(3,5)代入,得5=1.2×3+=1.4,∴去除后的回歸直線方程為=1.2x+1.4,故D正確.故選ACD.3.解析 (1)由題表中的數據得,xiyi=2×16+4×13+6×9+8×7+10×5=244,所以=10+1.4×6=18.4,所以y關于x的回歸直線方程為=-1.4x+18.4.(2)z=在z=-0.05x2+0.3x+1.3(0在z=0.05x+0.8(6顯然1.75>1.3,所以當x=3時,利潤z最大,且最大利潤是1.75萬元.4.解析 (1)由題表得=1.2,=64,xiyi=1.3×66+1.2×72+1.6×113+1.0×34+0.9×35=418.5,=1.32+1.22+1.62+1.02+0.92=7.5,=662+722+1132+342+352=24 690,所以=115,=64-115×1.2=-74,所以=115x-74.r==≈0.97.因為|0.97|>0.8,所以y與x的線性相關性較強.(2)令115x-74≤68.6,得x≤1.24,故估計車流量控制的最大值為1.24.(3)結合題表知,5個監測點中PM2.5的平均濃度不超過68.6 μg/m3的有3個,所以X的所有可能取值為1,2,3.P(X=1)=,P(X=3)=.故X的分布列為X 1 2 3P所以E(X)=1×.5.C 由已知可得,=4,所以4=1.2×5+,解得=-2,所以=1.2x-2,由z=ln y,得ln =1.2x-2,所以=e1.2x-2=e-2·e1.2x,則=e-2.故選C.6.解析 (1)由題中散點圖知各點呈非線性遞增趨勢,所以y=c+d適合作為年銷售量y關于年宣傳費x的回歸方程類型.(2)由wi=,得y=c+dw,則=68,=563-68×6.8=100.6,所以.(3)①當x=49時,=576.6,=0.2×576.6-49=66.32.②由題意得,-6.8)2+66.36,當=6.8,即x=46.24時,年利潤的預測值最大.7.解析 (1)根據題中的散點圖可知,y=c·dx適宜作為非原料總成本y關于生產該產品的數量x的回歸方程類型.(2)對y=c·dx兩邊同時取常用對數,得lg y=lg(c·dx)=lg c+xlg d.由lg y=v,得v=lg c+xlg d.∵=50.12,∴lg =0.25,lg lg =1.54-4×0.25=0.54,∴=0.54+0.25x,∴lg =0.54+0.25x,∴=100.54+0.25x=3.47×100.25x.(3)設生產了x千件該產品,生產總成本為g(x)元,則g(x)=3.47×100.25x+x×10×1 000.易知g(x)=3.47×100.25x+10 000x在其定義域內單調遞增,且g(12)=3.47×103+120 000=123 470,所以估計最多能生產12千件產品.23(共25張PPT)4.3 統計模型知識點 1 相關關系知識 清單破4.3.1 一元線性回歸模型1.相關關系:兩個變量之間有一定的關系,但沒有達到可以互相決定的程度,它們之間的關系帶有一定的隨機性,這種關系稱為相關關系.2.散點圖 將成對數據用平面直角坐標系中的點表示出來,由這些點組成的統計圖稱為散點圖.3.線性相關 如果由變量的成對數據、散點圖或直觀經驗可知,變量x與變量y之間的關系可以近似地用一次函數來刻畫,則稱x與y線性相關.如果一個變量增大,另一個變量大體上也增大,則稱這兩個變量正相關;如果一個變量增大,另一個變量大體上減少,則稱這兩個變量負相關.知識點 2 回歸直線方程1.回歸直線方程一般地,已知變量x與y的n對成對數據(xi,yi),i=1,2,3,…,n.任意給定一個一次函數y=bx+a,對每一個已知的xi,由直線方程可以得到一個估計值 =bxi+a,如果一次函數 = x+ 能使殘差平方和即 (yi- )2取得最小值,則 = x+ 稱為y關于x的回歸直線方程(對應的直線稱為回歸直線).因為是使得平方和最小,所以其中涉及的方法稱為最小二乘法.在回歸直線方程 = x+ 中, = = , = - ,其中, 稱為回歸系數,實際上也就是回歸直線的斜率.2.回歸直線方程的性質(1)回歸直線一定過點( , ).(2)y與x正相關的充要條件是 >0;y與x負相關的充要條件是 <0.(3) 的實際意義:當x增大一個單位時, 增大 個單位.知識點 3 相關系數1.對于變量x與y的成對數據(xi,yi),i=1,2,3,…,n,一般用r= = 來衡量y與x的線性相關性強弱,這里的r稱為線性相關系數(簡稱為相關系數).2.相關系數r的性質(1)|r|≤1,且y與x正相關的充要條件是r>0,y與x負相關的充要條件是r<0.(2)|r|越小,說明兩個變量之間的線性相關性越弱,也就是得出的回歸直線方程越沒有價值,即方程越不能反映真實的情況;|r|越大,說明兩個變量之間的線性相關性越強,也就是得出的回歸直線方程越有價值.(3)|r|=1 的充要條件是成對數據構成的點都在回歸直線上. 如果具有相關關系的兩個變量x,y不是線性相關關系,那么y與x的關系稱為非線性相關關系,所得到的方程稱為非線性回歸方程.一般地,非線性回歸方程的曲線類型可以通過作出散點圖進行猜測,而回歸方程有時可以通過變量替換后,借助求回歸直線方程的過程確定.知識點 4 非線性回歸知識辨析判斷正誤,正確的畫“√”,錯誤的畫“ ”.1.若兩個變量線性相關,則各觀測點落在一條直線上. ( )2.回歸方程中,由x的值得出的y值是準確值.( )3.回歸直線一定過某一對樣本數據確定的點. ( )4.當r=0時,成對數據間沒有任何關系. ( ) 若兩個變量線性相關,則它們之間的關系可近似地用一次函數來刻畫,各觀測點不一定全部落在一條直線上.提示 當r=0時,只表明成對數據間沒有線性相關關系,但不排除它們之間有其他關系.提示 5.若r1=-0.95,r2=0.85,則體現兩變量相關關系較強的是r2. ( )6.當變量x的取值依次為3,4,5,6,7時,變量y對應的值依次為4.0,2.5,-0.5,-1,-2,則可知變量x和y負相關. ( )7.對于散點圖中的點沒有均勻分布在某條直線附近或毫無規則可言的兩個變量,用最小二乘法求不出對應的回歸直線方程.( )當|r|越接近1時,成對數據的線性相關程度越強,所以體現兩變量相關關系較強的是r1.提示 √判斷兩個變量相關性的方法(1)利用散點圖判斷:通過散點圖觀察點的分布是否存在一定的規律,若點大致在一條直線附近擺動,則對應變量線性相關,否則不具有線性相關關系.一般地,如果變量x和y正相關,那么關于均值平移后的大多數散點將分布在第一、第三象限,對應的成對數據同號的居多;如果變量x和y負相關,那么關于均值平移后的大多數散點將分布在第二、第四象限,對應的成對數據異號的居多.(2)利用相關系數判斷:相關系數r是從數值上來判斷變量間的線性相關程度的量,是定量分析法.|r|刻畫了樣本點集中于某條直線的程度.|r|越接近1,散點圖中樣本點的分布越接近一條直線,兩個變量的線性相關程度越強.講解分析疑難 1 兩個變量相關性的判斷疑難 情境破典例 某農科所對冬季晝夜溫差(最高溫度與最低溫度的差)大小與某反季節大豆新品種一天內發芽數之間的關系進行了分析研究,他們分別記錄了12月1日至12月6日每天晝夜的最高、最低溫度(如圖甲),以及實驗室每天每100顆種子中的發芽數情況(如圖乙).圖甲 圖乙(1)請畫出發芽數y與溫差x的散點圖;(2)判斷(1)中的兩個變量是否線性相關,計算相關系數,并刻畫它們的相關程度.參考數據: 參考公式:相關系數r= (當|r|>0.75時,認為兩個變量的線性相關程度較強).解析 (1)散點圖如圖所示. (2)r= ≈ ≈0.952.由相關系數r≈0.952>0.75,可以推斷發芽數與溫差這兩個變量正相關,且線性相關程度較強.規律總結 判斷兩個變量之間的線性相關程度一般用散點圖,但在作圖中,由于存在誤差,有時很難判斷這些點是否分布在一條直線附近,此時可以利用相關系數r來判斷.講解分析疑難 2 回歸直線方程的求解與應用1.求回歸直線方程中系數的方法(1)公式法:利用公式,求出 , .(2)待定系數法:利用回歸直線過樣本點的中心( , )求系數.2.回歸直線方程的應用(1)利用回歸直線方程進行預測:把回歸直線方程看作一次函數的解析式,求函數值.(2)利用回歸直線判斷正、負相關性:決定正相關還是負相關的是回歸系數 .典例 COMS溫度傳感器(集成溫度傳感器)是一種采用大規模數字集成電路技術的溫度傳感器,集成了溫度傳感電路和信號處理電路,可檢測芯片溫度和環境溫度,具有低成本、低功耗、高精度和線性度強的優點.下表是通過對某型號COMS高精度溫度傳感器IC的芯片溫度與輸出電壓進行初步統計得出的相關數據:芯片溫度t/℃ -20 20 40 80 100輸出電壓 測量值U/V 2.49 2.07 1.88 1.45 1.31(1)已知輸出電壓U與芯片溫度t之間存在線性相關關系,求出其回歸直線方程;(精確到小數點后兩位)(2)已知輸出電壓實際觀測值為Ui,估計值(預測值)為 ,σ= .以上述數據和(1)中的回歸直線方程為依據,若滿足|Ui- |<3σ,則可判斷該COMS高精度溫度傳感器IC工作正常;若不滿足,則可判斷其工作不正常.現某該型號溫度傳感器在芯片溫度為60 ℃時,輸出電壓為1.60 V,判斷該溫度傳感器工作是否正常.參考數據: , =18 800.參考公式:對于一組數據(t1,U1),(t2,U2),…,(tn,Un),其回歸直線U=a+bt的斜率和截距的最小二乘估計分別為 = , = - .解析 (1)由題表得 = =44, = =1.84,∴ = = ≈-0.01, ≈1.84-(-0.01)×44=2.28,∴輸出電壓U關于芯片溫度t的回歸直線方程為 =-0.01t+2.28.(2)由(1)及題表中數據可得,當t=-20時, =2.48,U1- =0.01;當t=20時, =2.08,U2- =-0.01;當t=40時, =1.88,U3- =0;當t=80時, =1.48,U4- =-0.03;當t=100時, =1.28,U5- =0.03.∴σ= = =0.02.當t=60時, =-0.01×60+2.28=1.68,|U- |=|1.60-1.68|=0.08>3×0.02=0.06,∴該溫度傳感器工作不正常.講解分析疑難 3 非線性回歸1.建立非線性回歸模型的基本步驟(1)確定研究對象,明確涉及的變量;(2)畫出確定好的變量間的散點圖,觀察它們之間的關系(是否存在非線性關系);(3)由經驗確定非線性回歸方程的類型(如我們觀察到數據呈非線性關系,一般選用反比例函數模型、指數函數模型、對數函數模型等);(4)通過換元,將非線性回歸方程模型轉化為線性回歸方程模型;(5)按照公式計算回歸直線方程中的參數,得到回歸直線方程;(6)消去新元,得到非線性回歸方程.2.常見的非線性回歸方程的轉換曲線方程 曲線(曲線的一部分) 變換公式 變換后的線性函數y=axb c=ln a, u=c+bvy=aebx c=ln a, u=c+bxy=a c=ln a, u=c+bv曲線方程 曲線(曲線的一部分) 變換公式 變換后的線性函數y=a+bln x v=ln x y=a+bv典例 混凝土具有原材料豐富、抗壓強度高、耐久性好等特點,是目前使用量最大的土木建筑材料.抗壓強度是混凝土質量控制的重要技術參數,也是實際工程對混凝土要求的基本指標.為了解某型號某批次混凝土的抗壓強度(單位:MPa)隨齡期(單位:天)的發展規律,質檢部門在標準試驗條件下記錄了10組混凝土試件在齡期xi(i=1,2,…,10)分別為2,3,4,5,7,9,12,14,17,21時的抗壓強度yi的值,并對數據進行了初步處理,得到散點圖及一些統計量的值. (xi- )2 (wi- )29.4 29.7 2 370.4 5.5 (xi- )(yi- ) (wi- )(yi- ) 439.2 55 表中wi=ln xi, = wi.(1)根據散點圖判斷y=a+bx與y=c+dln x哪一個適宜作為抗壓強度y關于齡期x的回歸方程類型,根據判斷結果和表中數據,建立y關于x的回歸方程;(2)工程中常把齡期為28天的混凝土試件的抗壓強度f28視作混凝土抗壓強度標準值.已知該型號混凝土設置的最低抗壓強度標準值為40 MPa.①試預測該批次混凝土是否達標;②由于抗壓強度標準值需要較長時間才能評定,早期預測在工程質量控制中具有重要的意義.經驗表明,該型號混凝土第7天的抗壓強度f7與第28天的抗壓強度f28具有線性相關關系f28=1.2f7+7,試估計在早期質量控制中,齡期為7天的混凝土試件需達到的抗壓強度.參考數據:ln 2≈0.69,ln 7≈1.95.解析 (1)由題中散點圖可以判斷,y=c+dln x適宜作為抗壓強度y關于齡期x的回歸方程類型.令w=ln x,建立y關于w的回歸直線方程.由于 = = =10, = - =29.7-10×2=9.7,所以y關于w的回歸直線方程為 =9.7+10w,因此y關于x的回歸方程為 =9.7+10ln x.(2)①由(1)知,當齡期為28天,即x=28時,抗壓強度y的估計值 =9.7+10ln 28=9.7+10×(2ln 2+ln 7)≈43.因為43>40,所以預測該批次混凝土達標.②令f28=1.2f7+7≥40,得f7≥27.5.所以估計在早期質量控制中,齡期為7天的混凝土試件需達到的抗壓強度為27.5 MPa. 展開更多...... 收起↑ 資源列表 4.3.1 一元線性回歸模型.docx 4.3.1 一元線性回歸模型.pptx 縮略圖、資源來源于二一教育資源庫