中文字幕精品无码一区二区,成全视频在线播放观看方法,大伊人青草狠狠久久,亚洲一区影音先锋色资源

高中數學(人教B版)選擇性必修二同步講義第4章第06講一元線性回歸模型(學生版+解析)

資源下載
  1. 二一教育資源

高中數學(人教B版)選擇性必修二同步講義第4章第06講一元線性回歸模型(學生版+解析)

資源簡介

第06講 一元線性回歸模型
課程標準 學習目標
1.理解散點圖、線性相關、正相關、負相關的概念. 2.理解并掌握回歸直線方程的概念和性質,會求線性相關的兩個變量的回歸直線方程. 3.理解并掌握相關系數的概念及性質,并能判斷兩個變量之間線性相關性的強弱. 4.了解非線性回歸的相關概念. 1.通過對數據的分析、統計,培養數據分析等核心素養. 2.借助變量間相關關系的研究,提升數學抽象、數學運算等核心素養. 3.借助求回歸直線方程和相關系數,培養學生數學建模、數據分析及數學運算等核心素養.
知識點01 變量的相關關系
1.兩個變量的關系
(1)一類是兩變量之間的關系具有確定性,當一個變量確定后,另一個變量就確定了.
(2)另一類是變量之間具有一定的關系,但沒有達到可以相互決定的程度.它們之間的關系帶有一定的隨機性,這些兩個變量之間的關系,在統計學上都稱為相關關系.
【解讀】相關關系與函數關系的異同:
關系 異同點 函數關系 相關關系
相同點 兩者均是兩個變量之間的關系
不同點 是一種確定性關系 是一種非確定性關系
是一種因果關系 不一定是因果關系,也可能是伴隨關系
是一種理想的關系 是更為一般的情況
3.散點圖
(1)概念:一般地,如果收集到了變量x和變量y的n對數據(簡稱為成對數據),如下表所示:
序號i 1 2 3 … n
變量x x1 x2 x3 … xn
變量y y1 y2 y3 … yn
則在平面直角坐標系xOy中描出點(xi,yi),i1,2,3,…,n,就可以得到這n對數據的散點圖.
(2)作用:散點圖展示了樣本點散布的位置.根據散點圖中點的分布趨勢分析兩個變量之間的關系,可直觀地判斷并得出結論.
【解讀】
(1)散點圖具有直觀、簡明的特點,我們可以根據散點圖來判斷兩個變量有沒有相關關系;
(2)通過散點圖不但可以判斷測量值的大小、變動范圍與整體趨勢,還可以通過觀察剔除異常數值,提高估計相關程度的準確性;
(3)當所畫的散點圖的橫坐標與縱坐標所對應的數據差距很大時,可在實際作圖時,將橫坐標與縱坐標取不同的單位長度,使畫出的散點圖形象、美觀.
3.線性相關正相關、負相關
如果由變量的成對數據、散點圖或直觀經驗可知,變量x與變量y之間的關系可以近似地用一次函數來刻畫,則稱x與y線性相關.此時,如果一個變量增大,另一個變量大體上也增大,則稱這兩個變量正相關;如果一個變量增大,另一個變量大體上減少,則稱這兩個變量負相關.
【即學即練1】)兩個變量成正相關的是(  )
A.汽車的重量和汽車每消耗1升汽油所行駛的平均路程
B.平均日學習時間和平均學習成績
C.某人每日吸煙量和其身體健康情況
D.汽車的重量和百公里耗油量
【答案】CD
【解析】其中A,C成負相關關系,B,D成正相關關系,故選B,D.
知識點02 回歸直線方程
1.回歸直線方程的概論
一般地,已知變量x與y的n對成對數據(xi,yi),i1,2,3,…,n.任意給定一個一次函數ybx+a,對每一個已知的xi,由直線方程可以得到一個估計值ibxi+a,如果一次函數x+能使(1-y1)2+(2-y2)2+…+(n-yn)2(yi-i)2取得最小值,則yx+稱為y關于x的回歸直線方程(對應的直線稱為回歸直線).
2.最小二乘法
上述求回歸直線方程的過程中需使得平方和最小,所以其中涉及的方法稱為最小二乘法.
可以證明,給定兩個y與x的一組數據之后,回歸直線方程x+總是存在的,而且
,=.
其中,稱為回歸系數.它實際上也就是回歸直線方程的斜率.回歸直線方程確定之后,就可用于預測.
需要注意的是,上述公式中,指的是x1,x2,x3,…,xn的平均數,即(x1+x2+…+xn);類似地,是y1,y2,y3,…,yn的平均數,即.
【解讀】(1)回歸直線一定過點(,);
(2)y與x正相關的充要條件是>0;y與x負相關的充要條件是<0;
(3)當x增大一個單位時,增大個單位,這就是回歸系數的實際意義;
(4)回歸直線方程中x的系數是,表示直線的斜率,注意與《選擇性必修第一冊》中的一次函數的關系式或直線方程yax+b進行區分.
【即學即練2】已知某車間加工零件的個數x與所花費時間y(h)之間的回歸直線方程為0.01x+0.5,則加工800個零件大約需要(  )
A.6.5 h       B.5.5 h
C.3.5 h D.0.5 h
【答案】A
【解析】 把x800代入回歸直線方程中得,0.01×800+0.56.5,故選A.
知識點03 相關系數
1.概念:注意到現實生活中的數據,由于度量對象和單位的不同等,數值會有大有小,為了去除這些因素的影響,統計學里一般用
來衡量y與x的線性相關性強弱,這里的r稱為線性相關系數(簡稱為相關系數).
2.性質
(1)|r|≤1,且y與x正相關的充要條件是r>0,y與x負相關的充要條件是r<0.
(2)|r|越小,說明兩個變量之間的線性相關性越弱,也就是得出的回歸直線方程越沒有價值,即方程越不能反映真實的情況;|r|越大,說明兩個變量之間的線性相關性越強,也就是得出的回歸直線方程越有價值.
(3)|r|1的充要條件是成對數據構成的點都在回歸直線上.
(1)樣本的相關系數r可以定量地反映出變量間的相關程度,明確給出有無必要建立兩變量間的回歸方程;
(2)|r|很小只是說明兩個變量之間的線性相關程度弱,但不一定不相關.
3.相關系數與向量夾角的余弦
一般地,a(x1-,x2-,…,xn-),b(y1-,y2-,…,yn-)都稱為n維向量,如果按照類似2維與3維的情況定義向量的內積和模,則相關系數r總是等于兩個向量夾角的余弦,即rcos .
【即學即練3】若對甲、乙、丙3組不同的數據作線性相關性檢驗,得到這3組數據的線性相關系數依次為0.83,0.72,-0.90,則線性相關性最強的一組是____________(填甲、乙、丙中的一個).
【答案】丙
【解析】兩個變量y與x的回歸模型中,它們的相關系數|r|越接近于1,
這個模型的兩個變量線性相關性就越強,在甲、乙、丙中,所給的數值中-0.90的絕對值最接近1,
所以丙的線性相關性最強.
故答案為丙.
知識點04 非線性回歸分析
1.非線性回歸分析的思想
研究兩個變量的關系時,依據樣本點畫出散點圖,從整體上看,如果樣本點沒有分布在某個帶狀區域內,就稱這兩個變量之間不具有線性相關關系,此時不能直接利用線性回歸方程來建立兩個變量之間的關系.
2.非線性回歸方程
當回歸方程不是形如ybx+a(a,b∈R)時,稱回歸方程為非線性回歸方程.
當兩個變量不是線性相關關系時,依據樣本點的分布選擇合適的曲線方程來擬合數據,可通過變量代換,利用線性回歸模型建立兩個變量間的非線性回歸方程.
【即學即練4】某校一個課外學習小組為研究某作物種子的發芽率和溫度(單位:)的關系,在20個不同的溫度條件下進行種子發芽實驗,由實驗數據得到下面的散點圖:

由此散點圖,在10℃至35℃之間,下面四個回歸方程類型中最適宜作為發芽率y和溫度x的回歸方程類型的是( )
A. B. C. D.
【答案】A
【分析】根據散點圖的變化趨勢,結合常見函數的性質特征可得.
【詳解】由圖可知,隨著穩定的增加,發芽率的增長速度越來越慢,符合對數型函數的特征.
題型01 變量間的相關關系及判斷
【典例1】(多選)以下兩個變量成正相關的是(  )
A.學生的學籍號與學生的數學成績
B.堅持每天吃早餐的人數與患胃病的人數
C.氣溫與冷飲銷售量
D.電瓶車的重量和行駛每千米的耗電量
【答案】DD
【解析】對于A,學生的學籍號與學生的數學成績沒有相關關系;
對于B,一般情況下,堅持每天吃早餐的人患胃病的概率低,堅持每天吃早餐的人數與患胃病的人數成負相關關系;
對于C,一般情況下,氣溫低,喝冷飲的人少,氣溫與冷飲銷售量成正相關關系;
對于D,一般情況下,電瓶車越重,每千米的耗電量越高,電瓶車的重量和行駛每千米的耗電量成正相關關系.
綜上,兩個變量成正相關的是選項C,D.
【變式1】(24-25高三上·上海·開學考試)已知氣候溫度和海水表層溫度相關,且相關系數為負數,對此描述正確的是( )
A.氣候溫度高,海水表層溫度就高
B.氣候溫度高,海水表層溫度就低
C.隨著氣候溫度由低到高,海水表層溫度呈上升趨勢
D.隨著氣候溫度由低到高,海水表層溫度呈下降趨勢
【答案】A
【分析】根據相關系數的意義判斷各項的正誤即可.
【詳解】由于相關系數表示一個變量變化對另一個變量變化趨勢的影響,
所以隨著氣候溫度由低到高,海水表層溫度呈下降趨勢.
【變式2】(24-25高三上·上海·課后作業)已知變量X與Y相對應的一組數據為,,,,,變量U與V相對應的一組數據為,,,,.表示變量X與Y之間的線性相關系數,表示變量U與V之間的線性相關系數,則下列結論中正確的是( )
A. B. C. D.
【答案】D
【分析】根據正負相關與相關系數的關系分析判斷即可.
【詳解】由變量X與Y相對應的一組數據,可得變量X與Y之間正相關,∴;
由變量U與V相對應的一組數據,可知變量U與V之間負相關,∴;
綜上所述:與的大小關系是.
故選:C.
【變式3】(23-24高二上·全國·課后作業)相關系數r是衡量兩變量之間的線性相關程度的,對此有下列說法:①越接近于1,相關程度越大;②越接近于0,相關程度越小;③越接近于1,相關程度越小;④越接近于0,相關程度越大.其中正確的是( )
A.①② B.②④ C.②③ D.①④
【答案】A
【分析】根據相關系數的性質可得結論.
【詳解】由相關系數性質:越接近于1,成對樣本數據的線性相關程度越強,
越接近于0,成對樣本數據的線性相關程度越弱,
可知①②正確;
.
題型02 求線性回歸方程
【典例2】(22-23高二下·福建三明·期中)《中共中央國務院關于全面推進鄉村振興加快農業農村現代化的意見》,這是21世紀以來第18個指導“三農”工作的中央一號文件.文件指出,民族要復興,鄉村必振興.為助力鄉村振興,某電商平臺為某地的農副特色產品開設直播帶貨專場.為了對該產品進行合理定價,用不同的單價在平臺試銷,得到如下數據:
單價(元/件) 8 8.2 8.4 8.6 8.8 9
銷量(萬件) 90 84 83 80 75 68
(1)根據以上數據,求關于的線性回歸方程;
(2)若該產品成本是7元/件,假設該產品全部賣出,預測把單價定為多少時,工廠獲得最大利潤,最大利潤是多少.
附:參考公式:回歸方程,
其中,.
參考數據:,.
【答案】(1)
(2)該產品的單價定為元時,工廠獲得利潤最大,最大利潤為萬元.
【分析】(1)計算相關數據代入回歸方程公式中計算即可;
(2)設工廠獲得的利潤為萬元,寫出關于單價的二次函數,求出最大利潤即可.
【詳解】(1)因為,

所以.
則,
因此回歸直線方程為.
(2)設工廠獲得的利潤為萬元,
則,
所以該產品的單價定為元時,工廠獲得利潤最大,最大利潤為萬元.
【變式1】某地區實行社會主義新農村建設后,農村的經濟收入明顯增加,根據統計得到從2015年至2021年農村居民家庭收入y(單位:萬元)的數據,其數據如下表:
年份 2015 2016 2017 2018 2019 2020 2021
年份代號t 1 2 3 4 5 6 7
農村居民家庭收入y 3.9 4.3 4.6 5.4 5.8 6.2 6.9
附:回歸直線的斜率和截距的最小二乘估計公式分別為,.
參考數據:,.
(1)求y關于t的線性回歸方程;
(2)根據(1)中的回歸方程,分析2015年至2021年該地區農村居民家庭收入的變化情況,并預測該地區2024年農村居民家庭收入.
【答案】(1)
(2)2015年至2021年該地區農村居民家庭收入逐年增加,每年大約增加0.5萬元,該地區2024年農村居民家庭收入為8.3萬元.
【分析】(1)根據表中數據,結合最小二乘法的公式,求得,即可求得回歸直線方程;
(2)由(1)知,阿靜代入線性回歸方程,求得,即可得到結論.
【詳解】(1)解:由表中數據可得,,


則,又,
故所求線性回歸方程為.
(2)解:由(1)可知,,
故2015年至2021年該地區農村居民家庭收入逐年增加,每年大約增加0.5萬元,
將2024年的年份代號代入(1)中的線性回歸方程得,,
故預測該地區2024年農村居民家庭收入為8.3萬元.
【變式2】(22-23高二下·陜西西安·期中)基礎學科招生改革試點,即強基計劃,是教育部開展的招生改革工作,主要是為了選拔培養有志于服務國家重大戰略需求且綜合素質優秀或基礎學科拔尖的學生.聚焦高端芯片與軟件、智能科技、新材料、先進制造和國家安全等關鍵領域以及國家人才緊缺的人文社會科學領域.某校在一次強基計劃模擬考試后,從全體考生中隨機抽取52名,獲取他們本次考試的數學成績()和物理成績(),繪制成如圖散點圖:根據散點圖可以看出與之間有線性相關關系,但圖中有兩個異常點,.經調查得知,考生由于重感冒導致物理考試發揮失常,考生因故未能參加物理考試,為了使分析結果更科學準確,剔除這兩組數據后,對剩下的數據作處理,得到一些統計的值:,,,,,其中,分別表示這70名考生的數學成績、物理成績,,與的相關系數.

(1)若不剔除,兩名考生的數據,用52組數據作回歸分析,設此時與的相關系數為.試判斷與的大小關系(不必說明理由);
(2)求關于的線性回歸方程(系數精確到0.01),并估計如果考生加了這次物理考試,物理成績是多少?(精確到0.1)
【答案】(1)
(2),81.2分
【分析】(1)由題意結合相關系數的概念即可直接判斷;
(2)由題意計算出,代入公式計算出,即可得回歸方程,再代入即可估考生的物理成績.
【詳解】(1)由題意,
與成正相關關系,異常點會 低變量之間的相關程度,
∴;
(2)由題意,(1)及表得,
,,,,,
∴,
∴,
∴,
∴,
將代入,得,所以估計同學的物理成績為分.
【變式3】(2024上·江西新余·高二統考期末)某地政府為解除空巢老人日常護理和社會照料的困境,大力培育發展養老護理服務市場.從年開始新建社區養老機構,下表為該地區近年新建社區養老機構的數量對照表.
年份 2017 2018 2019 2020 2021 2022 2023
年份代碼 1 2 3 4 5 6 7
新建社區養老機構
(1)若該地區參與社區養老的老人的年齡近似服從正態分布,其中年齡的有人,試估計該地參與社區養老的老人有多少?(結果按四舍五入取整數)
(2)已知變量與之間的樣本相關系數,請求出關于的線性回歸方程,并據此估計年時,該地區新建社區養老機構的數量.(結果按四舍五入取整數)
參考公式與數據:①,.;
②若隨機變量,則,,;
③,.
【答案】(1)約為人
(2)回歸方程為;約為個.
【分析】(1)利用原則求出的值,即可求得該地參與社區養老的老人人數為;
(2)計算出的值,可求出的值,可求得的值,利用參考數據可求得的值,由此可得出回歸直線方程,然后將代入回歸直線方程可得結果.
【詳解】(1)解:由題意可知,,,則,,
所以,

所以,估計該地參與社區養老的老人人數為.
(2)解:由表格中的數據可得,
所以,,
由已知條件可得,
所以,,
所以,,
又因為,
顯然,解得,則,
所以,關于的回歸直線方程為,
當時,.
估計年時,該地區新建社區養老機構的數量約為個.
題型03 回歸直線方程的性質及應用
【典例3】1.(23-24高二下·福建寧德·階段練習)已知變量和的統計數據如下表:
6 8 10 12
2 3 5 6
根據上表可得回歸直線方程,據此可以預測當時,( )
A.7.8 B.6.5 C.9.6 D.8.2
【答案】A
【分析】利用回歸直線過樣本中心點求解,代入即可.
【詳解】根據表格中的數據,
當時,
【變式1】(23-24高二下·河南南陽·期中)某電腦公司有3名產品推銷員,其工作年限與年推銷金額數據如下表所示:
推銷員編號 1 2 3
工作年限年 3 5 10
推銷金額萬元 2 3 4
由表中數據算出經驗回歸方程中的.若第4名推銷員的工作年限為7年,則估計他的年推銷金額為( )
A.3.08萬元 B.3.14萬元 C.3.21萬元 D.3.27萬元
【答案】A
【分析】利用表格求出,代入經驗回歸方程,求得,即得回歸方程,最后代入年限即可求得.
【詳解】由題表中數據得,
由經驗回歸直線過點.又,所以,
所以,則當時,3.27,
所以估計第4名推銷員的年推銷金額為3.27萬元.
.
【變式2】(24-25高二·江蘇·假期作業)已知,的取值如下表所示,從散點圖分析可知與線性相關,如果線性回歸方程為,則實數的值為( )
2 3 4 5 6
6.5 10 11.5 18.5
A.13 B.13.5 C.14 D.14.5
【答案】C
【分析】利用線性回歸方程一定過樣本中心點,求解即可.
【詳解】由題意可知,,
因為線性回歸方程一定過樣本中心點,,
所以,
所以,
解得.

【變式3】(23-24高二下·安徽安慶·期末)根據成對樣本數據建立變量y關于x的經驗回歸方程為.若y的均值為6.2,則x的均值為( )
A.1.5 B.2 C.2.5 D.3
【答案】C
【分析】利用經驗在歸方程經過點,即可求出結果.
【詳解】將代入方程,解得.
.
題型04 相關系數的計算及應用
【典例4】(24-25高三·上海·課堂例題)測得10對父子身高[單位:英寸(1英寸)如下:
父親身高() 80 62 64 65 66 67 68 70 72 74
兒子身高() 63.6 65.2 66 65.5 66.9 67.1 67.4 68.3 70.1 70
(1)對變量與進行相關性檢驗;
(2)如果與之間具有相關關系,求回歸直線方程;
(3)如果父親身高為73英寸,試估計兒子的身高.
參考數據:,,,,,,.
【答案】(1)與之間具有較強的線性相關關系
(2)
(3)69.9英寸
【分析】(1)根據相關系數的公式代入計算的答案;
(2)根據最小二乘法計算得到回歸直線方程;
(3)把代入回歸方程得.
【詳解】(1),
因為非常接近于1,所以與之間具有較強的線性相關關系;
(2)設回歸直線方程為,,,
所以回歸直線方程為;
(3)時,,所以父親身高為73英寸時,兒子的身高約為69.9英寸.
【變式1】(23-24高二上·遼寧·期末)在一組樣本數據、、、、、、、不全相等)的散點圖中,若所有的樣本點都在直線上,則這組樣本數據的相關系數為( )
A. B. C. D.
【答案】D
【分析】根據相關系數的與線性相關關系可得解.
【詳解】因為所有的樣本點都在直線上,所以相關系數滿足.
又因為,所以,所以.
.
【變式2】(24-25高三上·湖北隨州·階段練習)若已知是的4倍,是的1.5倍,則樣本相關系數r的值為 .
【答案】/0.75
【分析】利用相關系數的公式計算即可.
【詳解】解:.
故答案為:.
【變式3】(24-25高三·上海·隨堂練習)隨著智能手機的普及,使用手機上網成為人們日常生活的一部分,很多消費者對手機流量的需求越來越大,某通信公司為了更好地滿足消費者對流量的需求,準備推出一款流量包.該通信公司選了5個城市(總人數、經濟發展情況、消費能力等方面比較接近)采用不同的定價方案作為試點,經過一個月的統計,發現該流量包的定價x(單位:元/月)和購買人數y(單位:萬人)的關系如下表:
x 30 35 40 45 70
y 18 14 10 8 5
計算該流量包的定價x與購買人數y的相關系數 .(結果保留3位小數)
【答案】
【分析】根據相關系數的公式計算結果;
【詳解】根據表格中的數據,
可得,.
可列表如下:
i 1 2 3 4 5
-10 -5 0 5 10
7 3 -1 -3 -6
-70 -15 0 -15 -80
則,

因此相關系數

故答案為:.
【變式4】(25-26高三上·上海·單元測試)當前,冷凍冷藏類技術發展迅速且應用廣泛.某制冷技術重點實驗室研究了不同果蔬在不同凍結速率下的冰點溫度,以及低溫環境對果蔬熱物性的影響.設凍結速率為x(單位:分鐘),冰點溫度為y(單位:℃),如表為某種水果冰點溫度隨凍結速率變化的統計數據:
x 10 20 30 40 70
y -5 -4.5 -2 1 2
根據以上數據,繪制了散點圖:
(1)由散點圖可以看出,可用線性回歸模型擬合y與x的關系,請用相關系數r加以說明;
(2)求y關于x的線性回歸方程,并預測當凍結速率為80分鐘時,這種水果的冰點溫度.
【答案】(1)答案見解析
(2), 4.15℃
【分析】(1)根據所給數據計算相關系數可得.
(2)求出回歸方程中系數,得回歸方程,代入回歸方程可得估計值.
【詳解】(1),
,因為,
故兩個變量間線性相關性很強,可以用線性回歸模型擬合y與x的關系;
(2)由表可知,,,
,,
故y關于x的線性回歸方程為,
當時,,
故當凍結速率為80分鐘時,這種水果的冰點溫度為4.15℃.
題型05 非線性回歸模型及應用
【典例5】為幫助鄉村脫貧,某勘探隊計劃了解當地礦脈某金屬的分布情況,測得了平均金屬含量(單位:)與樣本對原點的距離(單位:m)的數據,并作了初步處理,得到了下面的一些統計理的值.(表中,)
6 97.90 0.21 80 0.14 14.12 26.13
(1)利用樣本相關系數的知識,判斷與哪一個更適宜作為平均金屬含量關于樣本對原點的距離的回歸方程類型?
(2)根據(1)的結果回答下列問題:
①建立關于的回歸方程;
②樣本對原點的距離時,金屬含量的預報值是多少?
附:對于一組數據,其線性相關系數,其回歸直線的斜率和截距的最小二乘估計分別為:,.
【答案】(1)更適宜;
(2)①;②
【分析】(1)分別求出與所對應的線性相關系數,然后比較大小即可判斷.
(2)根據數據和公式即可求得關于的回歸方程,根據回歸方程代入,即可求出金屬含量的預報值.
【詳解】(1)由題的線性相關系數,
的線性相關系數,
因為,所以,
所以更適宜作為平均金屬含量關于樣本對原點的距離的回歸方程類型.
(2)①由(1),令,,
則,
所以,,
則,
即.
②當時,
金屬含量的預報值
【變式1】(24-25·高三全國·專題)一座城市的夜間經濟不僅有助于拉動本地居民內需,還能延長外地游客、商務辦公者等的留存時間,帶動當地經濟發展,是衡量一座城市生活質量、消費水平、投資環境及文化發展活力的重要指標.數據顯示,近年來中國各地政府對夜間經濟的扶持力度加大,夜間經濟的市場發展規模保持穩定增長,下表為2017—2022年中國夜間經濟的市場發展規模(單位:萬億元),設2017—2022年對應的年份代碼依次為1~6.
年份代碼x 1 2 3 4 5 6
中國夜間經濟的市場發展規模y/萬億元 20.5 22.9 26.4 30.9 36.4 42.4
(1)已知可用函數模型擬合y與x的關系,請建立y關于x的回歸方程(a,b的值精確到0.01);
(2)某傳媒公司發布的2023年中國夜間經濟城市發展指數排行榜前10名中,吸引力超過90分的有4個,從這10個城市中隨機抽取5個,記吸引力超過90分的城市數量為X,求X的分布列與數學期望.
參考數據:
3.366 73.282 17.25 1.16
其中.
參考公式:對于一組數據,,…,,其回歸直線的斜率和截距的最小二乘法估計分別為,.
【答案】(1)
(2)分布列見解析,2
【分析】(1)將的等號兩邊同時取對數,再結合回歸直線的斜率和截距的最小二乘法求得結果;
(2)X的所有可能取值為0,1,2,3,4,根據超幾何分布求出分布列以及數學期望.
【詳解】(1)將的等號兩邊同時取對數得,
所以.,

所以,

所以,即,
所以.
(2)由題可知X的所有可能取值為0,1,2,3,4,
,,
,,.
所以X的分布列為
X 0 1 2 3 4
P

【變式2】(2024·全國·模擬預測)一座城市的夜間經濟不僅有助于拉動本地居民內需,還能延長外地游客、商務辦公者等的留存時間,帶動當地經濟發展,是衡量一座城市生活質量、消費水平、投資環境及文化發展活力的重要指標.數據顯示,近年來中國各地政府對夜間經濟的扶持力度加大,夜間經濟的市場發展規模保持穩定增長,下表為2017—2022年中國夜間經濟的市場發展規模(單位:萬億元),其中2017—2022年對應的年份代碼依次為1~6.
年份代碼 1 2 3 4 5 6
中國夜間經濟的市場發展規模萬億元 20.5 22.9 26.4 30.9 36.4 42.4
(1)已知可用函數模型擬合與的關系,請建立關于的回歸方程(的值精確到0.01);
(2)某傳媒公司預測2023年中國夜間經濟的市場規模將達到48.1萬億元,現用(1)中求得的回歸方程預測2023年中國夜間經濟的市場規模,若兩個預測規模誤差不超過1萬億元,則認為(1)中求得的回歸方程是理想的,否則是不理想的,判斷(1)中求得的回歸方程是否理想.參考數據:
3.366 73.282 17.25 1.16 2.83
其中.
參考公式:對于一組數據,其回歸直線的斜率和截距的最小二乘估計分別為.
【答案】(1);
(2)是理想的
【分析】(1)通過對所給的的函數模型取對數,轉換為求回歸直線方程即可,再結合題中所給的直線方程與數據即可得解.
(2)利用(1)中求得的函數模型進行預測,結合回歸方程理想的定義判斷即可.
【詳解】(1)將的等號左右兩邊同時取自然對數得,
所以.,
而,
所以,

所以,即,
所以.
(2)2023年對應的年份代碼為7,
當時,,,
所以(1)中求得的回歸方程是理想的.
一、單選題
1.(23-24高二下·甘肅蘭州·期末)下列各關系不屬于相關關系的是( )
A.產品的樣本與生產數量 B.球的表面積與體積
C.家庭的支出與收入 D.人的年齡與體重
【答案】C
【分析】根據相關關系的定義判斷.
【詳解】對于A:產品的樣本與生產數量是相關關系,故A正確;
對于B:設球的半徑為,球的表面積為、體積為,
則,所以,而,
所以球的表面積與體積是一種函數關系,故B錯誤;
對于C:家庭的支出與收入是相關關系,故C正確;
對于D:人的年齡與體重是相關關系,故D正確.
2.(23-24高二下·山西大同·期中)對兩個變量進行線性相關性檢驗,得線性相關系數,對兩個變量進行線性相關性檢驗,得線性相關系數,則下列判斷正確的是( )
A.變量與變量正相關,變量與變量負相關,變量與變量的線性相關性更強
B.變量與變量負相關,變量與變量正相關,變量與變量的線性相關性更強
C.變量與變量負相關,變量與變量正相關,變量與變量的線性相關性更強
D.變量與變量正相關,變量與變量負相關,變量與變量的線性相關性更強
【答案】A
【分析】根據相關系數的符號的正負決定兩個變量的正相關、負相關,以及相關系數絕對值越大,兩個變量的線性相關性越強,進而可得出結論.
【詳解】由線性相關系數知與正相關,
由線性相關系數知與負相關,
又,所以變量與變量的線性相關性比變量與變量的線性相關性更強.

3.(23-24高二上·江蘇常州·期末)用最小二乘法得到一組數據的線性回歸方程為,若,則( )
A.11 B.13 C.63 D.78
【答案】A
【分析】根據線性回歸方程為一定過點,先求出,代入回歸方程即可得出,進而可得的值.
【詳解】依題意,
因為,所以,
因為線性回歸方程為一定過點,
所以,
所以.
.
4.(23-24高二下·黑龍江大慶·期中)某校課外學習小組研究某作物種子的發芽率和溫度(單位:)的關系,由實驗數據得到如圖所示的散點圖.由此散點圖判斷,最適宜作為發芽率和溫度的回歸方程類型的是( )
A. B.
C. D.
【答案】A
【分析】根據散點的分布可得出合適的回歸方程類型.
【詳解】由散點圖可見,數據分布成遞增趨勢,但是呈現上凸效果,即增加緩慢.
A中,是直線型,均勻增長,不符合要求;
B中,是二次函數型,圖象呈現下凸,增長也較快,不符合要求;
C中,是指數型,爆炸式增長,增長快,不符合要求;
D中,是對數型,增長緩慢,符合要求.
故對數型最適宜該回歸模型.
.
5.(24-25高二·江蘇·假期作業)為創建良好的生態環境,某地大力發展新能源產業,近4年該地新能源產業生產總值情況如下表所示:
第年 1 2 3 4
生產總值百萬元 32 52 73 95
已知變量與之間具有線性相關關系,設用最小二乘法建立的回歸直線方程為,則利用該模型預測該地第六年的生產總值為( )
A.136.5 B.137.5 C.138.5 D.139.5
【答案】A
【分析】根據線性回歸方程過樣本中心點,計算、,求出回歸方程,再計算時的值即可.
【詳解】由題,,
代入回歸方程得,
所以,
故當時,.
.
6.(24-25高二下·全國·課后作業)為考察兩個變量,的相關性,搜集數據如表,則兩個變量的線性相關程度( )
5 10 15 20 25
103 105 110 111 114
(參考數據:,,)
A.很強 B.很弱 C.無相關 D.不確定
【答案】A
【分析】根據已知計算相關系數,再根據相關系數的值判斷線性相關程度.
【詳解】由題可得,,


因為相關系數很接近于1,故兩個變量的線性相關程度很強.
.
7.(23-24高二下·江蘇南京·階段練習)為了研究關于的線性相關關系,收集了組樣本數據(見下表):
若已求得一元線性回歸方程為,則下列選項中正確的是( )
(其中相關系數)
A.
B.當時,的預測值為
C.樣本數據的第40百分位數為
D.去掉樣本點后,與的樣本相關系數不會改變
【答案】A
【分析】A項,求出,將樣本中心點代入回歸直線方程可求;B項,利用回歸直線方程代值運算預測即可;C項,按百分位數求法步驟求解;D項,新樣本平均值沒有變化,由相關系數公式可知.
【詳解】A項,,
所以樣本點的中心坐標為,
將它代入得,,解得,故A錯誤;
B項,當時,的預測值為,故B錯誤;
C項,由為整數,則樣本數據的第40百分位數為,故C錯誤;
D項,去掉樣本點后,新樣本數據的平均值沒有變化,即仍然不成立,
不妨設為第組數據,即,則,其余數據沒有變化.
則由相關系數公式可知,
即新樣本數據與的相關系數與原數據相關系數相等,
即與的樣本相關系數不會改變,故D正確.
.
8.(23-24高二下·福建漳州·階段練習)2024海峽兩岸各民族歡度“三月三”暨福籽同心愛中華·福建省第十一屆“三月三”畬族文化節活動在寧德隆重開幕.海峽兩岸各民族同胞齊聚于此,與當地群眾共同歡慶“三月三”,暢敘兩岸情.在活動現場,為了解不同時段的入口游客人流量,從上午10點開始第一次向指揮中心反饋入口人流量,以后每過一個小時反饋一次.指揮中心統計了前5次的數據,其中,為第次入口人流量數據(單位:百人),由此得到關于的回歸方程,,已知,根據回歸方程(參考數據:,),可預測下午4點時入口游客的人流量為( )
A.9.6 B.11.0 C.11.4 D.12.0
【答案】C
【分析】令,由,得,因為,所以
則,即可求解.
【詳解】令,則,
又,由,得,
因為,所以
則,
下午4點時對應的是,
可得,
二、多選題
9.(24-25高二下·全國·課后作業)/年月日,人社部官網發布全國各地區最低工資標準情況,從月最低工資標準來看,上海、深圳、北京位列前三.某學生為了研究居民收入與幸福指數的相關關系,查詢到如下數據,后來發現其中一個數據記錄有誤,去掉該數據,則( )

A.樣本相關系數變大 B.居民收入與幸福指數呈現負相關
C.樣本相關系數 D.居民收入與幸福指數的線性相關程度變強
【答案】AD
【分析】根據散點圖進行分析,利用相關系數的意義可得結論.、
【詳解】由散點圖知,去掉后,幸福指數與居民收入的線性相關程度變強,
且為正相關,變大,故A,D正確,B錯誤.
又該四組數據不在一條直線上,故,故C錯誤.
D.
10.(24-25高三上·四川綿陽·階段練習)某類汽車在今年1至5月的銷量y(單位:千輛)如下表所示(其中2月份銷量未知):
月份x 1 2 3 4 5
月銷量y 2.4 m 4 5 5.5
若變量y與x之間存在線性相關關系,用最小二乘法估計建立的經驗回歸方程為,則下列說法正確的是( )
A.
B.殘差絕對值最大為0.2
C.樣本相關系數
D.當解釋變量每增加1,響應變量增加0.85
【答案】AB
【分析】對于A,根據回歸直線必過樣本中心點可解得;對于B,根據殘差的定義計算,即可判斷;對于C,根據表格和相關系數的意義,即可判斷;對于D,根據相關關系的定義,即可判斷.
【詳解】由題意知:,又,
代入方程得,所以,解得,故A正確;
1月份的殘差為,2月份的殘差為,3月份的殘差為,4月份的殘差為,5月份的殘差為,所以殘差絕對值最大為,故B正確;
由表格可知變量與呈正線性相關,則,故C不正確;
當解釋變量每增加1,響應變量不一定增加0.85,故D不正確,
B.
11.(2024高二下·全國·專題練習)某騎行愛好者在專業人士指導下對近段時間騎行鍛煉情況進行統計分析,統計每次騎行期間的身體綜合指標評分與騎行用時(單位:小時)如下表:
身體綜合指標評分 1 2 3 4 5
用時小時) 9.5 8.8 7.8 7 6.1
由上表數據得到的錯誤結論是( )
參考數據:,
參考公式:相關系數.
A.身體綜合指標評分與騎行用時正相關
B.身體綜合指標評分與騎行用時的相關程度較弱
C.身體綜合指標評分與騎行用時的相關程度較強
D.身體綜合指標評分與騎行用時的關系不適合用線性回歸模型擬合
【答案】ABD
【分析】利用公式求出相關系數值,根據相關系數的正負值判斷與正負相關性;利用相關系數值判斷相關程度強與弱.
【詳解】由題意,

,,

因為相關系數.
即相關系數近似為,且相關程度強,
并且與負相關,從而可用線性回歸模型擬合與的關系.
所以選項ABD錯誤,C正確.
BD.
三、填空題
12.(24-25高三上·廣東江門·階段練習)已知,之間的一組數據:若與滿足經驗回歸方程,則此曲線必過點 .
x
y
【答案】
【分析】設,則,根據回歸方程性質可得回歸直線所過定點.
【詳解】由已知,
設,則,
由回歸直線性質可得在直線上,
又,,
所以點在直線上,故點在曲線上.
故答案為:.
13.(23-24高二下·天津·期末)為了了解家庭月收入(單位:千元)與月儲蓄(單位:千元)的關系,從某居民區隨機抽取10個家庭,根據測量數據的散點圖可以看出與之間具有線性相關關系,其回歸直線方程為,若該居民區某家庭月收入為7千元,據此估計該家庭的月儲蓄為 千元.
【答案】
【分析】直接代入即得答案.
【詳解】由于,代入,于是得到,故答案為1.7.
【點睛】本題主要考查線性回歸方程的理解,難度很小.
14.(18-19高二下·內蒙古巴彥淖爾·階段練習)在研究兩個變量的相關關系時,觀察散點圖發現樣本點集中于某一條指數曲線的周圍.令,求得線性回歸方程為,則該模型的非線性回歸方程為 .
【答案】
【分析】由回歸直線方程可得:,解出,問題得解.
【詳解】由回歸直線方程,得:,
整理得:,
所以該模型的回歸方程為.
故答案為: .
四、解答題
15.(2025高三·全國·專題練習)2023年是全面貫徹落實黨二十大精神的開局之年,也是實施“十四五”規劃承上啟下的關鍵之年,經濟增長呈現穩中有進的可喜現象.2023年8月4日,貴州省工業和信息化廳召開推進貴州刺梨產業高質量發展專題會議,安排部署加快推進特色優勢產業刺梨高質量發展工作,集中資源、力量打造“貴州刺梨”公共品牌.貴州省為做好刺梨產業的高質量發展,項目組統計了全省近5年刺梨產業綜合總產值的各項數據如下:
年份,綜合產值(單位:億元)
年份 2018 2019 2020 2021 2022
年份代碼 1 2 3 4 5
綜合產值 23.1 37.0 62.1 111.6 170.8
(1)根據表格中的數據,可用一元線性回歸模型刻畫變量與變量之間的線性相關關系,請用相關系數加以說明(精確到0.01);
(2)求出關于的經驗回歸方程,并預測2023年底貴州省刺梨產業的綜合總產值.
參考公式:
相關系數.回歸方程中斜率和截距的最小二乘法估計公式分別為,;
參考數據:,,,,,.
【答案】(1)可用一元線性回歸模型刻畫變量與變量之間的線性相關關系,說明見解析
(2),億元
【分析】(1)根據相關系數的計算公式可得,即可判斷;
(2)根據最小二乘法即可求解,代入即可求解.
【詳解】(1)由題設,
則,


所以,兩個變量有強相關性,
故可用一元線性回歸模型刻畫變量與變量之間的線性相關關系.
(2)由(1),得,,
所以,
當時,億元.
16.(2025高三·全國·專題練習)人們用大數據來描述和定義信息時代產生的海量數據,并利用這些數據處理事務和做出決策,某公司通過大數據收集到該公司銷售的某電子產品1月至5月的銷售量如下表.
月份 1 2 3 4 5
銷售量(萬件) 4.9 5.8 6.8 8.3 10.2
該公司為了預測未來幾個月的銷售量,建立了關于的回歸模型:.
(1)根據所給數據與回歸模型,求關于的回歸方程(的值精確到0.1);
(2)已知該公司的月利潤(單位:萬元)與,的關系為,根據(1)的結果,問該公司哪一個月的月利潤預報值最大?
【答案】(1)
(2)第9個月的月利潤預報值最大.
【分析】(1)將非線性回歸方程問題轉化線性回歸方程問題,根據最小二乘法求解即可.
(2)先求得的表達式,然后利用導數來求得最值問題.
【詳解】(1)令,則,

,,
所以關于的回歸方程為.
(2)由(1)知,

令(),
(),
令,得,單調遞增,
令,得,單調遞減,
令,得,
所以()在處取得極大值,也是最大值,
所以,
所以第9個月的月利潤預報值最大.
17.(24-25高三上·重慶·階段練習)小李和小張關注到習近平總書記今年4月在重慶考察時強調:“奮力打造新時代西部大開發重要戰略支點、內陸開放綜合樞紐”,于是決定大學畢業后回家鄉重慶創業.他們投入5萬元(包括購買設備、房租、生活費等)建立了一個直播間,幫助山區人民售賣農產品.在直播間里,他們利用所學知識談天說地,跟粉絲互動,集聚了一定的人氣,試播一段時間之后,正式帶貨.他們統計了第一周的帶貨數據如下:
第x天 1 2 3 4 5 6 7
銷售額y(萬元) 1.4 1.6 2.2 2.4 3 3.9 5.1
(1)求樣本的相關系數(精確到0.01);
(2)用最小二乘法求出關于的回歸方程(系數精確到0.01,并用精確后的的值計算的值),并預測第8天的銷售額(預測結果精確到0.01).
附:①相關系數;
②回歸方程中的斜率和截距的最小二乘估計公式分別為,;
③,,.
所以樣本的相關系數約為0.96.
(2)因為,,
所以,
又,,
所以,
所以回歸方程為,
當時,,
所以預測第8天的銷售額為萬元.
18.(24-25高三上·四川眉山·階段練習)臺州是全國三大電動車生產基地之一,擁有完整的產業鏈和突出的設計優勢.某電動車公司為了搶占更多的市場份額,計劃加大廣告投入、該公司近5年的年廣告費(單位:百萬元)和年銷售量(單位:百萬輛)關系如圖所示:令,數據經過初步處理得:
44 4.8 10 40.3 1.612 19.5 8.06
現有①和②兩種方案作為年銷售量y關于年廣告費x的回歸分析模型,其中a,b,m,n均為常數.
(1)請從相關系數的角度,分析哪一個模型擬合程度更好
(2)根據(1)的分析選取擬合程度更好的回歸分析模型及表中數據,求出關于的回歸方程,并預測年廣告費為6(百萬元)時,產品的年銷售量是多少
(2)因為,
又由,,
得,
所以,即回歸方程為.
當時,,
因此當年廣告費為6(百萬元)時,產品的銷售量大概是13(百萬輛).
19.(24-25高二上·四川眉山·期中)臺州是全國三大電動車生產基地之一,擁有完整的產業鏈和突出的設計優勢.某電動車公司為了搶占更多的市場份額,計劃加大廣告投入、該公司近5年的年廣告費(單位:百萬元)和年銷售量(單位:百萬輛)關系如圖所示:

令,數據經過初步處理得:,,,,,,,現有①和②兩種方案作為年銷售量y關于年廣告費x的回歸分析模型,其中a,b,m,n均為常數.
(1)請從相關系數的角度,分析哪一個模型擬合程度更好?
(2)根據(1)的分析選取擬合程度更好的回歸分析模型及表中數據,求出y關于x的回歸方程,并預測年廣告費為6(百萬元)時,產品的年銷售量是多少?
(3)該公司生產的電動車毛利潤為每輛200元(不含廣告費、研發經費).該公司在加大廣告投入的同時也加大研發經費的投入,年研發經費為年廣告費的199倍.電動車的年凈利潤受年廣告費和年研發經費影響外還受隨機變量影響,設隨機變量服從正態分布,且滿足.在(2)的條件下,求該公司年凈利潤的最大值大于1000(百萬元)的概率.(年凈利潤=毛利潤×年銷售量-年廣告費-年研發經費-隨機變量).
附:
①相關系數,回歸直線中公式分別為,;
②參考數據:,,,.
【答案】(1)模型②的擬合程度更好
(2),13(百萬輛)
(3)0.3
【分析】(1)分別求得模型①和②的相關系數,,然后比較得出結論;
(2)利用最小二乘法求解;
(3)由凈利潤為,求解.
【詳解】(1)設模型①和②的相關系數分別為,,
由題意可得:,
,
所以,由相關系數的相關性質可得,模型②的擬合程度更好.
(2)因為,
又由,,
得,
所以,即回歸方程為,
當時,,
因此當年廣告費為6(百萬元)時,產品的銷售量大概是13(百萬輛).
(3)凈利潤為,,
令,
所以,
可得在上為增函數,在上為減函數,
所以,
由題意得:,即,

即該公司年凈利潤大于1000(百萬元)的概率為0.3.
21世紀教育網(www.21cnjy.com)第06講 一元線性回歸模型
課程標準 學習目標
1.理解散點圖、線性相關、正相關、負相關的概念. 2.理解并掌握回歸直線方程的概念和性質,會求線性相關的兩個變量的回歸直線方程. 3.理解并掌握相關系數的概念及性質,并能判斷兩個變量之間線性相關性的強弱. 4.了解非線性回歸的相關概念. 1.通過對數據的分析、統計,培養數據分析等核心素養. 2.借助變量間相關關系的研究,提升數學抽象、數學運算等核心素養. 3.借助求回歸直線方程和相關系數,培養學生數學建模、數據分析及數學運算等核心素養.
知識點01 變量的相關關系
1.兩個變量的關系
(1)一類是兩變量之間的關系具有確定性,當一個變量確定后,另一個變量就確定了.
(2)另一類是變量之間具有一定的關系,但沒有達到可以相互決定的程度.它們之間的關系帶有一定的隨機性,這些兩個變量之間的關系,在統計學上都稱為相關關系.
【解讀】相關關系與函數關系的異同:
關系 異同點 函數關系 相關關系
相同點 兩者均是兩個變量之間的關系
不同點 是一種確定性關系 是一種非確定性關系
是一種因果關系 不一定是因果關系,也可能是伴隨關系
是一種理想的關系 是更為一般的情況
3.散點圖
(1)概念:一般地,如果收集到了變量x和變量y的n對數據(簡稱為成對數據),如下表所示:
序號i 1 2 3 … n
變量x x1 x2 x3 … xn
變量y y1 y2 y3 … yn
則在平面直角坐標系xOy中描出點(xi,yi),i1,2,3,…,n,就可以得到這n對數據的散點圖.
(2)作用:散點圖展示了樣本點散布的位置.根據散點圖中點的分布趨勢分析兩個變量之間的關系,可直觀地判斷并得出結論.
【解讀】
(1)散點圖具有直觀、簡明的特點,我們可以根據散點圖來判斷兩個變量有沒有相關關系;
(2)通過散點圖不但可以判斷測量值的大小、變動范圍與整體趨勢,還可以通過觀察剔除異常數值,提高估計相關程度的準確性;
(3)當所畫的散點圖的橫坐標與縱坐標所對應的數據差距很大時,可在實際作圖時,將橫坐標與縱坐標取不同的單位長度,使畫出的散點圖形象、美觀.
3.線性相關正相關、負相關
如果由變量的成對數據、散點圖或直觀經驗可知,變量x與變量y之間的關系可以近似地用一次函數來刻畫,則稱x與y線性相關.此時,如果一個變量增大,另一個變量大體上也增大,則稱這兩個變量正相關;如果一個變量增大,另一個變量大體上減少,則稱這兩個變量負相關.
【即學即練1】)兩個變量成正相關的是(  )
A.汽車的重量和汽車每消耗1升汽油所行駛的平均路程
B.平均日學習時間和平均學習成績
C.某人每日吸煙量和其身體健康情況
D.汽車的重量和百公里耗油量
知識點02 回歸直線方程
1.回歸直線方程的概論
一般地,已知變量x與y的n對成對數據(xi,yi),i1,2,3,…,n.任意給定一個一次函數ybx+a,對每一個已知的xi,由直線方程可以得到一個估計值ibxi+a,如果一次函數x+能使(1-y1)2+(2-y2)2+…+(n-yn)2(yi-i)2取得最小值,則yx+稱為y關于x的回歸直線方程(對應的直線稱為回歸直線).
2.最小二乘法
上述求回歸直線方程的過程中需使得平方和最小,所以其中涉及的方法稱為最小二乘法.
可以證明,給定兩個y與x的一組數據之后,回歸直線方程x+總是存在的,而且
,=.
其中,稱為回歸系數.它實際上也就是回歸直線方程的斜率.回歸直線方程確定之后,就可用于預測.
需要注意的是,上述公式中,指的是x1,x2,x3,…,xn的平均數,即(x1+x2+…+xn);類似地,是y1,y2,y3,…,yn的平均數,即.
【解讀】(1)回歸直線一定過點(,);
(2)y與x正相關的充要條件是>0;y與x負相關的充要條件是<0;
(3)當x增大一個單位時,增大個單位,這就是回歸系數的實際意義;
(4)回歸直線方程中x的系數是,表示直線的斜率,注意與《選擇性必修第一冊》中的一次函數的關系式或直線方程yax+b進行區分.
【即學即練2】已知某車間加工零件的個數x與所花費時間y(h)之間的回歸直線方程為0.01x+0.5,則加工800個零件大約需要(  )
A.6.5 h       B.5.5 h
C.3.5 h D.0.5 h
知識點03 相關系數
1.概念:注意到現實生活中的數據,由于度量對象和單位的不同等,數值會有大有小,為了去除這些因素的影響,統計學里一般用
來衡量y與x的線性相關性強弱,這里的r稱為線性相關系數(簡稱為相關系數).
2.性質
(1)|r|≤1,且y與x正相關的充要條件是r>0,y與x負相關的充要條件是r<0.
(2)|r|越小,說明兩個變量之間的線性相關性越弱,也就是得出的回歸直線方程越沒有價值,即方程越不能反映真實的情況;|r|越大,說明兩個變量之間的線性相關性越強,也就是得出的回歸直線方程越有價值.
(3)|r|1的充要條件是成對數據構成的點都在回歸直線上.
(1)樣本的相關系數r可以定量地反映出變量間的相關程度,明確給出有無必要建立兩變量間的回歸方程;
(2)|r|很小只是說明兩個變量之間的線性相關程度弱,但不一定不相關.
3.相關系數與向量夾角的余弦
一般地,a(x1-,x2-,…,xn-),b(y1-,y2-,…,yn-)都稱為n維向量,如果按照類似2維與3維的情況定義向量的內積和模,則相關系數r總是等于兩個向量夾角的余弦,即rcos .
【即學即練3】若對甲、乙、丙3組不同的數據作線性相關性檢驗,得到這3組數據的線性相關系數依次為0.83,0.72,-0.90,則線性相關性最強的一組是____________(填甲、乙、丙中的一個).
知識點04 非線性回歸分析
1.非線性回歸分析的思想
研究兩個變量的關系時,依據樣本點畫出散點圖,從整體上看,如果樣本點沒有分布在某個帶狀區域內,就稱這兩個變量之間不具有線性相關關系,此時不能直接利用線性回歸方程來建立兩個變量之間的關系.
2.非線性回歸方程
當回歸方程不是形如ybx+a(a,b∈R)時,稱回歸方程為非線性回歸方程.
當兩個變量不是線性相關關系時,依據樣本點的分布選擇合適的曲線方程來擬合數據,可通過變量代換,利用線性回歸模型建立兩個變量間的非線性回歸方程.
【即學即練4】某校一個課外學習小組為研究某作物種子的發芽率和溫度(單位:)的關系,在20個不同的溫度條件下進行種子發芽實驗,由實驗數據得到下面的散點圖:

由此散點圖,在10℃至35℃之間,下面四個回歸方程類型中最適宜作為發芽率y和溫度x的回歸方程類型的是( )
A. B. C. D.
題型01 變量間的相關關系及判斷
【典例1】(多選)以下兩個變量成正相關的是(  )
A.學生的學籍號與學生的數學成績
B.堅持每天吃早餐的人數與患胃病的人數
C.氣溫與冷飲銷售量
D.電瓶車的重量和行駛每千米的耗電量
【變式1】(24-25高三上·上海·開學考試)已知氣候溫度和海水表層溫度相關,且相關系數為負數,對此描述正確的是( )
A.氣候溫度高,海水表層溫度就高
B.氣候溫度高,海水表層溫度就低
C.隨著氣候溫度由低到高,海水表層溫度呈上升趨勢
D.隨著氣候溫度由低到高,海水表層溫度呈下降趨勢
【變式2】(24-25高三上·上海·課后作業)已知變量X與Y相對應的一組數據為,,,,,變量U與V相對應的一組數據為,,,,.表示變量X與Y之間的線性相關系數,表示變量U與V之間的線性相關系數,則下列結論中正確的是( )
A. B. C. D.
【變式3】(23-24高二上·全國·課后作業)相關系數r是衡量兩變量之間的線性相關程度的,對此有下列說法:①越接近于1,相關程度越大;②越接近于0,相關程度越小;③越接近于1,相關程度越小;④越接近于0,相關程度越大.其中正確的是( )
A.①② B.②④ C.②③ D.①④
題型02 求線性回歸方程
【典例2】(22-23高二下·福建三明·期中)《中共中央國務院關于全面推進鄉村振興加快農業農村現代化的意見》,這是21世紀以來第18個指導“三農”工作的中央一號文件.文件指出,民族要復興,鄉村必振興.為助力鄉村振興,某電商平臺為某地的農副特色產品開設直播帶貨專場.為了對該產品進行合理定價,用不同的單價在平臺試銷,得到如下數據:
單價(元/件) 8 8.2 8.4 8.6 8.8 9
銷量(萬件) 90 84 83 80 75 68
(1)根據以上數據,求關于的線性回歸方程;
(2)若該產品成本是7元/件,假設該產品全部賣出,預測把單價定為多少時,工廠獲得最大利潤,最大利潤是多少.
附:參考公式:回歸方程,
其中,.
參考數據:,.
【變式1】某地區實行社會主義新農村建設后,農村的經濟收入明顯增加,根據統計得到從2015年至2021年農村居民家庭收入y(單位:萬元)的數據,其數據如下表:
年份 2015 2016 2017 2018 2019 2020 2021
年份代號t 1 2 3 4 5 6 7
農村居民家庭收入y 3.9 4.3 4.6 5.4 5.8 6.2 6.9
附:回歸直線的斜率和截距的最小二乘估計公式分別為,.
參考數據:,.
(1)求y關于t的線性回歸方程;
(2)根據(1)中的回歸方程,分析2015年至2021年該地區農村居民家庭收入的變化情況,并預測該地區2024年農村居民家庭收入.
【變式2】(22-23高二下·陜西西安·期中)基礎學科招生改革試點,即強基計劃,是教育部開展的招生改革工作,主要是為了選拔培養有志于服務國家重大戰略需求且綜合素質優秀或基礎學科拔尖的學生.聚焦高端芯片與軟件、智能科技、新材料、先進制造和國家安全等關鍵領域以及國家人才緊缺的人文社會科學領域.某校在一次強基計劃模擬考試后,從全體考生中隨機抽取52名,獲取他們本次考試的數學成績()和物理成績(),繪制成如圖散點圖:根據散點圖可以看出與之間有線性相關關系,但圖中有兩個異常點,.經調查得知,考生由于重感冒導致物理考試發揮失常,考生因故未能參加物理考試,為了使分析結果更科學準確,剔除這兩組數據后,對剩下的數據作處理,得到一些統計的值:,,,,,其中,分別表示這70名考生的數學成績、物理成績,,與的相關系數.

(1)若不剔除,兩名考生的數據,用52組數據作回歸分析,設此時與的相關系數為.試判斷與的大小關系(不必說明理由);
(2)求關于的線性回歸方程(系數精確到0.01),并估計如果考生加了這次物理考試,物理成績是多少?(精確到0.1)
【變式3】(2024上·江西新余·高二統考期末)某地政府為解除空巢老人日常護理和社會照料的困境,大力培育發展養老護理服務市場.從年開始新建社區養老機構,下表為該地區近年新建社區養老機構的數量對照表.
年份 2017 2018 2019 2020 2021 2022 2023
年份代碼 1 2 3 4 5 6 7
新建社區養老機構
(1)若該地區參與社區養老的老人的年齡近似服從正態分布,其中年齡的有人,試估計該地參與社區養老的老人有多少?(結果按四舍五入取整數)
(2)已知變量與之間的樣本相關系數,請求出關于的線性回歸方程,并據此估計年時,該地區新建社區養老機構的數量.(結果按四舍五入取整數)
參考公式與數據:①,.;
②若隨機變量,則,,;
③,.
題型03 回歸直線方程的性質及應用
【典例3】1.(23-24高二下·福建寧德·階段練習)已知變量和的統計數據如下表:
6 8 10 12
2 3 5 6
根據上表可得回歸直線方程,據此可以預測當時,( )
A.7.8 B.6.5 C.9.6 D.8.2
【變式1】(23-24高二下·河南南陽·期中)某電腦公司有3名產品推銷員,其工作年限與年推銷金額數據如下表所示:
推銷員編號 1 2 3
工作年限年 3 5 10
推銷金額萬元 2 3 4
由表中數據算出經驗回歸方程中的.若第4名推銷員的工作年限為7年,則估計他的年推銷金額為( )
A.3.08萬元 B.3.14萬元 C.3.21萬元 D.3.27萬元
【變式2】(24-25高二·江蘇·假期作業)已知,的取值如下表所示,從散點圖分析可知與線性相關,如果線性回歸方程為,則實數的值為( )
2 3 4 5 6
6.5 10 11.5 18.5
A.13 B.13.5 C.14 D.14.5
【變式3】(23-24高二下·安徽安慶·期末)根據成對樣本數據建立變量y關于x的經驗回歸方程為.若y的均值為6.2,則x的均值為( )
A.1.5 B.2 C.2.5 D.3
題型04 相關系數的計算及應用
【典例4】(24-25高三·上海·課堂例題)測得10對父子身高[單位:英寸(1英寸)如下:
父親身高() 80 62 64 65 66 67 68 70 72 74
兒子身高() 63.6 65.2 66 65.5 66.9 67.1 67.4 68.3 70.1 70
(1)對變量與進行相關性檢驗;
(2)如果與之間具有相關關系,求回歸直線方程;
(3)如果父親身高為73英寸,試估計兒子的身高.
參考數據:,,,,,,.
【變式1】(23-24高二上·遼寧·期末)在一組樣本數據、、、、、、、不全相等)的散點圖中,若所有的樣本點都在直線上,則這組樣本數據的相關系數為( )
A. B. C. D.
【變式2】(24-25高三上·湖北隨州·階段練習)若已知是的4倍,是的1.5倍,則樣本相關系數r的值為 .
【變式3】(24-25高三·上海·隨堂練習)隨著智能手機的普及,使用手機上網成為人們日常生活的一部分,很多消費者對手機流量的需求越來越大,某通信公司為了更好地滿足消費者對流量的需求,準備推出一款流量包.該通信公司選了5個城市(總人數、經濟發展情況、消費能力等方面比較接近)采用不同的定價方案作為試點,經過一個月的統計,發現該流量包的定價x(單位:元/月)和購買人數y(單位:萬人)的關系如下表:
x 30 35 40 45 70
y 18 14 10 8 5
計算該流量包的定價x與購買人數y的相關系數 .(結果保留3位小數)
【變式4】(25-26高三上·上海·單元測試)當前,冷凍冷藏類技術發展迅速且應用廣泛.某制冷技術重點實驗室研究了不同果蔬在不同凍結速率下的冰點溫度,以及低溫環境對果蔬熱物性的影響.設凍結速率為x(單位:分鐘),冰點溫度為y(單位:℃),如表為某種水果冰點溫度隨凍結速率變化的統計數據:
x 10 20 30 40 70
y -5 -4.5 -2 1 2
根據以上數據,繪制了散點圖:
(1)由散點圖可以看出,可用線性回歸模型擬合y與x的關系,請用相關系數r加以說明;
(2)求y關于x的線性回歸方程,并預測當凍結速率為80分鐘時,這種水果的冰點溫度.
題型05 非線性回歸模型及應用
【典例5】為幫助鄉村脫貧,某勘探隊計劃了解當地礦脈某金屬的分布情況,測得了平均金屬含量(單位:)與樣本對原點的距離(單位:m)的數據,并作了初步處理,得到了下面的一些統計理的值.(表中,)
6 97.90 0.21 80 0.14 14.12 26.13
(1)利用樣本相關系數的知識,判斷與哪一個更適宜作為平均金屬含量關于樣本對原點的距離的回歸方程類型?
(2)根據(1)的結果回答下列問題:
①建立關于的回歸方程;
②樣本對原點的距離時,金屬含量的預報值是多少?
附:對于一組數據,其線性相關系數,其回歸直線的斜率和截距的最小二乘估計分別為:,.
【變式1】(24-25·高三全國·專題)一座城市的夜間經濟不僅有助于拉動本地居民內需,還能延長外地游客、商務辦公者等的留存時間,帶動當地經濟發展,是衡量一座城市生活質量、消費水平、投資環境及文化發展活力的重要指標.數據顯示,近年來中國各地政府對夜間經濟的扶持力度加大,夜間經濟的市場發展規模保持穩定增長,下表為2017—2022年中國夜間經濟的市場發展規模(單位:萬億元),設2017—2022年對應的年份代碼依次為1~6.
年份代碼x 1 2 3 4 5 6
中國夜間經濟的市場發展規模y/萬億元 20.5 22.9 26.4 30.9 36.4 42.4
(1)已知可用函數模型擬合y與x的關系,請建立y關于x的回歸方程(a,b的值精確到0.01);
(2)某傳媒公司發布的2023年中國夜間經濟城市發展指數排行榜前10名中,吸引力超過90分的有4個,從這10個城市中隨機抽取5個,記吸引力超過90分的城市數量為X,求X的分布列與數學期望.
參考數據:
3.366 73.282 17.25 1.16
其中.
參考公式:對于一組數據,,…,,其回歸直線的斜率和截距的最小二乘法估計分別為,.
【變式2】(2024·全國·模擬預測)一座城市的夜間經濟不僅有助于拉動本地居民內需,還能延長外地游客、商務辦公者等的留存時間,帶動當地經濟發展,是衡量一座城市生活質量、消費水平、投資環境及文化發展活力的重要指標.數據顯示,近年來中國各地政府對夜間經濟的扶持力度加大,夜間經濟的市場發展規模保持穩定增長,下表為2017—2022年中國夜間經濟的市場發展規模(單位:萬億元),其中2017—2022年對應的年份代碼依次為1~6.
年份代碼 1 2 3 4 5 6
中國夜間經濟的市場發展規模萬億元 20.5 22.9 26.4 30.9 36.4 42.4
(1)已知可用函數模型擬合與的關系,請建立關于的回歸方程(的值精確到0.01);
(2)某傳媒公司預測2023年中國夜間經濟的市場規模將達到48.1萬億元,現用(1)中求得的回歸方程預測2023年中國夜間經濟的市場規模,若兩個預測規模誤差不超過1萬億元,則認為(1)中求得的回歸方程是理想的,否則是不理想的,判斷(1)中求得的回歸方程是否理想.參考數據:
3.366 73.282 17.25 1.16 2.83
其中.
參考公式:對于一組數據,其回歸直線的斜率和截距的最小二乘估計分別為.
一、單選題
1.(23-24高二下·甘肅蘭州·期末)下列各關系不屬于相關關系的是( )
A.產品的樣本與生產數量 B.球的表面積與體積
C.家庭的支出與收入 D.人的年齡與體重
2.(23-24高二下·山西大同·期中)對兩個變量進行線性相關性檢驗,得線性相關系數,對兩個變量進行線性相關性檢驗,得線性相關系數,則下列判斷正確的是( )
A.變量與變量正相關,變量與變量負相關,變量與變量的線性相關性更強
B.變量與變量負相關,變量與變量正相關,變量與變量的線性相關性更強
C.變量與變量負相關,變量與變量正相關,變量與變量的線性相關性更強
D.變量與變量正相關,變量與變量負相關,變量與變量的線性相關性更強
3.(23-24高二上·江蘇常州·期末)用最小二乘法得到一組數據的線性回歸方程為,若,則( )
A.11 B.13 C.63 D.78
4.(23-24高二下·黑龍江大慶·期中)某校課外學習小組研究某作物種子的發芽率和溫度(單位:)的關系,由實驗數據得到如圖所示的散點圖.由此散點圖判斷,最適宜作為發芽率和溫度的回歸方程類型的是( )
A. B.
C. D.
5.(24-25高二·江蘇·假期作業)為創建良好的生態環境,某地大力發展新能源產業,近4年該地新能源產業生產總值情況如下表所示:
第年 1 2 3 4
生產總值百萬元 32 52 73 95
已知變量與之間具有線性相關關系,設用最小二乘法建立的回歸直線方程為,則利用該模型預測該地第六年的生產總值為( )
A.136.5 B.137.5 C.138.5 D.139.5
6.(24-25高二下·全國·課后作業)為考察兩個變量,的相關性,搜集數據如表,則兩個變量的線性相關程度( )
5 10 15 20 25
103 105 110 111 114
(參考數據:,,)
A.很強 B.很弱 C.無相關 D.不確定
7.(23-24高二下·江蘇南京·階段練習)為了研究關于的線性相關關系,收集了組樣本數據(見下表):
若已求得一元線性回歸方程為,則下列選項中正確的是( )
(其中相關系數)
A.
B.當時,的預測值為
C.樣本數據的第40百分位數為
D.去掉樣本點后,與的樣本相關系數不會改變
8.(23-24高二下·福建漳州·階段練習)2024海峽兩岸各民族歡度“三月三”暨福籽同心愛中華·福建省第十一屆“三月三”畬族文化節活動在寧德隆重開幕.海峽兩岸各民族同胞齊聚于此,與當地群眾共同歡慶“三月三”,暢敘兩岸情.在活動現場,為了解不同時段的入口游客人流量,從上午10點開始第一次向指揮中心反饋入口人流量,以后每過一個小時反饋一次.指揮中心統計了前5次的數據,其中,為第次入口人流量數據(單位:百人),由此得到關于的回歸方程,,已知,根據回歸方程(參考數據:,),可預測下午4點時入口游客的人流量為( )
A.9.6 B.11.0 C.11.4 D.12.0
二、多選題
9.(24-25高二下·全國·課后作業)/年月日,人社部官網發布全國各地區最低工資標準情況,從月最低工資標準來看,上海、深圳、北京位列前三.某學生為了研究居民收入與幸福指數的相關關系,查詢到如下數據,后來發現其中一個數據記錄有誤,去掉該數據,則( )

A.樣本相關系數變大 B.居民收入與幸福指數呈現負相關
C.樣本相關系數 D.居民收入與幸福指數的線性相關程度變強
10.(24-25高三上·四川綿陽·階段練習)某類汽車在今年1至5月的銷量y(單位:千輛)如下表所示(其中2月份銷量未知):
月份x 1 2 3 4 5
月銷量y 2.4 m 4 5 5.5
若變量y與x之間存在線性相關關系,用最小二乘法估計建立的經驗回歸方程為,則下列說法正確的是( )
A.
B.殘差絕對值最大為0.2
C.樣本相關系數
D.當解釋變量每增加1,響應變量增加0.85
11.(2024高二下·全國·專題練習)某騎行愛好者在專業人士指導下對近段時間騎行鍛煉情況進行統計分析,統計每次騎行期間的身體綜合指標評分與騎行用時(單位:小時)如下表:
身體綜合指標評分 1 2 3 4 5
用時小時) 9.5 8.8 7.8 7 6.1
由上表數據得到的錯誤結論是( )
參考數據:,
參考公式:相關系數.
A.身體綜合指標評分與騎行用時正相關
B.身體綜合指標評分與騎行用時的相關程度較弱
C.身體綜合指標評分與騎行用時的相關程度較強
D.身體綜合指標評分與騎行用時的關系不適合用線性回歸模型擬合
三、填空題
12.(24-25高三上·廣東江門·階段練習)已知,之間的一組數據:若與滿足經驗回歸方程,則此曲線必過點 .
x
y
13.(23-24高二下·天津·期末)為了了解家庭月收入(單位:千元)與月儲蓄(單位:千元)的關系,從某居民區隨機抽取10個家庭,根據測量數據的散點圖可以看出與之間具有線性相關關系,其回歸直線方程為,若該居民區某家庭月收入為7千元,據此估計該家庭的月儲蓄為 千元.
14.(18-19高二下·內蒙古巴彥淖爾·階段練習)在研究兩個變量的相關關系時,觀察散點圖發現樣本點集中于某一條指數曲線的周圍.令,求得線性回歸方程為,則該模型的非線性回歸方程為 .
四、解答題
15.(2025高三·全國·專題練習)2023年是全面貫徹落實黨二十大精神的開局之年,也是實施“十四五”規劃承上啟下的關鍵之年,經濟增長呈現穩中有進的可喜現象.2023年8月4日,貴州省工業和信息化廳召開推進貴州刺梨產業高質量發展專題會議,安排部署加快推進特色優勢產業刺梨高質量發展工作,集中資源、力量打造“貴州刺梨”公共品牌.貴州省為做好刺梨產業的高質量發展,項目組統計了全省近5年刺梨產業綜合總產值的各項數據如下:
年份,綜合產值(單位:億元)
年份 2018 2019 2020 2021 2022
年份代碼 1 2 3 4 5
綜合產值 23.1 37.0 62.1 111.6 170.8
(1)根據表格中的數據,可用一元線性回歸模型刻畫變量與變量之間的線性相關關系,請用相關系數加以說明(精確到0.01);
(2)求出關于的經驗回歸方程,并預測2023年底貴州省刺梨產業的綜合總產值.
參考公式:
相關系數.回歸方程中斜率和截距的最小二乘法估計公式分別為,;
參考數據:,,,,,.
16.(2025高三·全國·專題練習)人們用大數據來描述和定義信息時代產生的海量數據,并利用這些數據處理事務和做出決策,某公司通過大數據收集到該公司銷售的某電子產品1月至5月的銷售量如下表.
月份 1 2 3 4 5
銷售量(萬件) 4.9 5.8 6.8 8.3 10.2
該公司為了預測未來幾個月的銷售量,建立了關于的回歸模型:.
(1)根據所給數據與回歸模型,求關于的回歸方程(的值精確到0.1);
(2)已知該公司的月利潤(單位:萬元)與,的關系為,根據(1)的結果,問該公司哪一個月的月利潤預報值最大?
17.(24-25高三上·重慶·階段練習)小李和小張關注到習近平總書記今年4月在重慶考察時強調:“奮力打造新時代西部大開發重要戰略支點、內陸開放綜合樞紐”,于是決定大學畢業后回家鄉重慶創業.他們投入5萬元(包括購買設備、房租、生活費等)建立了一個直播間,幫助山區人民售賣農產品.在直播間里,他們利用所學知識談天說地,跟粉絲互動,集聚了一定的人氣,試播一段時間之后,正式帶貨.他們統計了第一周的帶貨數據如下:
第x天 1 2 3 4 5 6 7
銷售額y(萬元) 1.4 1.6 2.2 2.4 3 3.9 5.1
(1)求樣本的相關系數(精確到0.01);
(2)用最小二乘法求出關于的回歸方程(系數精確到0.01,并用精確后的的值計算的值),并預測第8天的銷售額(預測結果精確到0.01).
附:①相關系數;
②回歸方程中的斜率和截距的最小二乘估計公式分別為,;
③,,.
18.(24-25高三上·四川眉山·階段練習)臺州是全國三大電動車生產基地之一,擁有完整的產業鏈和突出的設計優勢.某電動車公司為了搶占更多的市場份額,計劃加大廣告投入、該公司近5年的年廣告費(單位:百萬元)和年銷售量(單位:百萬輛)關系如圖所示:令,數據經過初步處理得:
44 4.8 10 40.3 1.612 19.5 8.06
現有①和②兩種方案作為年銷售量y關于年廣告費x的回歸分析模型,其中a,b,m,n均為常數.
(1)請從相關系數的角度,分析哪一個模型擬合程度更好
(2)根據(1)的分析選取擬合程度更好的回歸分析模型及表中數據,求出關于的回歸方程,并預測年廣告費為6(百萬元)時,產品的年銷售量是多少
19.(24-25高二上·四川眉山·期中)臺州是全國三大電動車生產基地之一,擁有完整的產業鏈和突出的設計優勢.某電動車公司為了搶占更多的市場份額,計劃加大廣告投入、該公司近5年的年廣告費(單位:百萬元)和年銷售量(單位:百萬輛)關系如圖所示:

令,數據經過初步處理得:,,,,,,,現有①和②兩種方案作為年銷售量y關于年廣告費x的回歸分析模型,其中a,b,m,n均為常數.
(1)請從相關系數的角度,分析哪一個模型擬合程度更好?
(2)根據(1)的分析選取擬合程度更好的回歸分析模型及表中數據,求出y關于x的回歸方程,并預測年廣告費為6(百萬元)時,產品的年銷售量是多少?
(3)該公司生產的電動車毛利潤為每輛200元(不含廣告費、研發經費).該公司在加大廣告投入的同時也加大研發經費的投入,年研發經費為年廣告費的199倍.電動車的年凈利潤受年廣告費和年研發經費影響外還受隨機變量影響,設隨機變量服從正態分布,且滿足.在(2)的條件下,求該公司年凈利潤的最大值大于1000(百萬元)的概率.(年凈利潤=毛利潤×年銷售量-年廣告費-年研發經費-隨機變量).
附:
①相關系數,回歸直線中公式分別為,;
②參考數據:,,,.
21世紀教育網(www.21cnjy.com)

展開更多......

收起↑

資源列表

<pre id="tfb94"><li id="tfb94"></li></pre>

<bdo id="tfb94"><rt id="tfb94"></rt></bdo>
  • <menu id="tfb94"><dl id="tfb94"></dl></menu><i id="tfb94"><acronym id="tfb94"><sub id="tfb94"></sub></acronym></i>

    1. 主站蜘蛛池模板: 南投市| 嘉善县| 双流县| 扎囊县| 邳州市| 衡东县| 东丰县| 桐梓县| 芒康县| 安顺市| 汉川市| 福安市| 凌源市| 科技| 烟台市| 门头沟区| 延川县| 四川省| 广州市| 呼玛县| 万载县| 绥德县| 印江| 桐庐县| 咸阳市| 无为县| 双流县| 上蔡县| 普定县| 乐平市| 禹城市| 临武县| 南通市| 淳化县| 成武县| 贵州省| 阿坝| 巴林右旗| 民县| 鹤岗市| 蕲春县|