中文字幕精品无码一区二区,成全视频在线播放观看方法,大伊人青草狠狠久久,亚洲一区影音先锋色资源

8.2.1一元線性回歸模型 導學案(含解析) 高中數學人教A版(2019)選擇性必修第三冊

資源下載
  1. 二一教育資源

8.2.1一元線性回歸模型 導學案(含解析) 高中數學人教A版(2019)選擇性必修第三冊

資源簡介

8.2.1一元線性回歸模型 導學案
學習目標
1.結合實例,了解一元線性回歸模型的含義,了解模型參數的統計意義
2.了解最小二乘原理,掌握一元線性回歸模型參數的最小二乘估計方法.
3.針對實際問題,會用一元線性回歸模型進行預測.
重點難點
1.重點:一元線性回歸模型的概念,隨機誤差的概念,表示與假設.
2.難點:回歸模型與函數模型的區別,隨機誤差產生的原因與影響.
課前預習 自主梳理
知識點一 一元線性回歸模型稱為Y關于x的一元線性回歸模型.其中Y稱為因變量或響應變量,x稱為自變量或解釋變量,a稱為截距參數,b稱為斜率參數;e是Y與bx+a之間的隨機誤差,如果e=0,那么Y與x之間的關系就可以用一元線性函數模型來描述.
知識點二 最小二乘法
將=x+稱為Y關于x的經驗回歸方程,也稱經驗回歸函數或經驗回歸公式,其圖形稱為經驗回歸直線,這種求經驗回歸方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估計,其中,=-.
知識點三 殘差與殘差分析
1.殘差
對于響應變量Y,通過觀測得到的數據稱為觀測值,通過經驗回歸方程得到的稱為預測值,觀測值減去預測值稱為殘差.
2.殘差分析
殘差是隨機誤差的估計結果,通過對殘差的分析可以判斷模型刻畫數據的效果,以及判斷原始數據中是否存在可疑數據等,這方面工作稱為殘差分析.
知識點四 對模型刻畫數據效果的分析
1.殘差圖法
在殘差圖中,如果殘差比較均勻地集中在以橫軸為對稱軸的水平帶狀區域內,則說明經驗回歸方程較好地刻畫了兩個變量的關系.
2.殘差平方和法
殘差平方和越小,模型的擬合效果越好.
3.R2法
可以用R2=1-來比較兩個模型的擬合效果,
R2越大,模型擬合效果越好,R2越小,模型擬合效果越差.
自主檢測
1.判斷正誤,正確的寫正確,錯誤的寫錯誤.
(1)求經驗回歸方程前可以不進行相關性檢驗.( )
(2)在殘差圖中,縱坐標為殘差,橫坐標可以選為樣本編號.( )
(3)利用經驗回歸方程求出的值是準確值.( )
(4)殘差平方和越小,線性回歸模型的擬合效果越好.( )
(5)越小,線性回歸模型的擬合效果越好.( )
(6)經驗回歸方程一定過樣本中的某一個點.( )
(7)選取一組數據中的部分點得到的經驗回歸方程與由整組數據得到的經驗回歸方程是同一個方程.( )
(8)在經驗回歸模型中,越接近于1,表示解釋變量和響應變量的線性相關性越強.( )
(9)在畫兩個變量的散點圖時,響應變量在軸上,解釋變量在軸上.( )
2.已知變量x和y的統計數據如下表:
3 4 5 6 7
2.5 3 4 4.5 6
根據上表可得回歸直線方程為,據此可以預測當x=10時,則y的估計值為( )
A.8.25 B.8.5 C.9.25 D.9.5
3.已知的取值如下表:
0 1 3 4
與線性相關,且線性回歸直線方程為,則=( )
A. B. C. D.
4.我國某汽車生產的新能源電動車于2020年11月上市,現將調查得到的該新能源電動車上市時間和市場占有率(單位:%)的幾組相關對應數據標在如圖所示的折線圖中,圖中橫坐標代表2020年11月,代表2020年12月,…,代表2021年3月.若根據此數據得出關于的線性回歸方程為,那么為( )
A. B. C. D.
5.某學校一同學研究溫差與本校當天新增感冒人數人的關系,該同學記錄了天的數據:
經過擬合,發現基本符合經驗回歸方程,則( )
A.樣本中心點為
B.
C.時,殘差為
D.若去掉樣本點,則樣本的相關系數增大
新課導學
學習探究
環節一 創設情境,引入課題
問題1如何求經驗回歸方程?
提示:求經驗回歸方程的一般步驟如下:
(1)畫出散點圖,依據問題所給的數據在平面直角坐標系中描點,觀察點的分布是否呈條狀分布,即是否在一條直線附近,從而判斷兩變量是否具有線性相關關系;
(2)當兩變量具有線性相關關系時,求系數的最小二乘估計書",寫出經驗回歸方程;
(3)進行殘差分析,分析模型的擬合效果,不合適時,分析錯因,予以糾正.
【師生互動】教師讓學生舉手回答問題,并及時給予糾正.
【設計意圖】復習上節課所學知識,為本節課解決與線性回歸分析有關的實際問題做好鋪墊.
通過前面的學習,我們已經了解到,根據成對樣本數據的散點圖和樣本相關系數,可以推斷兩個變量是否存在相關關系、是正相關還是負相關,以及線性相關程度的強弱等.進一步地,如果能像建立函數模型刻畫兩個變量之間的確定性關系那樣,通過建立適當的統計模型刻畫兩個隨機變量的相關關系,那么我們就可以利用這個模型研究兩個變量之間的隨機關系,并通過模型進行預測.
下面我們研究當兩個變量線性相關時,如何利用成對樣本數據建立統計模型,并利用模型進行預測的問題.
通過前面的學習我們已經了解到,根據成對樣本數據的散點圖和樣本相關系數,可以推斷兩個變量是否存在相關關系、是正相關還是負相關,以及線性相關程度的強弱等.進一步地,如果能像建立函數模型刻畫
兩個變量之間的確定性關系那樣,通過建立適當的統計模型刻畫兩個隨機變量的相關關系,那么我們就可以利用這個模型研究兩個變量之間的隨機關系,并通過模型進行預測.
下面我們研究當兩個變量線性相關時,如何利用成對樣本數據建立統計模型,并利用模型進行預測的問題.
生活經驗告訴我們,兒子的身高與父親的身高不僅線性相關,而且還是正相關,即父親的身高較高時,兒子的身高通常也較高.
為了進一步研究兩者之間的關系,有人調查了14名男大學生的身高及其父親的身高,得到的數據如表8.2-1所示.
表8.2-1
編號 1 2 3 4 5 6 7 8 9 10 11 12 13 14
父親身高/cm 174 170 173 169 182 172 180 172 168 166 182 173 164 180
兒子身高/cm 176 176 170 170 185 176 178 174 170 168 178 172 165 182
問題2 由這組樣本數據能否推斷兒子的身高與父親的身高有關系?關系的相關程度如何?是函數關系還是線性相關關系?為什么?
學生活動 要求學生整理和表示數據,通過分小組合作完成.以橫軸表示父親的身高,縱軸表示兒子的身高,建立平面直角坐標系,再將表中的成對樣本數據表示為散點圖.然后根據散點圖作解讀,回答問題.
環節二 觀察分析,感知概念
利用前面表示數據的方法,以橫軸表示父親身高、縱軸表示兒子身高建立直角坐標系,再將表8.2-1中的成對樣本數據表示為散點圖,如圖8.2-1所示.可以發現,散點大致分布在一條從左下角到右上角的直線附近,表明兒子身高和父親身高線性相關.利用統計軟件,求得樣本相關系數為,表明兒子身高和父親身高正線性相關,且相關程度較高.
追問1:兒子身高和父親身高這兩個變量之間的關系可以用函數模型刻畫嗎?
【設計意圖】通過一個具體案例,對前面學習的內容做系統回顧,同時又可以作為探究一元線性回歸模型的例子.
思考:根據表8.2-1中的數據,兒子身高和父親身高這兩個變量之間的關系可以用函數模型刻畫嗎?
在表8.2-1的數據中,存在父親身高相同而兒子身高不同的情況例如,第6個和第8個觀測的父親身高均為172 cm,而對應的兒子身高分別為176 cm和174 cm;同樣,第3,4兩個觀測中,兒子身高都是170 cm,而父親身高分別為173 cm和169 cm.可見兒子身高和父親身高之間不是函數關系,也就不能用函數模型刻畫圖8.2-1中的散點大致分布在一條直線附近,表明兒子身高和父親身高這兩個變量之間有較強的線性相關關系,因此我們可以用一次函數來刻畫父親身高對兒子身高的影響,而把影響兒子身高的其他因素,如母親身高、生活環境、飲食習慣等作為隨機誤差,得到刻畫兩個變量之間關系的線性回歸模型其中,隨機誤差是一個隨機變量.
【設計意圖】既復習函數概念,又明確了對于倆個相關變量間的關系不能使用函數模型研究.
環節三 抽象概括,形成概念
問題3從成對樣本數據的散點圖和樣本相關系數可以發現,散點大致分布在一條從左下角到右上角直線附近,表明兒子身高和父親身高有較強的線性關系,我們可以這樣理解,由于有其他因素的存在,使得兒子身高和父親身高有關系但不是函數關系.那么請你說說影響兒子身高的其他因素是什么?
【師生互動】 通過組織學生討論問題,形成以下主要結論:影響兒子身高的因素,除父親的身高外,還有母親的身高、生活的環境、飲食習慣、營養水平、體育鍛煉等隨機的因素,兒子身高不是父親身高的函數的原因是存在這些隨機的因素.
【設計意圖】找出父親身高和兒子身高不能用函數模型刻畫的原因.
用x表示父親身高,Y表示兒子身高,e表示隨機誤差.假定隨機誤差e的均值為0,方差為與父親身高無關的定值,則它們之間的關系可以表示為
(1)
為什么假設,而不假設其為某個不為0的常數?
環節四 辨析理解 深化概念
我們稱(1)式為Y關于x的一元線性回歸模型(simple linear regression model).其中,Y稱為因變量或響應變量,x稱為自變量或解釋變量;a和b為模型的未知參數,a稱為截距參數,b稱為斜率參數;e是Y與bx+a之間的隨機誤差,模型中的Y也是隨機變量,其值雖然不能由變量x的值確定,但是卻能表示為bx+a與e的和(疊加),前一部分由x所確定,后一部分是隨機的.如果e=0,那么Y與x之間的關系就可用一元線性函數模型來描述.
問題4 如何理解隨機誤差對兒子身高的影響?
【師生互動】教師指出,如果用表示父親身高,表示兒子的身高,用表示各種其他隨機因素影響之和,稱為隨機誤差,由于兒子身高與父親身高線性相關,假設沒有隨機誤差,則兒子身高只受父親身高影響,則 ,事實上,相關系數 ,故 ,
也可以記作 .
【設計意圖】理解影響兒子身高的因素,并用數學語言刻畫它們之間的關系.
環節五 概念應用,鞏固內化
問題5 一元線性回歸模型有何作用
對于父親身高x和兒子身高Y的一元線性回歸模型(1),可以解釋為父親身高為的所有男大學生的身高組成一個子總體,該子總體的均值為,即該子總體的均值與父親身高是線性函數關系.而對于父親身高為的某一名男大學生,他的身高并不一定為,它僅是該子總體中的一個觀測值,這個觀測值與均值有一個誤差項.
【師生互動】教師引導學生分析問題,并適時指出:當父親身高為時可以通過了解兒子身高的總體情況,從而預測兒子的身高.
【設計意圖】通過具體實例,使學生了解一元線性回歸模型的作用.
問題6隨機誤差有哪些特征?
【設計意圖】通過具體實例,加深學生對一元線性回歸模型的理解.
思考:你能結合具體實例解釋產生模型(1)中隨機誤差項的原因嗎?
在研究兒子身高與父親身高的關系時,產生隨機誤差e的原因有:
(1)除父親身高外,其他可能影響兒子身高的因素,比如母親身高、生活環境、飲食習慣和鍛煉時間等;
(2)在測量兒子身高時,由于測量工具、測量精度所產生的測量誤差;
(3)實際問題中,我們不知道兒子身高和父親身高的相關關系是什么,可以利用一元線性回歸模型來近似這種關系,這種近似也是產生隨機誤差e的原因.
【設計意圖】了解隨機誤差特征,雖然單個隨機誤差是無法預先設定的,但是隨機誤差的總體可以定量刻畫.
環節六 歸納總結,反思提升
1. 本節課學習的概念有哪些?
(1)一元線性回歸模型.
(2)最小二乘法、經驗回歸方程的求法.
(3)對模型刻畫數據效果的分析:殘差圖法、殘差平方和法和R2法.
2. 在解決問題時,用到了哪些數學思想?.
數形結合、轉化化歸.
3.常見誤區:不判斷變量間是否具有線性相關關系,盲目求解經驗回歸方程致誤.
師生活動:要求學生思考后回答并相互補充,教師進行總結.
【設計意圖】幫助學生進一步厘清一元線性回歸模型的含義,掌握用數學語言表達隨機事件,了解總體參數與樣本數據之間的關系.
環節七 目標檢測,作業布置
完成教材:教科書第107頁練習第1,2,3題.
備用練習
6.已知回歸方程,則( )
A. B.15是回歸系數
C.1.5是回歸系數 D.當時,的準確值為
7.某單位為了解用電量(度)與氣溫之間的關系,隨機統計了某4天的用電量與當天氣溫,并制作了對照表:
氣溫 18 13 10
用電量(度) 24 34 38 64
由表中數據得線性回歸方程中,預測當溫度為時,用電量的度數約為
A.64 B.66 C.68 D.70
8.黨的十九大報告中指出:從2020年到2035年,在全面建成小康社會的基礎上,再奮斗15年,基本實現社會主義現代化.若到2035年底我國人口數量增長至14.4億,由2013年到2019年的統計數據可得國內生產總值()(單位:萬億元)關于年份代號的回歸方程為,由回歸方程預測我國在2035年底人均國內生產總值(單位:萬元)約為( )
A.14.04 B.202.16 C.13.58 D.14.50
9.已知回歸直線的斜率的估計值為1.23,樣本點的中心為(4,5),則回歸直線方程為( )
A. B. C. D.
10.以下關于線性回歸的判斷,正確的個數是(  )
①若散點圖中所有點都在一條直線附近,則這條直線為回歸直線;
②散點圖中的絕大多數都線性相關,個別特殊點不影響線性回歸,如圖中的點;
③已知直線方程為,則時,的估計值為11.69;
④回歸直線方程的意義是它反映了樣本整體的變化趨勢.
A.0 B.1 C.2 D.3
試卷第1頁,共3頁
試卷第1頁,共3頁
參考答案:
1. 錯誤 正確 錯誤 正確 錯誤 錯誤 錯誤 正確 錯誤
【分析】由線性回歸方程的相關知識點,逐一判斷,即可得到結果.
【詳解】(1)求經驗回歸方程前需要進行相關性檢驗,故錯誤;
(2)在殘差圖中,縱坐標為殘差,橫坐標可以選為樣本編號,故正確;
(3)利用經驗回歸方程求出的值是預測估值,故錯誤;
(4)殘差平方和越小,線性回歸模型的擬合效果越好,故正確;
(5)由的意義可知,越小,線性回歸模型的擬合效果越差,故錯誤;
(6)經驗回歸方程一定過點,可能過樣本中的某個點,也可能不過樣本中的任意一個點,故錯誤;
(7)選取一組數據中的部分點得到的經驗回歸方程與由整組數據得到的經驗回歸方程不一定是同一個方程,故錯誤;
(8)由的意義可知,越接近于1,解釋變量和響應變量的線性相關性越強,故正確;
(9)在畫兩個變量的散點圖時,解釋變量在軸上,響應變量在軸上,故錯誤;
2.A
【分析】由題意計算出,代入回歸方程可求出,再令,即可求出y的估計值.
【詳解】由題意知,
得將點代入,解得,
所以當時,,
故選:A.
3.B
【分析】先求出樣本中心,根據線性回歸直線方程過樣本中心可得答案.
【詳解】由題意可得
所以樣本中心為
線性回歸直線方程為過點
所以,解得
故選:B
4.A
【分析】解出樣本中心點,代入方程即可解得.
【詳解】,,將代入到線性回歸方程得:.
故選:A.
5.ABC
【分析】先求得樣本中心點,然后求得,再根據殘差、相關系數等知識確定正確答案.
【詳解】,
所以樣本中心點為,則,所以AB選項正確,
則,當時,,
對應殘差為,所以C選項正確.
由于,,則,
所以若去掉樣本點,則樣本的相關系數不變.D選項錯誤.
故選:ABC
6.A
【分析】根據回歸直線經過樣本點中心,可知A正確;根據,可知BC都不正確;由求出的是預報值,可知D不正確.
【詳解】根據回歸直線經過樣本點中心,可得,故A正確;
其中,故BC都不正確;
當時,的預報值為,故D不正確.
故選:A
7.D
【分析】由題意先求出回歸方程,再將代入回歸方程,即可求出結果.
【詳解】由已知,,將其代入回歸方程得,故回歸方程為,當時,,選D.
【點睛】本題主要考查回歸直線方程,由回歸直線必然過樣本中心即可求回歸直線的方程,屬于基礎題型.
8.A
【分析】先求出2035年對應的年份代號的值代入回歸方程可得2035年底國內生產總值,再除以人口數量14.4億即可求解.
【詳解】根據題意可得2035年底對應的,
將代入可得:萬億元,
所以我國在2035年底人均國內生產總值約為萬元,
故選:A.
9.C
【分析】設回歸直線方程為,根據回歸直線必過樣本中心,求.
【詳解】由回歸直線的斜率的估計值為1.23,
設回歸直線方程為,代入 ,
,解得: ,
回歸直線方程是.
故選:C
【點睛】本題考查回歸直線方程,意在考查基本公式和計算,屬于簡單題型.
10.D
【分析】利用線性回歸方程的概念及意義對結論逐一判斷.
【詳解】對于①,能使所有數據點都在一條直線附近的直線不止一條,只有按最小二乘法求得回歸系數得到的直線才是回歸方程,故①錯誤,
對于②,散點圖中的絕大多數點都線性相關,個別特殊點不會影響線性回歸,故②正確;
對于③,將代入得,故③正確,
對于④,散點圖中所有點都在回歸直線的附近,因此回歸直線方程反映了樣本整體的變化趨勢,故④正確;
綜上所述,正確的有3個.
故選:D
答案第1頁,共2頁
答案第1頁,共2頁

展開更多......

收起↑

資源預覽

    <track id="r4fhd"></track>

    <pre id="r4fhd"><abbr id="r4fhd"><code id="r4fhd"></code></abbr></pre>
      <ul id="r4fhd"></ul>

        <menu id="r4fhd"></menu>
        1. 主站蜘蛛池模板: 玛沁县| 兴隆县| 阿拉善盟| 铜山县| 浦城县| 利辛县| 盘山县| 新乡市| 永胜县| 平山县| 汪清县| 鄂托克旗| 广汉市| 天等县| 科技| 灵台县| 若尔盖县| 宽城| 临泽县| 南澳县| 曲周县| 台南县| 镇平县| 南皮县| 瑞金市| 哈巴河县| 永顺县| 中宁县| 呼玛县| 驻马店市| 涪陵区| 军事| 安远县| 阿合奇县| 武冈市| 永吉县| 榆林市| 钦州市| 吉林省| 合江县| 黔东|