資源簡介 一、變量的相關性 變量的相關關系與樣本相關系數是學習線性回歸模型的前提和基礎,前者可借助散點圖從直觀上分析變量間的相關性,后者從數量上準確刻畫了兩個變量的相關程度.【例1】 (2022·全國乙卷理19題·節選)某地經過多年的環境治理,已將荒山改造成了綠水青山.為估計一林區某種樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:m2)和材積量(單位:m3),得到如下數據:樣本號i 1 2 3 4 5 6 7 8 9 10 總和根部橫截面積xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6材積量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9并計算得=0.038,=1.615 8,xiyi=0.247 4.(1)估計該林區這種樹木平均一棵的根部橫截面積與平均一棵的材積量;(2)求該林區這種樹木的根部橫截面積與材積量的樣本相關系數(精確到0.01).附:樣本相關系數r=,≈1.377.反思感悟判斷變量相關性的兩種方法(1)散點圖法:直觀形象;(2)公式法:可用公式精確計算,需注意特殊情形的樣本相關系數.如點在一條直線上,|r|=1,且當r=1時,正相關;r=-1時,負相關.【跟蹤訓練】1.某次考試,班主任從全班同學中隨機抽取一個容量為8的樣本,他們的數學、物理成績對應如下表:學生編號 1 2 3 4 5 6 7 8數學成績x 60 65 70 75 80 85 90 95物理成績y 72 77 80 84 88 90 93 95繪出散點圖如下.根據以上信息,判斷下列結論:①根據此散點圖,可以判斷數學成績與物理成績具有線性相關關系;②根據此散點圖,可以判斷數學成績與物理成績具有一次函數關系;③甲同學數學考了80分,那么,他的物理成績一定比數學只考了60分的乙同學的物理成績要高.其中正確的個數為( )A.0 B.3C.2 D.12.相關變量x,y的散點圖如圖所示,現對這兩個變量進行線性相關分析,方案一:根據圖中所有數據,得到經驗回歸方程為=x+,樣本相關系數為r1;方案二:剔除點(10,21),根據剩下數據得到經驗回歸方程為=x+,樣本相關系數為r2.則( )A.0<r1<r2<1 B.0<r2<r1<1C.-1<r1<r2<0 D.-1<r2<r1<0二、經驗回歸方程 主要考查兩個變量線性相關的判定,以及利用最小二乘法求經驗回歸方程,并應用于實際或對因變量進行預測.【例2】 某項研究發現某地的PM10濃度與車流量之間有線性相關關系.現采集到該地一周內車流量x與PM10濃度y的數據如下表:時間 車流量x(單位:萬輛) PM10濃度y(單位:μg/m3)星期一 25.4 35.7星期二 24.6 34.5星期三 23.5 35.2星期四 24.4 33.6星期五 25.8 36.1星期六 19.7 30.9星期日 20.3 29.4(1)在如圖所示的坐標系中作出表中數據的散點圖;(2)根據表中的統計數據,求出經驗回歸方程=x+(精確到0.01).反思感悟解決回歸分析問題的一般步驟(1)畫散點圖.根據已知數據畫出散點圖;(2)判斷變量的相關性并求經驗回歸方程.通過觀察散點圖,直觀感知兩個變量是否具有相關關系;在此基礎上,利用最小二乘法求回歸系數,然后寫出經驗回歸方程;(3)實際應用.依據求得的經驗回歸方程解決實際問題.【跟蹤訓練】近年來我國外貿企業一手抓質量,一手抓生產,產銷形勢喜人.自2023年6月以來,我國外貿進出口連續實現正增長,出口國際市場占世界的份額不斷攀升,外貿發展韌性強勁.某個遠洋運輸公司出口營業額增長數據表如下:月份 2023年6月 2023年7月 2023年8月 2023年9月月份代碼x 1 2 3 4新增出口營業額 y億元 2.4 2.8 3.6 5.1月份 2023年10月 2023年11月 2023年12月 2024年1月月份代碼x 5 6 7 8新增出口營業額 y億元 7.1 9.1 11.7 14.2某位同學分別用兩種模型:①=x2+,②=x+進行擬合,得到相應的回歸方程并進行殘差分析,殘差圖如下(注:殘差等于yi-):這位同學在進行擬合時,對數據作了初步處理,得到一些統計量的值:(ti-)(yi-)=686.8,(ti-)2=3 570.其中ti=,=ti.(1)根據殘差圖,比較模型①,②的擬合效果,應該選擇哪個模型?并簡要說明理由;(2)根據(1)的判斷結果及表中數據,建立y關于x的回歸方程,并預測該遠洋運輸公司2024年3月新增出口營業額.(精確到0.01)附:對于一組數據(u1,υ1),(u2,υ2),…,(un,υn),經驗回歸直線=+u的斜率和截距的最小二乘估計公式分別為=,=-.三、獨立性檢驗 獨立性檢驗研究的主要問題是討論兩個分類變量之間關聯性問題.為此需先列出2×2列聯表,從表格中可以直觀地得到兩個分類變量是否有關系.獨立性檢驗的思想是先假設二者無關系,求隨機變量χ2的值,若χ2大于臨界值,則拒絕假設,否則,接受假設.【例3】 2023年12月28日,小米汽車舉行了技術發布會,首款產品SU7揭開神秘面紗,引起了廣大車迷愛好者的熱議,為了了解車迷們對該款汽車的購買意愿與性別是否具有相關性,某車迷協會隨機抽取了200名車迷朋友進行調查,所得數據統計如下表所示:購車意愿愿意購置 該款汽車 不愿購置 該款汽車 合計性別 男性 100 20 120女性 50 30 80合計 150 50 200判斷是否有99%把握認為車迷們對該款汽車的購買意愿與性別有關.參考公式:χ2=,其中n=a+b+c+d.P(χ2≥x0) 0.1 0.05 0.01 0.005 0.001x0 2.706 3.841 6.635 7.879 10.828反思感悟解獨立性檢驗應用問題的關注點(1)兩個明確:①明確兩類主體;②明確研究的兩個問題;(2)兩個準確:①準確列出2×2列聯表;②準確理解χ2.【跟蹤訓練】隨著手機的發展,“微信”逐漸成為人們交流的一種形式,某機構對“使用微信交流”的態度進行調查,隨機抽取了50人,他們年齡的頻數分布及對“使用微信交流”贊成人數如下表:年齡/歲 [15, 25) [25, 35) [35, 45) [45, 55) [55, 65) [65, 75]頻數 5 10 15 10 5 5贊成人數 5 10 12 7 2 1(1)若以“年齡45歲為分界點”,由以上統計數據完成下面2×2列聯表,并判斷是否有99%的把握認為“使用微信交流”的態度與人的年齡有關;年齡不低于 45歲的人數 年齡低于 45歲的人數 合計贊成不贊成合計(2)若從年齡在[55,65)的被調查人中隨機選取2人進行追蹤調查,求2人中至少有1人不贊成“使用微信交流”的概率.附:χ2=.P(χ2≥x0) 0.10 0.05 0.01 0.005 0.001x0 2.706 3.841 6.635 7.879 10.828章末復習與總結【例1】 解:(1)估計該林區這種樹木平均一棵的根部橫截面積===0.06,估計該林區這種樹木平均一棵的材積量===0.39.(2)(xi-)(yi-)=xiyi-10=0.013 4,(xi-)2=-10()2=0.002,(yi-)2=-10()2=0.094 8,所以==≈0.01×1.377=0.013 77,所以樣本相關系數r=≈≈0.97.跟蹤訓練1.D 對于①②,根據此散點圖知,各點都分布在一條直線附近,可以判斷數學成績與物理成績具有較強的線性相關關系,不是一次函數關系,①正確,②錯誤;對于③,甲同學數學考了80分,他的物理成績可能比數學只考了60分的乙同學的物理成績要高,③錯誤.綜上,正確的命題是①,只有1個.2.D 由散點圖得兩個變量呈負相關關系,所以r1<0,r2<0,因為剔除點(10,21)后,剩下點的數據的線性相關性更強,|r|更接近1,所以-1<r2<r1<0.故選D.【例2】 解:(1)如圖所示.(2)由表中數據得≈23.4,≈33.6,=≈≈0.97,=-=33.6-0.97×23.4≈10.90.所以y關于x的經驗回歸方程為=0.97x+10.90.跟蹤訓練 解:(1)選擇模型①.理由如下:根據殘差圖可以看出,模型①的估計值和真實值相對比較接近,模型②的殘差相對較大一些,所以模型①的擬合效果相對較好.(2)由(1),可知y關于x的回歸方程為=x2+,令t=x2,則=t+.由所給數據可得=ti=×(1+4+9+16+25+36+49+64)=25.5,=yi=×(2.4+2.8+3.6+5.1+7.1+9.1+11.7+14.2)=7,所以==≈0.19,=-≈7-0.19×25.5≈2.16,所以y關于x的回歸方程為=0.19x2+2.16.預測該遠洋運輸公司2024年3月新增出口營業額為=0.19×102+2.16=21.16(億元).【例3】 解:原假設為H0:車迷們對該款汽車的購買意愿與性別無關.根據表中數據可得χ2==≈11.111>10.828,所以有99%的把握認為車迷們對該款汽車的購買意愿與性別有關.跟蹤訓練 解:(1)由題中統計數據填寫2×2列聯表,如下:年齡不低于 45歲的人數 年齡低于 45歲的人數 合計贊成 10 27 37不贊成 10 3 13合計 20 30 50根據公式計算,得χ2=≈9.98>6.635,所以有99%的把握認為“使用微信交流”的態度與人的年齡有關.(2)設年齡在[55,65)中不贊成“使用微信交流”的人分別為A,B,C,贊成“使用微信交流”的人分別為a,b,則從5人中隨機選取2人有AB,AC,Aa,Ab,BC,Ba,Bb,Ca,Cb,ab,共10個結果.其中2人中至少有1人不贊成“使用微信交流”的有AB,AC,Aa,Ab,BC,Ba,Bb,Ca,Cb,共9個結果,所以2人中至少有1人不贊成“使用微信交流”的概率P=.5 / 5(共37張PPT)章末復習與總結一、變量的相關性 變量的相關關系與樣本相關系數是學習線性回歸模型的前提和基礎,前者可借助散點圖從直觀上分析變量間的相關性,后者從數量上準確刻畫了兩個變量的相關程度.【例1】 (2022·全國乙卷理19題·節選)某地經過多年的環境治理,已將荒山改造成了綠水青山.為估計一林區某種樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:m2)和材積量(單位:m3),得到如下數據:樣本號i 1 2 3 4 5 6 7 8 9 10 總和根部橫截 面積xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6材積量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9并計算得 =0.038, =1.615 8, xiyi=0.247 4.(1)估計該林區這種樹木平均一棵的根部橫截面積與平均一棵的材積量;解: 估計該林區這種樹木平均一棵的根部橫截面積 == =0.06,估計該林區這種樹木平均一棵的材積量 = = =0.39.(2)求該林區這種樹木的根部橫截面積與材積量的樣本相關系數(精確到0.01).附:樣本相關系數r= ,≈1.377.解: (xi- )(yi- )= xiyi-10 =0.013 4,(xi- )2= -10( )2=0.002,(yi- )2= -10( )2=0.094 8,所以 = =≈0.01×1.377=0.013 77,所以樣本相關系數r= ≈ ≈0.97.反思感悟判斷變量相關性的兩種方法(1)散點圖法:直觀形象;(2)公式法:可用公式精確計算,需注意特殊情形的樣本相關系數.如點在一條直線上,|r|=1,且當r=1時,正相關;r=-1時,負相關.【跟蹤訓練】1. 某次考試,班主任從全班同學中隨機抽取一個容量為8的樣本,他們的數學、物理成績對應如下表:學生編號 1 2 3 4 5 6 7 8數學成績x 60 65 70 75 80 85 90 95物理成績y 72 77 80 84 88 90 93 95繪出散點圖如下.根據以上信息,判斷下列結論:①根據此散點圖,可以判斷數學成績與物理成績具有線性相關關系;②根據此散點圖,可以判斷數學成績與物理成績具有一次函數關系;③甲同學數學考了80分,那么,他的物理成績一定比數學只考了60分的乙同學的物理成績要高.其中正確的個數為( )A. 0 B. 3C. 2 D. 1解析: 對于①②,根據此散點圖知,各點都分布在一條直線附近,可以判斷數學成績與物理成績具有較強的線性相關關系,不是一次函數關系,①正確,②錯誤;對于③,甲同學數學考了80分,他的物理成績可能比數學只考了60分的乙同學的物理成績要高,③錯誤.綜上,正確的命題是①,只有1個.2. 相關變量x,y的散點圖如圖所示,現對這兩個變量進行線性相關分析,方案一:根據圖中所有數據,得到經驗回歸方程為 = x+ ,樣本相關系數為r1;方案二:剔除點(10,21),根據剩下數據得到經驗回歸方程為 = x+ ,樣本相關系數為r2.則( )A. 0<r1<r2<1 B. 0<r2<r1<1C. -1<r1<r2<0 D. -1<r2<r1<0解析: 由散點圖得兩個變量呈負相關關系,所以r1<0,r2<0,因為剔除點(10,21)后,剩下點的數據的線性相關性更強,|r|更接近1,所以-1<r2<r1<0.故選D.二、經驗回歸方程 主要考查兩個變量線性相關的判定,以及利用最小二乘法求經驗回歸方程,并應用于實際或對因變量進行預測.【例2】 某項研究發現某地的PM10濃度與車流量之間有線性相關關系.現采集到該地一周內車流量x與PM10濃度y的數據如下表:時間 車流量x(單位:萬輛) PM10濃度y(單位:μg/m3)星期一 25.4 35.7星期二 24.6 34.5星期三 23.5 35.2星期四 24.4 33.6星期五 25.8 36.1星期六 19.7 30.9星期日 20.3 29.4(1)在如圖所示的坐標系中作出表中數據的散點圖;解: 如圖所示.(2)根據表中的統計數據,求出經驗回歸方程 = x+ (精確到0.01).解: 由表中數據得 ≈23.4, ≈33.6, = ≈ ≈0.97, = - =33.6-0.97×23.4≈10.90.所以y關于x的經驗回歸方程為 =0.97x+10.90.反思感悟解決回歸分析問題的一般步驟(1)畫散點圖.根據已知數據畫出散點圖;(2)判斷變量的相關性并求經驗回歸方程.通過觀察散點圖,直觀感知兩個變量是否具有相關關系;在此基礎上,利用最小二乘法求回歸系數,然后寫出經驗回歸方程;(3)實際應用.依據求得的經驗回歸方程解決實際問題.【跟蹤訓練】近年來我國外貿企業一手抓質量,一手抓生產,產銷形勢喜人.自2023年6月以來,我國外貿進出口連續實現正增長,出口國際市場占世界的份額不斷攀升,外貿發展韌性強勁.某個遠洋運輸公司出口營業額增長數據表如下:月份 2023年6月 2023年7月 2023年8月 2023年9月月份代碼x 1 2 3 4新增出口營業額y億元 2.4 2.8 3.6 5.1月份代碼x 5 6 7 8新增出口營業額y億元 7.1 9.1 11.7 14.2某位同學分別用兩種模型:① = x2+ ,② = x+ 進行擬合,得到相應的回歸方程并進行殘差分析,殘差圖如下(注:殘差等于yi- ):這位同學在進行擬合時,對數據作了初步處理,得到一些統計量的值:(ti- )(yi- )=686.8, (ti- )2=3 570.其中ti=, = ti.(1)根據殘差圖,比較模型①,②的擬合效果,應該選擇哪個模型?并簡要說明理由;解: 選擇模型①.理由如下:根據殘差圖可以看出,模型①的估計值和真實值相對比較接近,模型②的殘差相對較大一些,所以模型①的擬合效果相對較好.(2)根據(1)的判斷結果及表中數據,建立y關于x的回歸方程,并預測該遠洋運輸公司2024年3月新增出口營業額.(精確到0.01)附:對于一組數據(u1,υ1),(u2,υ2),…,(un,υn),經驗回歸直線 = + u的斜率和截距的最小二乘估計公式分別為 = , = - .解: 由(1),可知y關于x的回歸方程為 = x2+ ,令t=x2,則 = t+ .由所給數據可得 = ti= ×(1+4+9+16+25+36+49+64)=25.5,= yi= ×(2.4+2.8+3.6+5.1+7.1+9.1+11.7+14.2)=7,所以 = = ≈0.19,= - ≈7-0.19×25.5≈2.16,所以y關于x的回歸方程為 =0.19x2+2.16.預測該遠洋運輸公司2024年3月新增出口營業額為 =0.19×102+2.16=21.16(億元).三、獨立性檢驗 獨立性檢驗研究的主要問題是討論兩個分類變量之間關聯性問題.為此需先列出2×2列聯表,從表格中可以直觀地得到兩個分類變量是否有關系.獨立性檢驗的思想是先假設二者無關系,求隨機變量χ2的值,若χ2大于臨界值,則拒絕假設,否則,接受假設.【例3】 2023年12月28日,小米汽車舉行了技術發布會,首款產品SU7揭開神秘面紗,引起了廣大車迷愛好者的熱議,為了了解車迷們對該款汽車的購買意愿與性別是否具有相關性,某車迷協會隨機抽取了200名車迷朋友進行調查,所得數據統計如下表所示:購車意愿愿意購置 該款汽車 不愿購置 該款汽車 合計性別 男性 100 20 120女性 50 30 80合計 150 50 200判斷是否有99%把握認為車迷們對該款汽車的購買意愿與性別有關.參考公式:χ2= ,其中n=a+b+c+d.P(χ2≥x0) 0.1 0.05 0.01 0.005 0.001x0 2.706 3.841 6.635 7.879 10.828解:原假設為H0:車迷們對該款汽車的購買意愿與性別無關.根據表中數據可得χ2= = ≈11.111>10.828,所以有99%的把握認為車迷們對該款汽車的購買意愿與性別有關.反思感悟解獨立性檢驗應用問題的關注點(1)兩個明確:①明確兩類主體;②明確研究的兩個問題;(2)兩個準確:①準確列出2×2列聯表;②準確理解χ2.【跟蹤訓練】隨著手機的發展,“微信”逐漸成為人們交流的一種形式,某機構對“使用微信交流”的態度進行調查,隨機抽取了50人,他們年齡的頻數分布及對“使用微信交流”贊成人數如下表:年齡/歲 [15,25) [25,35) [35,45) [45,55) [55,65) [65,75]頻數 5 10 15 10 5 5贊成人數 5 10 12 7 2 1(1)若以“年齡45歲為分界點”,由以上統計數據完成下面2×2列聯表,并判斷是否有99%的把握認為“使用微信交流”的態度與人的年齡有關;年齡不低于 45歲的人數 年齡低于 45歲的人數 合計贊成不贊成合計解: 由題中統計數據填寫2×2列聯表,如下:年齡不低于 45歲的人數 年齡低于 45歲的人數 合計贊成 10 27 37不贊成 10 3 13合計 20 30 50根據公式計算,得χ2= ≈9.98>6.635,所以有99%的把握認為“使用微信交流”的態度與人的年齡有關.(2)若從年齡在[55,65)的被調查人中隨機選取2人進行追蹤調查,求2人中至少有1人不贊成“使用微信交流”的概率.附:χ2= .P(χ2≥x0) 0.10 0.05 0.01 0.005 0.001x0 2.706 3.841 6.635 7.879 10.828解: 設年齡在[55,65)中不贊成“使用微信交流”的人分別為A,B,C,贊成“使用微信交流”的人分別為a,b,則從5人中隨機選取2人有AB,AC,Aa,Ab,BC,Ba,Bb,Ca,Cb,ab,共10個結果.其中2人中至少有1人不贊成“使用微信交流”的有AB,AC,Aa,Ab,BC,Ba,Bb,Ca,Cb,共9個結果,所以2人中至少有1人不贊成“使用微信交流”的概率P= .謝 謝 觀 看! 展開更多...... 收起↑ 資源列表 章末復習與總結.docx 章末復習與總結.pptx 縮略圖、資源來源于二一教育資源庫