資源簡介 4.1 課時1 成對數據的統計相關性(一)【學習目標】1.會結合散點圖直觀認識兩個變量之間的線性相關性.(直觀抽象)2.了解樣本相關系數的統計含義,了解相關系數的計算公式及其性質.(數學抽象)3.會通過相關系數判斷兩變量之間的相關程度.(數學運算、數據分析)【自主預習】1.如何把一組數據x1,x2,…,xn轉化為均值為0、方差為1的數據呢 【答案】 令x'i=(i=1,2,…,n),不難驗證,x'1,x'2,…,x'n是均值為0、方差為1的數據.2.如何計算相關系數呢 【答案】 利用公式rxy=計算.3.相關系數r的取值范圍以及它與線性相關程度有何關系 【答案】 ①r的取值范圍為[-1,1];②|r|越接近于1,變量之間的線性相關程度越高;③|r|越接近于0,變量之間的線性相關程度越低.1.判斷下列結論是否正確.(正確的打“√”,錯誤的打“×”)(1)若兩個變量的相關系數r>0,則兩個變量正相關. ( )(2)兩個變量的相關系數越大,它們的相關程度越高. ( )(3)相關系數r的取值范圍是(-1,1). ( )(4)若相關系數r=0,則說明成對樣本數據間是函數關系. ( )【答案】 (1)√ (2)× (3)× (4)×2.下面對相關系數r描述正確的是 ( ).A.r>0表明兩個變量負相關B.r>1表明兩個變量正相關C.r只能大于零D.|r|越接近于0,兩個變量相關關系越弱【答案】 D【解析】 r>0表明兩個變量正相關,故A錯誤;r∈[-1,1],故B,C錯誤;兩個變量之間的相關系數r的絕對值越接近于1,表明兩個變量的線性相關性越強, r的絕對值越接近于0,表示兩個變量的線性相關性越弱,故D正確.3.根據統計,某蔬菜基地西紅柿畝產量的增加量y(單位:百千克)與某種液體肥料每畝使用量x(單位:千克)之間的對應數據的散點圖如圖所示.計算西紅柿畝產量的增加量y與液體肥料每畝使用量x之間的相關系數(結果保留兩位小數).附:相關系數rxy=.參考數據:≈0.55,≈0.95.【解析】 由已知數據可得==5,==4,所以(xi-)(yi-)=(-3)×(-1)+(-1)×0+0×0+1×0+3×1=6,==2,==,所以相關系數rxy===≈0.95.【合作探究】探究1 散點圖 為了了解人的身高與體重的關系,隨機地抽取9名15歲的男生,測得如下數據:身高/cm 165 157 155 175 168 157 178 160 163體重/kg 52 44 45 55 54 47 62 50 53 問題1:怎樣通過身高與體重的具體的數據來說明它們不是函數關系 【答案】 同一身高157 cm對應著不同的體重44 kg和47 kg,所以體重不是身高的函數.問題2:如果把身高看作橫坐標,體重看作縱坐標,在坐標系中畫出的對應點是怎樣的圖形 從畫出的圖形中,你發現了什么規律 【答案】 畫出的對應點接近直線排列;從圖中發現隨著身高的增長,體重基本上是呈直線增加的趨勢.問題3:任意兩個統計數據是否均可以作散點圖 【答案】 可以,不管這兩個統計量是否具備相關性,以一個變量值作為橫坐標,另一個作為縱坐標,均可畫出散點圖.新知生成1.散點圖我們以身高的取值為橫坐標,以體重的取值為縱坐標,建立平面直角坐標系,則每對數據(Hi,Wi)都可在平面直角坐標系中用一個點Pi(i=1,2,…,n)表示.這些點稱為散點,由坐標系及散點形成的數據圖叫作散點圖.2.如果兩個變量之間的關系近似地表現為一條直線,那么稱它們具有線性相關關系,簡稱為相關關系.3.如果一個變量的取值完全依賴于另一個變量,各觀測點落在一條直線上,那么稱它們線性相關,這實際上就是函數關系.新知運用例1 某公司利潤y(單位:千萬元)與銷售總額x(單位:千萬元)之間有如下對應數據:x 10 15 17 20 25 28 32y 1 1.3 1.8 2 2.6 2.7 3.3 (1)畫出散點圖;(2)判斷y與x是否具有線性相關關系.【解析】 (1)散點圖如下:(2)由圖可知,所有數據點接近直線排列,因此,認為y與x具有線性相關關系.【方法總結】 判斷變量之間有無相關關系,一種常用的簡便可行的方法就是繪制散點圖.散點圖由數據點分布構成,是分析研究兩個變量相關關系的重要手段.在散點圖中,如果點的分布從整體上看大致在一條直線附近,那么這兩個變量是線性相關的,否則不具備線性相關關系. 5名學生的數學和物理成績如下表:學生學科 A B C D E數學 80 75 70 65 60物理 70 66 68 64 62 畫出散點圖,判斷它們是否有相關關系.【解析】 以x軸表示數學成績,y軸表示物理成績,可得到相應的散點圖如圖所示.由散點圖可知,兩者之間具有相關關系,且為正相關.探究2 相關系數 散點圖可以說明變量間有無線性相關關系,但無法量化兩個變量之間的相關程度的高低,更不能精確地說明成對樣本數據之間關系的密切程度.問題:我們如何才能尋找到這樣一個合適的量來對樣本數據的相關程度進行定量分析呢 【答案】 相關系數r.新知生成 相關系數樣本容量是n的成對觀測數據,用(x1,y1),(x2,y2),…,(xn,yn)表示,用{xi}表示數據x1,x2,…,xn,用{yi}表示數據y1,y2,…,yn,用=xi,=yi分別表示{xi}和{yi}的均值,用sx=,sy=分別表示{xi}和{yi}的標準差,記sxy=-=(xi-)(yi-),當sxsy≠0時,我們稱rxy===為{xi}和{yi}的相關系數.新知運用例2 有人收集了某城市居民年收入x(單位:億元)(即所有居民在一年內收入的總和)與A商品銷售額y(單位:萬元)的10年數據,如表所示.第n年 1 2 3 4 5 6 7 8 9 10居民年收 入/億元 32.2 31.1 32.9 35.8 37.1 38.0 39.0 43.0 44.6 46.0A商品銷 售額/萬元 25.0 30.0 34.0 37.0 39.0 41.0 42.0 44.0 48.0 51.0 畫出散點圖,判斷成對樣本數據是否線性相關,并通過樣本相關系數判斷居民年收入與A商品銷售額的相關程度和變化趨勢的異同.附:相關系數rxy=.【解析】 畫出成對樣本數據的散點圖,從散點圖可以看出,A商品銷售額與居民年收入的樣本數據呈現出線性相關關系.因為=xi=37.97,=yi=39.1,所以樣本相關系數rxy=≈0.95.由此可以推斷,A商品銷售額與居民年收入呈正線性相關,即A商品銷售額與居民年收入有相同的變化趨勢,且相關程度很高.【方法總結】 利用相關系數r判斷線性相關關系時,需要利用公式計算出r的值,由于數據較多,需要借助計算器. 現隨機抽取了某中學高一年級10名在校學生入學時的數學成績x(單位:分)與入學后第一次考試的數學成績y(單位:分),如下表:學生號 1 2 3 4 5 6 7 8 9 10x 120 108 117 104 103 110 104 105 99 108y 84 64 84 68 69 68 69 46 57 71 求樣本的相關系數.【解析】 =×(120+108+…+99+108)=107.8,=×(84+64+…+57+71)=68,=1202+1082+…+992+1082=116584,=842+642+…+572+712=47384,xiyi=120×84+108×64+…+99×57+108×71=73796,所以所求相關系數rxy=≈0.7506.探究3 相關系數的性質問題1:若樣本相關系數r=0.86,則成對樣本數據的相關程度如何 【答案】 r=0.86,表明成對樣本數據正線性相關程度很強.問題2:|rxy|越接近于1,及越接近于0,表示兩個變量x與y之間線性相關程度如何 【答案】 |rxy|越接近于1,表明兩個變量的線性相關程度越強,它們的散點圖越接近于一條直線,這時用線性回歸模型擬合這組數據的效果就越好;|rxy|越接近于0,表明兩個變量的線性相關程度越弱.通常|rxy|>0.8時,認為有很強的線性相關關系.新知生成相關系數的性質:(1)rxy的取值范圍是[-1,1].(2)當0當-1當rxy=0時,稱{xi}和{yi}不相關.(3)|rxy|越接近于1,變量x,y的線性相關程度越高,這時數據(x1,y1),(x2,y2),…,(xn,yn)分散在一條直線附近.(4)|rxy|越接近于0,變量x,y的線性相關程度越低.(5)rxy具有對稱性,即rxy=ryx.(6)rxy僅僅是變量x與y之間線性相關程度的一個度量.rxy=0只表示兩個變量之間不存在線性相關關系,并不說明變量之間沒有關系,它們之間可能存在非線性關系.新知運用一、相關系數的性質例3 甲、乙、丙、丁四位同學各自對A,B兩變量的線性相關性做試驗,并分別求得相關系數r如下表:甲 乙 丙 丁r 0.82 0.78 0.69 0.85 則( )同學的試驗結果體現A,B兩變量的線性相關性最強.A.甲 B.乙 C.丙 D.丁【答案】 D【解析】 |rxy|越接近1,線性相關性越強.故選D.【方法總結】 相關系數的性質(1)當rxy>0時,x,y兩變量呈正相關關系;當rxy<0時,x,y兩變量呈負相關關系.(2)rxy的絕對值越接近0,線性相關性越弱;rxy的絕對值越接近1,線性相關性越強.對變量x,y有觀測數據(xi,yi)(i=1,2,…,10),得散點圖如圖1,對變量u,v有觀測數據(ui,vi)(i=1,2,…,10),得散點圖如圖2.由這兩個散點圖可以判斷 ( ).A.變量x與y正相關,變量u與v正相關B.變量x與y正相關,變量u與v負相關C.變量x與y負相關,變量u與v正相關D.變量x與y負相關,變量u與v負相關【答案】 C【解析】 由題圖可得兩組數據均呈線性相關,圖1中各點呈向右下方發展趨勢,所以變量x與y負相關;圖2中各點呈向右上方發展趨勢,所以變量u與v正相關.故選C.二、相關系數的計算及判斷例4 潛葉蠅是南方地區水稻容易遭受的蟲害之一,成蟲將蟲卵產在葉片里,待蟲卵孵化之后幼蟲會在葉片中啃食葉肉,使得秧苗的葉片呈現白色的狀態,進而降低水稻產量.經研究,每只潛葉蠅的平均產卵數y(單位:個)和夏季平均溫度x(單位:℃)有關,現收集了某地區以往6年的數據,得到下面數據統計表格.夏季平均溫度xi/℃ 21 23 25 27 29 31產卵數yi/個 7 11 21 22 64 115 根據相關系數rxy判斷潛葉蠅的平均產卵數y與夏季平均溫度x是否具有相關關系.【解析】 =xi==26,=yi==40,rxy====≈0.89>0.8.故可以判斷潛葉蠅的平均產卵數y與夏季平均溫度x具有很強的正相關關系.【方法總結】 當相關系數|rxy|越接近1時,兩個變量的線性相關關系越強;當相關系數|rxy|越接近0時,兩個變量的線性相關關系越弱. 某廠的生產原料耗費x(單位:百萬元)與銷售額y(單位:百萬元)之間有如下的對應關系:x 2 4 6 8y 30 40 50 70 (1)畫出(x,y)的散點圖;(2)計算x與y之間的樣本相關系數,并判斷它們的相關程度.【解析】 (1)畫出(x,y)的散點圖如圖所示. (2)=5,=47.5,=120,=9900,xiyi=1080,故樣本相關系數rxy==≈0.9827.由樣本相關系數rxy≈0.9827,可以判斷生產原料耗費與銷售額這兩個變量正相關,且相關程度很高.【隨堂檢測】1.下列有關樣本相關系數r的說法,錯誤的是( ).A.相關系數r可以用來衡量x與y之間的線性相關程度B.|r|≤1,且|r|越接近0,相關程度越低C.|r|≤1,且|r|越接近1,相關程度越高D.|r|≤1,且|r|越接近1,相關程度越低【答案】 D【解析】 相關系數是用來衡量兩個變量之間的線性相關程度的,相關系數是一個絕對值小于或等于1的量,并且它的絕對值越大就說明相關程度越高.故選D.2.某火鍋店為了了解營業額y(單位:百元)與氣溫x(單位:℃)之間的關系,隨機統計并制作了某6天當天營業額與當天氣溫的對比表.氣溫/℃ 26 18 13 10 4 -1營業額/百元 20 24 34 38 50 64畫出散點圖并判斷營業額與氣溫之間是否具有線性相關關系.【解析】 畫出散點圖如圖所示.=×(26+18+13+10+4-1)≈11.67,=×(20+24+34+38+50+64)≈38.33,xiyi=26×20+18×24+13×34+10×38+4×50-1×64=1910,=262+182+132+102+42+(-1)2=1286,=202+242+342+382+502+642=10172,由rxy=,可得rxy≈-0.97.因為|rxy|的值較接近于1,所以x與y具有很強的線性相關關系.24.1 課時1 成對數據的統計相關性(一)【學習目標】1.會結合散點圖直觀認識兩個變量之間的線性相關性.(直觀抽象)2.了解樣本相關系數的統計含義,了解相關系數的計算公式及其性質.(數學抽象)3.會通過相關系數判斷兩變量之間的相關程度.(數學運算、數據分析)【自主預習】1.如何把一組數據x1,x2,…,xn轉化為均值為0、方差為1的數據呢 2.如何計算相關系數呢 3.相關系數r的取值范圍以及它與線性相關程度有何關系 1.判斷下列結論是否正確.(正確的打“√”,錯誤的打“×”)(1)若兩個變量的相關系數r>0,則兩個變量正相關. ( )(2)兩個變量的相關系數越大,它們的相關程度越高. ( )(3)相關系數r的取值范圍是(-1,1). ( )(4)若相關系數r=0,則說明成對樣本數據間是函數關系. ( )2.下面對相關系數r描述正確的是 ( ).A.r>0表明兩個變量負相關B.r>1表明兩個變量正相關C.r只能大于零D.|r|越接近于0,兩個變量相關關系越弱3.根據統計,某蔬菜基地西紅柿畝產量的增加量y(單位:百千克)與某種液體肥料每畝使用量x(單位:千克)之間的對應數據的散點圖如圖所示.計算西紅柿畝產量的增加量y與液體肥料每畝使用量x之間的相關系數(結果保留兩位小數).附:相關系數rxy=.參考數據:≈0.55,≈0.95.【合作探究】探究1 散點圖 為了了解人的身高與體重的關系,隨機地抽取9名15歲的男生,測得如下數據:身高/cm 165 157 155 175 168 157 178 160 163體重/kg 52 44 45 55 54 47 62 50 53 問題1:怎樣通過身高與體重的具體的數據來說明它們不是函數關系 問題2:如果把身高看作橫坐標,體重看作縱坐標,在坐標系中畫出的對應點是怎樣的圖形 從畫出的圖形中,你發現了什么規律 問題3:任意兩個統計數據是否均可以作散點圖 新知生成1.散點圖我們以身高的取值為橫坐標,以體重的取值為縱坐標,建立平面直角坐標系,則每對數據(Hi,Wi)都可在平面直角坐標系中用一個點Pi(i=1,2,…,n)表示.這些點稱為散點,由坐標系及散點形成的數據圖叫作散點圖.2.如果兩個變量之間的關系近似地表現為一條直線,那么稱它們具有線性相關關系,簡稱為相關關系.3.如果一個變量的取值完全依賴于另一個變量,各觀測點落在一條直線上,那么稱它們線性相關,這實際上就是函數關系.新知運用例1 某公司利潤y(單位:千萬元)與銷售總額x(單位:千萬元)之間有如下對應數據:x 10 15 17 20 25 28 32y 1 1.3 1.8 2 2.6 2.7 3.3 (1)畫出散點圖;(2)判斷y與x是否具有線性相關關系.【方法總結】 判斷變量之間有無相關關系,一種常用的簡便可行的方法就是繪制散點圖.散點圖由數據點分布構成,是分析研究兩個變量相關關系的重要手段.在散點圖中,如果點的分布從整體上看大致在一條直線附近,那么這兩個變量是線性相關的,否則不具備線性相關關系. 5名學生的數學和物理成績如下表:學生學科 A B C D E數學 80 75 70 65 60物理 70 66 68 64 62 畫出散點圖,判斷它們是否有相關關系.探究2 相關系數 散點圖可以說明變量間有無線性相關關系,但無法量化兩個變量之間的相關程度的高低,更不能精確地說明成對樣本數據之間關系的密切程度.問題:我們如何才能尋找到這樣一個合適的量來對樣本數據的相關程度進行定量分析呢 新知生成 相關系數樣本容量是n的成對觀測數據,用(x1,y1),(x2,y2),…,(xn,yn)表示,用{xi}表示數據x1,x2,…,xn,用{yi}表示數據y1,y2,…,yn,用=xi,=yi分別表示{xi}和{yi}的均值,用sx=,sy=分別表示{xi}和{yi}的標準差,記sxy=-=(xi-)(yi-),當sxsy≠0時,我們稱rxy===為{xi}和{yi}的相關系數.新知運用例2 有人收集了某城市居民年收入x(單位:億元)(即所有居民在一年內收入的總和)與A商品銷售額y(單位:萬元)的10年數據,如表所示.第n年 1 2 3 4 5 6 7 8 9 10居民年收 入/億元 32.2 31.1 32.9 35.8 37.1 38.0 39.0 43.0 44.6 46.0A商品銷 售額/萬元 25.0 30.0 34.0 37.0 39.0 41.0 42.0 44.0 48.0 51.0 畫出散點圖,判斷成對樣本數據是否線性相關,并通過樣本相關系數判斷居民年收入與A商品銷售額的相關程度和變化趨勢的異同.附:相關系數rxy=.【方法總結】 利用相關系數r判斷線性相關關系時,需要利用公式計算出r的值,由于數據較多,需要借助計算器. 現隨機抽取了某中學高一年級10名在校學生入學時的數學成績x(單位:分)與入學后第一次考試的數學成績y(單位:分),如下表:學生號 1 2 3 4 5 6 7 8 9 10x 120 108 117 104 103 110 104 105 99 108y 84 64 84 68 69 68 69 46 57 71 求樣本的相關系數.【解析】 =×(120+108+…+99+108)=107.8,=×(84+64+…+57+71)=68,=1202+1082+…+992+1082=116584,=842+642+…+572+712=47384,xiyi=120×84+108×64+…+99×57+108×71=73796,所以所求相關系數rxy=≈0.7506.探究3 相關系數的性質問題1:若樣本相關系數r=0.86,則成對樣本數據的相關程度如何 問題2:|rxy|越接近于1,及越接近于0,表示兩個變量x與y之間線性相關程度如何 新知生成相關系數的性質:(1)rxy的取值范圍是[-1,1].(2)當0當-1當rxy=0時,稱{xi}和{yi}不相關.(3)|rxy|越接近于1,變量x,y的線性相關程度越高,這時數據(x1,y1),(x2,y2),…,(xn,yn)分散在一條直線附近.(4)|rxy|越接近于0,變量x,y的線性相關程度越低.(5)rxy具有對稱性,即rxy=ryx.(6)rxy僅僅是變量x與y之間線性相關程度的一個度量.rxy=0只表示兩個變量之間不存在線性相關關系,并不說明變量之間沒有關系,它們之間可能存在非線性關系.新知運用一、相關系數的性質例3 甲、乙、丙、丁四位同學各自對A,B兩變量的線性相關性做試驗,并分別求得相關系數r如下表:甲 乙 丙 丁r 0.82 0.78 0.69 0.85 則( )同學的試驗結果體現A,B兩變量的線性相關性最強.A.甲 B.乙 C.丙 D.丁【方法總結】 相關系數的性質(1)當rxy>0時,x,y兩變量呈正相關關系;當rxy<0時,x,y兩變量呈負相關關系.(2)rxy的絕對值越接近0,線性相關性越弱;rxy的絕對值越接近1,線性相關性越強.對變量x,y有觀測數據(xi,yi)(i=1,2,…,10),得散點圖如圖1,對變量u,v有觀測數據(ui,vi)(i=1,2,…,10),得散點圖如圖2.由這兩個散點圖可以判斷 ( ).A.變量x與y正相關,變量u與v正相關B.變量x與y正相關,變量u與v負相關C.變量x與y負相關,變量u與v正相關D.變量x與y負相關,變量u與v負相關二、相關系數的計算及判斷例4 潛葉蠅是南方地區水稻容易遭受的蟲害之一,成蟲將蟲卵產在葉片里,待蟲卵孵化之后幼蟲會在葉片中啃食葉肉,使得秧苗的葉片呈現白色的狀態,進而降低水稻產量.經研究,每只潛葉蠅的平均產卵數y(單位:個)和夏季平均溫度x(單位:℃)有關,現收集了某地區以往6年的數據,得到下面數據統計表格.夏季平均溫度xi/℃ 21 23 25 27 29 31產卵數yi/個 7 11 21 22 64 115 根據相關系數rxy判斷潛葉蠅的平均產卵數y與夏季平均溫度x是否具有相關關系.【方法總結】 當相關系數|rxy|越接近1時,兩個變量的線性相關關系越強;當相關系數|rxy|越接近0時,兩個變量的線性相關關系越弱. 某廠的生產原料耗費x(單位:百萬元)與銷售額y(單位:百萬元)之間有如下的對應關系:x 2 4 6 8y 30 40 50 70 (1)畫出(x,y)的散點圖;(2)計算x與y之間的樣本相關系數,并判斷它們的相關程度.【隨堂檢測】1.下列有關樣本相關系數r的說法,錯誤的是( ).A.相關系數r可以用來衡量x與y之間的線性相關程度B.|r|≤1,且|r|越接近0,相關程度越低C.|r|≤1,且|r|越接近1,相關程度越高D.|r|≤1,且|r|越接近1,相關程度越低2.某火鍋店為了了解營業額y(單位:百元)與氣溫x(單位:℃)之間的關系,隨機統計并制作了某6天當天營業額與當天氣溫的對比表.氣溫/℃ 26 18 13 10 4 -1營業額/百元 20 24 34 38 50 64畫出散點圖并判斷營業額與氣溫之間是否具有線性相關關系.2 展開更多...... 收起↑ 資源列表 4.1 課時1 成對數據的統計相關性(一) - 副本.docx 4.1 課時1 成對數據的統計相關性(一).docx 縮略圖、資源來源于二一教育資源庫