資源簡介 第4章 統(tǒng)計4.1 成對數據的統(tǒng)計相關性基礎過關練 題組一 變量的相關關系1.下列說法正確的是( )A.任何兩個變量都具有相關關系B.球的體積與該球的半徑具有相關關系C.農作物的產量與施肥量之間是一種確定性關系D.一個學生的數學成績與物理成績之間是一種非確定性關系2.(多選)對于任意給定的兩個變量的統(tǒng)計數據,下列說法錯誤的是( )A.一定可以分析出兩個變量之間的關系B.一定可以用一條直線近似地表示兩者之間的關系C.一定可以畫出散點圖D.一定可以用確定的表達式表示兩者之間的關系3.在下列各圖中,兩個變量之間具有相關關系的是 ( )A.(1)(2) B.(1)(3)C.(2)(4) D.(2)(3)4.給出5組數據如表所示,從中選出4組數據使x與y的線性相關程度最大,若保留第1組數據(-5,-3),則在余下的4組數據中應去掉 ( )組號 1 2 3 4 5x -5 -4 -3 -2 4y -3 -2 4 -1 6A.第2組數據 B.第3組數據C.第4組數據 D.第5組數據5.某商城在某年前5個月的銷售額和利潤額資料如下表所示:月份 一月 二月 三月 四月 五月銷售額 x/千萬元 3 5 6 7 9利潤額 y/百萬元 2 3 3 4 5(1)根據上表數據畫出散點圖;(2)觀察散點圖,判斷利潤額y與銷售額x之間是否具有線性相關關系.題組二 相關系數的應用6.已知r1是變量X與Y之間的相關系數,r2是變量U與V之間的相關系數,且r1=0.837,r2=-0.957,則 ( )A.變量X與Y之間呈正相關關系,且X與Y之間的相關性強于U與V之間的相關性B.變量X與Y之間呈負相關關系,且X與Y之間的相關性強于U與V之間的相關性C.變量U與V之間呈負相關關系,且X與Y之間的相關性弱于U與V之間的相關性D.變量U與V之間呈正相關關系,且X與Y之間的相關性弱于U與V之間的相關性7.對四組數據進行統(tǒng)計,獲得以下散點圖,關于其相關系數的比較正確的是( )A.r2B.r4C.r4D.r28.下表是彈簧伸長的長度x(cm)與拉力值y(N)的對應數據:長度x(cm) 1 2 3 4 5拉力值y(N) 3 7 8 10 12(1)求相關系數rxy(保留兩位小數);(2)通過相關系數rxy說明y與x是否高度相關.(若|rxy|>0.8,則認為y與x是高度相關的)附:rxy=,≈3.16,≈6.78.9.某種機械設備隨著使用年限的增加,它的使用功能逐漸減退,使用價值逐年減少,通常把它使用價值逐年減少的“量”換算成費用,稱之為“失效費”.某種機械設備的使用年限x(單位:年)與失效費y(單位:萬元)的統(tǒng)計數據如下表所示:使用年限x(單位:年) 2 4 5 6 8失效費y(單位:萬元) 3 4 5 6 7根據上表數據,計算y與x的相關系數rxy,并說明y與x是否高度相關.(若|rxy|>0.8,則認為y與x高度相關)附:rxy=.題組三 多組成對數據的相關性、相關系數與向量的夾角10.近年來,“共享汽車”在我國各城市迅猛發(fā)展,為人們的出行提供了便利,但也給城市交通管理帶來了一些困難.為了解“共享汽車”在M省的發(fā)展情況,M省某調查機構從該省隨機抽取了5個城市,分別收集和分析了“共享汽車”的A,B,C三項指標數據xi,yi,zi(i=1,2,3,4,5),數據如下表所示:城市編號i 1 2 3 4 5A指標xi 4 6 2 8 5B指標yi 4 4 3 5 4C指標zi 3 6 2 5 4(1)分別求y與x之間的相關系數rxy及z與x之間的相關系數rxz,并比較y與x,z與x之間相關性的強弱;(2)利用向量夾角來分析y與x之間及z與x之間的相關關系.附:相關系數rxy=能力提升練 題組一 變量的相關關系1.對變量x,y有觀測數據(xi,yi)(i=1,2,…,10),其散點圖如圖(1);對變量u,v有觀測數據(ui,vi)(i=1,2,…,10),其散點圖如圖(2),由這兩個散點圖可以判斷( )A.變量x與y正相關,u與v正相關B.變量x與y正相關,u與v負相關C.變量x與y負相關,u與v正相關D.變量x與y負相關,u與v負相關2.(多選)在一次質量檢測中,某校高三1班48名物理方向的學生的語文成績、數學成績與六科總成績在全年級中的排名情況如圖所示,“”表示的是該班甲、乙、丙三名同學對應的點.從這次考試的成績看,下列結論正確的是( )A.該班六科總成績在全年級排名前6的同學的語文成績比數學成績排名更好B.在語文和數學兩個科目中,丙同學的成績名次更靠前的科目是語文C.數學成績與六科總成績的相關性比語文成績與六科總成績的相關性更強D.在甲、乙兩人中,語文成績名次比六科總成績名次靠前的學生是甲題組二 相關系數的應用3.變量X與Y相對應的一組數據為(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);變量U與V相對應的一組數據為(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).記rXY為變量X與Y之間的相關系數,rUV為變量U與V之間的相關系數,則( )A.rUV4.為了監(jiān)控一條生產線上某種零件的生產過程,檢驗員每隔30 min從該生產線上隨機抽取一個零件,并測量其尺寸(單位:cm).下面是檢驗員在一天內依次抽取的16個零件的尺寸數據:抽取次序x 1 2 3 4 5 6零件 尺寸y 9.95 10.12 9.96 9.96 10.01 9.92抽取次序x 7 8 9 10 11 12零件 尺寸y 9.98 10.04 10.26 9.91 10.13 10.02抽取次序x 13 14 15 16零件 尺寸y 9.22 10.04 10.05 9.95經計算得=(xi-)(yi-)=-2.78.(1)求y與x的相關系數rxy,并回答是否可以認為這一天生產的零件的尺寸不隨生產過程的進行而系統(tǒng)地變大或變小(若|rxy|<0.25,則可以認為零件的尺寸不隨生產過程的進行而系統(tǒng)地變大或變小);(2)在一天內抽檢的零件中,如果出現了尺寸在(-3s,+3s)之外的零件,就認為這條生產線在這一天的生產過程中可能出現了異常情況,需對當天生產的所有零件進行檢查.從這一天抽檢的結果看,是否需對當天生產的所有零件進行檢查 5.近年來,大學生就業(yè)壓力日益嚴峻,伴隨著政府政策的引導與社會觀念的轉變,大學生的創(chuàng)業(yè)意識及就業(yè)方向也悄然發(fā)生轉變.在國家提供稅收、擔保貸款等多方面的政策扶持下,某大學生選擇加盟某專營店自主創(chuàng)業(yè),該專營店統(tǒng)計了近五年來的創(chuàng)收利潤yi(單位:萬元)與時間ti(單位:年)的相關數據,列表如下:ti 1 2 3 4 5yi 2.4 2.7 4.1 6.4 7.9(1)依據表中給出的數據,是否可用線性回歸模型擬合y與t的關系 請計算相關系數rty并加以說明(計算結果精確到0.01,若|rty|>0.8,則認為y與t高度相關,可用線性回歸模型擬合y與t的關系).附:相關系數rty=(2)專營店為吸引顧客,特推出兩種促銷方案:方案一:每消費滿500元可減50元;方案二:每消費滿500元可抽獎一次,每次中獎的概率都為,中獎就可以獲得100元現金獎勵,假設顧客每次抽獎的結果相互獨立.某位顧客購買了2 000元的產品.作為專營店老板,是希望該顧客選擇直接返還現金,還是選擇參加四次抽獎 請說明理由.答案與分層梯度式解析第4章 統(tǒng)計4.1 成對數據的統(tǒng)計相關性基礎過關練1.D 當兩個變量之間具有確定的關系時,兩個變量之間是函數關系,而不是相關關系,故A錯誤;球的體積與該球的半徑之間是函數關系,故B錯誤;農作物的產量與施肥量之間的關系是相關關系,是一種非確定性關系,故C錯誤;學生的數學成績與物理成績之間的關系是相關關系,是一種非確定性關系,故D正確.故選D.2.ABD 給出兩個變量的統(tǒng)計數據,總可以畫出相應的散點圖,但不一定能分析出兩個變量之間的關系,更不一定符合線性相關,即不一定能用一條直線近似地表示兩者之間的關系,故A、B中說法不正確,C中說法正確.兩個變量之間不一定具有函數關系,故D中說法不正確.故選ABD.3.D 對于題圖(1),所有的點都在曲線上,故具有函數關系;對于題圖(2),所有的散點都分布在一條直線附近,故具有相關關系;對于題圖(3),所有的散點都分布在一條曲線附近,故具有相關關系;對于題圖(4),散點的分布雜亂無章,故不具有相關關系.故選D.4.B 畫出散點圖如圖所示,由圖可知應去掉第3組數據(-3,4),故選B.5.解析 (1)散點圖如圖所示.(2)由散點圖可知,所有散點排列在一條直線附近,所以利潤額與銷售額之間具有線性相關關系.6.C 易知變量X與Y之間呈正相關關系,變量U與V之間呈負相關關系,因為|r1|=0.837,|r2|=0.957,|r1|<|r2|,所以X與Y之間的相關性弱于U與V之間的相關性.故選C.7.B 由題中的散點圖可以看出,圖1和圖3是正相關,相關系數大于0,則r1>0,r3>0,圖2和圖4是負相關,相關系數小于0,則r2<0,r4<0,圖3和圖4的點相對于圖1和圖2更加集中,所以相關性較強,所以r3更接近于1,r4更接近于-1,由此可得r4故選B.8.解析 (1)依題意得==3,==8,==,==,(xi-)(yi-)=(-2)×(-5)+(-1)×(-1)+0×0+1×2+2×4=21,所以相關系數rxy==≈≈0.98.(2)由(1)知,rxy≈0.98>0.8,說明y與x是高度相關的.9.解析 由題表知,=×(2+4+5+6+8)=5,=×(3+4+5+6+7)=5,xiyi=2×3+4×4+5×5+6×6+8×7=139,=22+42+52+62+82=145,=32+42+52+62+72=135,所以rxy===≈0.99,因為|0.99|>0.8,所以認為y與x高度相關.10.解析 (1)由已知,得==5,==4,==4,所以rxy===≈0.95,rxz===≈0.846,所以y與x正相關,z與x正相關,又因為rxy>rxz,所以y與x之間的相關性比z與x之間的相關性強.(2)由(1)知=5,=4,=4,將題表中x,y,z的相關數據分別減去,,,記a=(x1-,x2-,x3-,x4-,x5-),b=(y1-,y2-,y3-,y4-,y5-),c=(z1-,z2-,z3-,z4-,z5-),則可得a=(-1,1,-3,3,0),b=(0,0,-1,1,0),c=(-1,2,-2,1,0),于是cos===≈0.95,cos===≈0.846,所以y與x正相關,z與x正相關,又因為cos>cos,所以y與x之間的相關性比z與x之間的相關性強.能力提升練1.C 題圖(1)中的散點大致分布在一條直線附近,從整體上看,y隨x的增大而呈現減小的趨勢,所以x與y負相關.題圖(2)中的散點大致分布在一條直線附近,從整體上看,v隨u的增大而呈現增大的趨勢,所以u與v正相關.故選C.方法總結判定兩個變量正、負相關的方法(1)畫散點圖:若散點近似均勻地分布在左下角到右上角的區(qū)域,則兩個變量正相關;若散點近似均勻地分布在左上角到右下角的區(qū)域,則兩個變量負相關.(2)相關系數:rxy>0時,x與y正相關;rxy<0時,x與y負相關.2.BCD 由題圖可得,該班六科總成績排名前6的同學的數學成績比語文成績排名更好,故A錯誤;由題圖2可得,丙的總成績排在班上倒數第三名,其語文成績排在全年級250到300名之間,由題圖1可得,丙的數學成績排在全年級400名左右,故B正確;題圖2中的點的分布較題圖1中的點更分散,可知數學成績與六科總成績的相關性比語文成績與六科總成績的相關性更強,故C正確;由題圖1可得甲的總成績排在班上第7名,全年級名次為100名多一點,對應到題圖2可得,甲的語文成績排在全年級前50名,故甲的語文成績名次比其六科總成績名次靠前,由題圖1可得乙的總成績排在班上第27名,全年級名次為250名左右,對應到題圖2可得,乙的語文成績排在全年級250名左右,故乙的語文成績名次與其六科總成績名次相近,故D正確.故選BCD.3.B 由變量X與Y的對應數據可得變量X與Y之間呈正相關,因此rXY >0;由變量U與V的對應數據可得變量U與V之間呈負相關,因此rUV<0.故rUV<04.解析 (1)易得y與x的相關系數rxy==≈-0.18.由于|rxy|<0.25,因此可以認為這一天生產的零件的尺寸不隨生產過程的進行而系統(tǒng)地變大或變小.(2)由于=9.97,s≈0.212,所以-3s=9.334,+3s=10.606.由樣本數據可以看出抽取的第13個零件的尺寸在(-3s,+3s)以外,因此需對當天生產的所有零件進行檢查.5.解析 (1)由題知,=×(1+2+3+4+5)=3,=×(2.4+2.7+4.1+6.4+7.9)=4.7,===≈≈0.97,∵|0.97|>0.8,∴y與t高度相關,可用線性回歸模型擬合.(2)專營店老板希望該顧客選擇參加四次抽獎.理由如下:用X表示顧客在四次抽獎中中獎的次數,∵顧客每次抽獎的結果相互獨立,∴X~B,∴E(X)=4×=1.6.由于顧客每中一次獎就可獲得100元現金獎勵,因此顧客在四次抽獎中可獲得的現金獎勵的期望為1.6×100=160(元).∵160<4×50=200,∴專營店老板希望該顧客選擇參加四次抽獎.(共9張PPT)1.散點圖將成對觀測數據用直角坐標系中的點表示,這些點稱為散點,由坐標系及散點形成的數據圖叫作散點圖,散點圖直觀地描述了變量之間的關系形態(tài).2.線性相關關系如果兩個變量之間的關系近似地表現為一條直線,則稱它們有線性相關關系,簡稱為相關關系.3.線性相關如果一個變量的取值完全依賴于另一個變量,各觀測點落在一條直線上,則稱它們線性相關,這實際上就是函數關系.4.1 成對數據的統(tǒng)計相關性1 | 散點圖1.定義一般地,對n個成對觀測數據(x1,y1),(x2,y2),…,(xn,yn),我們用{xi}表示數據x1,x2,…,xn,{yi}表示數據y1,y2,…,yn,用 =2 | 相關系數為{xi}和{yi}的相關系數.2.相關系數的性質rxy的取值范圍是[-1,1].當0負相關;當rxy=0時,稱{xi}和{yi}不相關.(2)|rxy|越接近于1,變量x,y的線性相關程度越高,這時數據 (x1,y1),(x2,y2),…,(xn,yn)分散在一條直線附近.(3)|rxy|越接近于0,變量x,y的線性相關程度越低.(4) rxy具有對稱性,即rxy=ryx.(5) rxy僅僅是變量x與y之間線性相關程度的一個度量.rxy=0只表示兩個變量之間不存在線性相關關系,并不說明變量之間沒有關系,它們之間可能存在非線性關系.1.利用向量夾角的余弦值表示相關系數把兩組成對數據分別看作n維空間的兩個向量(x1,x2,…,xn),(y1,y2,…,yn),再將向量的每個元素都減去均值,形成a=(x1- ,x2- ,…,xn- ),b=(y1- ,y2- ,…,yn- ),從而有cos= 2.相關程度與向量夾角的關系(1)當∈ 時,余弦值越大表示兩個向量的夾角越小,兩組數據的正相關程度越高;余弦值越小表示兩個向量的夾角越大,兩組數據的正相關程度越低.(2)當∈ 時,余弦值越大表示兩個向量的夾角越小,兩組數據的負相關程度越低;余弦值越小表示兩個向量的夾角越大,兩組數據的負相關程度越高.(3)當= 時,余弦值為0,這說明兩組數據不相關.3 | 相關系數與向量夾角1.相關關系是兩個變量之間的一種確定的關系嗎 不是.相關關系是一種不確定的關系.2.兩個變量有線性相關關系就是兩個變量線性相關嗎 不是.若兩個變量有線性相關關系,則它們之間的關系近似地表現為一條直線,不是函數關系;若兩個變量線性相關,則各觀測點完全落在一條直線上,兩個變量之間是函數關系.3.當相關系數rxy=0時,可以說兩個變量之間沒有關系嗎 不可以.rxy=0只表示兩個變量之間不存在線性相關關系,并不說明變量之間沒有關系,它們之間可能存在非線性關系.4.若r1=-0.95,r2=0.85,則體現兩變量相關關系較強的是r2嗎 不是.當|r|越接近于1時,成對數據的線性相關程度越強,所以體現兩變量相關關系較強的是r1.知識辨析 兩個變量相關性的判斷 1.利用散點圖判斷兩個變量的相關性若散點落在一條直線附近,則認為這兩個變量有線性相關關系.一般地,如果變量x和y正相關,那么大多數散點將分布在第一、三象限,對應的成對數據同號的居多;如果變量x和y負相關,那么大多數散點將分布在第二、四象限,對應的成對數據異號的居多.2.利用相關系數判斷兩個變量的相關性|rxy|刻畫了樣本點集中于某條直線的程度.|rxy|越接近于1,散點圖中的散點分布越接近于一條直線,兩個變量的線性相關程度越高.3.利用向量的夾角判斷兩個變量的相關性由相關系數rxy=cos,結合相關程度與向量夾角的關系可直接判斷兩個變量的相關性. 典例 下表為某省十二個地區(qū)某年1月平均氣溫與海拔及緯度的數據:平均氣溫xi/℃ 6.9 17 16.9 11.3 14.2 12.3海拔yi/m 3 640 4 420 4 220 2 840 3 200 3 140緯度zi 32.2 33.8 35 36.3 37.1 38.4平均氣溫xi/℃ 18.2 17.3 10.4 13.3 6.4 8.6海拔yi/m 3 360 4 650 2 680 3 970 2 080 2 260緯度zi 38.9 35.3 36.8 33.8 35.9 36.6注:表中i=1,2,3,…,12.(1)試分析1月平均氣溫與海拔之間、1月平均氣溫與緯度之間是否具有相關關系;(2)用向量夾角分析1月平均氣溫與海拔之間、1月平均氣溫與緯度之間的相關關系.思路點撥 (1)作散點圖,觀察相關性.(2)均值化處理兩組成對數據,求出各自對應的第一分量、第二分量構成的12維向量,求向量夾角的余弦值得到相關系數,進而解決問題.解析 (1)作1月平均氣溫x與海拔y的散點圖,如圖:作1月平均氣溫x與緯度z的散點圖,如圖:將其依次記為(x'1,y'1),(x'2,y'2),…,(x'12,y'12),(x'1,z'1),(x'2,z'2),…,(x'12,z'12).設“標準化”處理后的成對數據(x'1,y'1),(x'2,y'2),…,(x'12,y'12)的第一分量構成12維向量x'=(x'1,x'2,…,x'12),第二分量構成12維向量y'=(y'1,y'2,…,y'12),故x'·y'≈8.737 2.設向量x'與y'的夾角為θ1,于是得1月平均氣溫與海拔之間的相關系數rxy=cos θ1= ≈0.728 1.設均值化處理后的成對數據(x'1,z'1),(x'2,z'2),…,(x'12,z'12)的第二分量構成12維向量z'=(z'1,z'2,…,z'12),有x'·z'≈2.229 4.設向量x'與z'的夾角為θ2,于是得1月平均氣溫與緯度之間的相關系數rxz=cos θ2= ≈0.185 8.因此,1月平均氣溫與海拔之間呈正相關,但相關關系一般,1月平均氣溫與緯度之間相關關系很弱. 展開更多...... 收起↑ 資源列表 4.1 成對數據的統(tǒng)計相關性.docx 4.1 成對數據的統(tǒng)計相關性.pptx 縮略圖、資源來源于二一教育資源庫