資源簡介 專題8.1 成對數據的統計相關性(重難點題型精講)1.變量的相關關系(1)函數關系函數關系是一種確定性關系,常用解析式來表示.(2)相關關系兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系.與函數關系不同,相關關系是一種非確定性關系.2.散點圖(1)散點圖成對樣本數據都可用直角坐標系中的點表示出來,由這些點組成的統計圖叫做散點圖.(2)正相關和負相關如果從整體上看,當一個變量的值增加時,另一個變量的相應值也呈現增加的趨勢,我們就稱這兩個變量正相關;如果當一個變量的值增加時,另一個變量的相應值呈現減少的趨勢,則稱這兩個變量負相關.3.線性相關一般地,如果兩個變量的取值呈現正相關或負相關,而且散點落在一條直線附近,則稱這兩個變量線性相關.4.樣本相關系數(1)對于變量x和變量y,設經過隨機抽樣獲得的成對樣本數據為(,),(,),,(,),利用相關系數r來衡量兩個變量之間線性關系的強弱,相關系數r的計算公式:(其中,,,和,,,的均值分別為和).①當r>0時,稱成對樣本數據正相關.這時,當其中一個數據的值變小時,另一個數據的值通常也變小;當其中一個數據的值變大時,另一個數據的值通常也變大.②當r<0時,稱成對樣本數據負相關.這時,當其中一個數據的值變小時,另一個數據的值通常會變大;當其中一個數據的值變大時,另一個數據的值通常會變小.【題型1 變量間的相關關系】【方法點撥】根據變量間的相關關系的定義,進行判斷求解即可.【例1】(2022春·四川成都·高二期中)下列兩個量之間的關系是相關關系的是( )A.勻速直線運動中時間與位移的關系 B.學生的成績和身高C.兒童的年齡與體重 D.物體的體積和質量【解題思路】根據相關關系和函數關系的概念即可判斷【解答過程】A、D是函數關系;B是不相關關系;C是相關關系,故選:C.【變式1-1】(2023·全國·高二專題練習)下列說法正確的是( )A.中的x,y是具有相關關系的兩個變量B.正四面體的體積與棱長具有相關關系C.電腦的銷售量與電腦的價格之間是一種確定性的關系D.傳染病醫院感染傳染病的醫務人員數與醫院收治的傳染病人數是具有相關關系的兩個變量【解題思路】根據相關關系的定義、函數的定義即可判斷【解答過程】A,B均為函數關系,故A、B錯誤;C,D為相關關系,故C錯,D對.故選:D.【變式1-2】(2022春·安徽阜陽·高二階段練習)有幾組變量:①汽車的重量和汽車每消耗1升汽油所行駛的平均路程;②平均日學習時間和平均學習成績;③立方體的棱長和體積.其中兩個變量成正相關的是( )A.①③ B.②③C.② D.③【解題思路】利用相關關系和函數關系的概念分析解答.【解答過程】①汽車的重量和汽車每消耗1升汽油所行駛的平均路程是負相關關系;②平均日學習時間和平均學習成績是正相關關系;③立方體的棱長和體積是函數關系,不是相關關系.故選:C.【變式1-3】(2023·全國·高二專題練習)下列說法正確的是( )A.任何兩個變量都具有相關關系B.球的體積與該球的半徑具有相關關系C.農作物的產量與施化肥量之間是一種確定性關系D.一個學生的數學成績與物理成績之間是一種非確定性的關系【解題思路】根據相關關系是一種不確定關系,函數關系是一種確定關系,可判斷A;根據球的體積與半徑之間的關系,可判斷該關系為函數關系,可判斷B;根據農作物的產量與施化肥量之間的關系可得該關系為一種相關關系,可判斷C;根據學生的數學成績與物理成績之間是一種相關關系可判斷D.【解答過程】解:當兩個變量之間具有確定的關系時,兩個變量之間是函數關系,而不是相關關系,故A錯誤;球的體積與該球的半徑之間是函數關系,故B錯誤;農作物的產量與施化肥量之間的關系是相關關系,是非確定性關系,故C錯誤;學生的數學成績與物理成績之間的關系是相關關系,是非確定性關系,故D正確.故選:D.【題型2 利用散點圖判斷相關性】【方法點撥】根據所給的散點圖,研究兩個變量之間的相關關系,進行求解即可.【例2】(2022·全國·高三專題練習)對變量、由觀測數據得散點圖,對變量、由觀測數據得散點圖.由這兩個散點圖可以判斷( )A.變量與負相關,與正相關B.變量與負相關,與負相關C.變量與正相關,與正相關D.變量與正相關,與負相關【解題思路】根據散點圖直接判斷可得出結論.【解答過程】由散點圖可知,變量與負相關,變量與正相關,所以,與負相關.故選:B.【變式2-1】(2022·高二課時練習)在下列各散點圖中,兩個變量具有正相關關系的是( )A. B.C. D.【解題思路】根據散點圖中兩個變量的變化趨勢直接判斷即可.【解答過程】對于A,散點的變化具有波動性,非正相關關系,A錯誤;對于B,當變大時,的變化趨勢也是逐漸增大,可知兩個變量具有正相關關系,B正確;對于C,當變大時,的變化趨勢是逐漸減小,可知兩個變量具有負相關關系,C錯誤;對于D,兩個變量的變化無規律,二者沒有相關性,D錯誤.故選:B.【變式2-2】(2022·重慶沙坪壩·模擬預測)某中學的興趣小組在某座山測得海拔高度 氣壓 沸點的六組數據,并繪制出如圖所示的散點圖,下列說法錯誤的是( )A.氣壓與海拔高度呈負相關 B.沸點與氣壓呈正相關C.沸點與海拔高度呈正相關 D.沸點與海拔高度的相關性很強【解題思路】根據正相關、負相關的概念判斷.【解答過程】沸點與氣壓呈正相關,氣壓與海拔高度呈負相關,所以沸點與海拔高度呈負相關,故選:C.【變式2-3】(2023·全國·高三專題練習)對四組數據進行統計,獲得以下散點圖,關于其相關系數的比較,正確的是( )A. B.C. D.【解題思路】利用正負相關與線性相關的強弱進行求解即可【解答過程】都是正線性相關,所以,并且相關性最強,所以;都是負線性相關并,所以,且相關性強,所以,所以;所以;故選:A.【題型3 樣本相關系數的意義】【方法點撥】對于所給題目,根據樣本相關系數的定義和有關概念來進行判斷,即可得解.【例3】(2022秋·陜西榆林·高二期末)兩個變量與的回歸模型中,分別選擇了4個不同的模型,它們的相關系數如下表,其中擬合效果最好的模型是( )模型 模型1 模型2 模型3 模型4相關系數A.模型1 B.模型2 C.模型3 D.模型4【解題思路】根據相關系數的定義,判斷的大小,即可判斷選項.【解答過程】根據相關系數的定義可知,越大,約接近于1,則擬合效果越好.由數據可知,模型2的相關系數最大,所以擬合效果最好.故選:B.【變式3-1】(2022春·山東臨沂·高二期末)對于樣本相關系數,下列說法錯誤的是( )A.樣本相關系數可以用來判斷成對樣本數據相關的正負性B.樣本相關系數可以是正的,也可以是負的C.樣本相關系數D.樣本相關系數越大,成對樣本數據的線性相關程度也越強【解題思路】利用相關系數與成對樣本數據間的相關關系逐項判斷,可得出合適的選項.【解答過程】對于A選項,樣本相關系數可以用來判斷成對樣本數據相關的正負性,A對;對于B選項,樣本相關系數可以是正的,也可以是負的,B對;對于C選項,樣本相關系數,C對;對于D選項,樣本相關系數的絕對值越大,成對樣本數據的線性相關程度也越強,D錯.故選:D.【變式3-2】(2022·高二課時練習)下列有關樣本線性相關系數r的說法,錯誤的是( )A.相關系數r可用來衡量x與y之間的線性相關程度B.,且越接近0,相關程度越小C.,且越接近1,相關程度越大D.,且越接近1,相關程度越小【解題思路】根據相關系數的定義,即可判斷選項.【解答過程】相關系數是來衡量兩個變量之間的線性相關程度的,線性相關系數是一個絕對值小于等于1的量,并且它的絕對值越大就說明相關程度越大,所以不正確的只有D.故選:D.【變式3-3】(2022春·江蘇無錫·高二期末)對于樣本相關系數r,下列說法不正確的是( )A.樣本相關系數r可以用來判斷成對數據相關的正負性B.樣本相關系數C.當時,表明成對樣本數據間沒有線性相關關系D.樣本相關系數r越大,成對樣本數據的線性相關程度也越強【解題思路】根據相關系數:1.;2.,則成對數據為正相關,,則成對數據為負相關;3. ,線性相關程度越強,,線性相關程度越弱,時,則成對樣本數據間沒有線性相關關系;理解辨析.【解答過程】根據相關系數的理解:,B正確;,則成對數據為正相關;,則成對數據為負相關; A正確;,線性相關程度越強,,線性相關程度越弱,時,則成對樣本數據間沒有線性相關關系,C正確,D不正確;故選:D.【題型4 樣本相關系數的應用】【方法點撥】樣本相關系數是對兩個變量相關程度進行定量刻畫,|r|越大,表明兩個變量之間的線性相關程度越強,運用樣本相關系數進行判斷的一般步驟如下:(1)整理數據,求出相關值;(2)計算樣本相關系數;(3)得出結論.【例4】(2022秋·陜西西安·高二階段練習)某沙漠地區經過治理,生態系統得到很大改善,野生動物數量有所增加.為調查該地區某種野生動物的數量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區,調查得到樣本數據(xi,yi)(i=1,2,…,20),其中xi和yi分別表示第i個樣區的植物覆蓋面積(單位:公頃)和這種野生動物的數量,并計算得,,,,.(1)求該地區這種野生動物數量的估計值(這種野生動物數量的估計值等于樣區這種野生動物數量的平均數乘以地塊數);(2)求樣本(xi,yi) (i=1,2,…,20)的相關系數(精確到0.01);(附:相關系數, )【解題思路】(1)由已知數據求得20個樣區野生動物數量的平均數,乘以200得答案;(2)由已知直接利用相關系數公式求解.【解答過程】(1)由已知得樣本平均數,從而該地區這種野生動物數量的估計值為60×200=12000.(2)樣本 的相關系數.【變式4-1】(2022·全國·高三專題練習)某沙漠地區經過治理,生態系統得到很大改善,野生動物數量有所增加.為調查該地區某種野生動物的數量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區,調查得到樣本數據,其中和分別表示第個樣區的植物覆蓋面積(單位:公頃)和這種野生動物的數量(單位:頭),并計算得,,,,.(1)估計該地區這種野生動物的數量;(2)求樣本的相關系數.(精確到0.01)【解題思路】(1)計算出樣區野生動物的數量的平均值,乘以地塊數,即得答案;(2)根據相關系數公式進行計算,可得答案.【解答過程】(1)由已知得樣本平均數 ,從而該地區這種野生動物數量的估計值為.(2)由,,,可得樣本 的相關系數為.【變式4-2】(2022·高二課時練習)下圖是我國年至年生活垃圾無害化處理量(單位:億噸)的折線圖.(注:年份代碼分別對應年份.)由折線圖看出,可用線性回歸模型擬合與的關系.請求出相關系數,并用相關系數的大小說明與相關性的強弱.參考數據和公式:,,,樣本相關系數.【解題思路】計算出的值,將參考數據代入相關系數公式,求出的值,即可得出結論.【解答過程】由折線圖中數據和參考數據得,,,,所以.所以與的線性相關程度比較高.【變式4-3】(2022·高二課時練習)為調查野生動物保護地某種野生動物的數量,將保護地分成面積相近的300個地塊,并設計兩種抽樣方案.方案一:在該地區應用簡單隨機抽樣的方法抽取30個作為樣本區,依據抽樣數據計算得到相應的相關系數;方案二:在該地區應用分層抽樣的方法抽取30個作為樣本區,調查得到樣本數據,其中和分別表示第i個樣區的植物覆蓋面積(單位:公頃)和這種野生動物的數量,并計算得,,,,.(1)求該地區這種野生動物數量的估計值(這種野生動物數量的估計值等于樣區這種野生動物數量的平均數乘以地塊數);(2)求方案二抽取的樣本的相關系數r(精確到0.01),并判定哪種抽樣方法更能準確地估計這種野生動物的數量.附:若相關系數則相關性很強,的值越大相關性越強.【解題思路】(1)首先求出樣區野生動物平均數,然后利用所求平均數乘以該地區的地塊數即可求解;(2)根據所給數據以及相關系數公式即可求,然后與方案一的相關系數比較,并結合相關系數的意義即可求解.【解答過程】(1)由題意可得,樣區野生動物平均數為,又因為該地區的地塊數為300,所以該地區這種野生動物的估計值為.(2)由題中數據可得, 樣本的相關系數為.因為方案一的相關系數為,明顯小于方案二的相關系數,所以方案二的分層抽樣方法更能準確地估計.專題8.1 成對數據的統計相關性(重難點題型精講)1.變量的相關關系(1)函數關系函數關系是一種確定性關系,常用解析式來表示.(2)相關關系兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系.與函數關系不同,相關關系是一種非確定性關系.2.散點圖(1)散點圖成對樣本數據都可用直角坐標系中的點表示出來,由這些點組成的統計圖叫做散點圖.(2)正相關和負相關如果從整體上看,當一個變量的值增加時,另一個變量的相應值也呈現增加的趨勢,我們就稱這兩個變量正相關;如果當一個變量的值增加時,另一個變量的相應值呈現減少的趨勢,則稱這兩個變量負相關.3.線性相關一般地,如果兩個變量的取值呈現正相關或負相關,而且散點落在一條直線附近,則稱這兩個變量線性相關.4.樣本相關系數(1)對于變量x和變量y,設經過隨機抽樣獲得的成對樣本數據為(,),(,),,(,),利用相關系數r來衡量兩個變量之間線性關系的強弱,相關系數r的計算公式:(其中,,,和,,,的均值分別為和).①當r>0時,稱成對樣本數據正相關.這時,當其中一個數據的值變小時,另一個數據的值通常也變小;當其中一個數據的值變大時,另一個數據的值通常也變大.②當r<0時,稱成對樣本數據負相關.這時,當其中一個數據的值變小時,另一個數據的值通常會變大;當其中一個數據的值變大時,另一個數據的值通常會變小.【題型1 變量間的相關關系】【方法點撥】根據變量間的相關關系的定義,進行判斷求解即可.【例1】(2022春·四川成都·高二期中)下列兩個量之間的關系是相關關系的是( )A.勻速直線運動中時間與位移的關系 B.學生的成績和身高C.兒童的年齡與體重 D.物體的體積和質量【變式1-1】(2023·全國·高二專題練習)下列說法正確的是( )A.中的x,y是具有相關關系的兩個變量B.正四面體的體積與棱長具有相關關系C.電腦的銷售量與電腦的價格之間是一種確定性的關系D.傳染病醫院感染傳染病的醫務人員數與醫院收治的傳染病人數是具有相關關系的兩個變量【變式1-2】(2022春·安徽阜陽·高二階段練習)有幾組變量:①汽車的重量和汽車每消耗1升汽油所行駛的平均路程;②平均日學習時間和平均學習成績;③立方體的棱長和體積.其中兩個變量成正相關的是( )A.①③ B.②③C.② D.③【變式1-3】(2023·全國·高二專題練習)下列說法正確的是( )A.任何兩個變量都具有相關關系B.球的體積與該球的半徑具有相關關系C.農作物的產量與施化肥量之間是一種確定性關系D.一個學生的數學成績與物理成績之間是一種非確定性的關系【題型2 利用散點圖判斷相關性】【方法點撥】根據所給的散點圖,研究兩個變量之間的相關關系,進行求解即可.【例2】(2022·全國·高三專題練習)對變量、由觀測數據得散點圖,對變量、由觀測數據得散點圖.由這兩個散點圖可以判斷( )A.變量與負相關,與正相關B.變量與負相關,與負相關C.變量與正相關,與正相關D.變量與正相關,與負相關【變式2-1】(2022·高二課時練習)在下列各散點圖中,兩個變量具有正相關關系的是( )A. B.C. D.【變式2-2】(2022·重慶沙坪壩·模擬預測)某中學的興趣小組在某座山測得海拔高度 氣壓 沸點的六組數據,并繪制出如圖所示的散點圖,下列說法錯誤的是( )A.氣壓與海拔高度呈負相關 B.沸點與氣壓呈正相關C.沸點與海拔高度呈正相關 D.沸點與海拔高度的相關性很強【變式2-3】(2023·全國·高三專題練習)對四組數據進行統計,獲得以下散點圖,關于其相關系數的比較,正確的是( )A. B.C. D.【題型3 樣本相關系數的意義】【方法點撥】對于所給題目,根據樣本相關系數的定義和有關概念來進行判斷,即可得解.【例3】(2022秋·陜西榆林·高二期末)兩個變量與的回歸模型中,分別選擇了4個不同的模型,它們的相關系數如下表,其中擬合效果最好的模型是( )模型 模型1 模型2 模型3 模型4相關系數A.模型1 B.模型2 C.模型3 D.模型4【變式3-1】(2022春·山東臨沂·高二期末)對于樣本相關系數,下列說法錯誤的是( )A.樣本相關系數可以用來判斷成對樣本數據相關的正負性B.樣本相關系數可以是正的,也可以是負的C.樣本相關系數D.樣本相關系數越大,成對樣本數據的線性相關程度也越強【變式3-2】(2022·高二課時練習)下列有關樣本線性相關系數r的說法,錯誤的是( )A.相關系數r可用來衡量x與y之間的線性相關程度B.,且越接近0,相關程度越小C.,且越接近1,相關程度越大D.,且越接近1,相關程度越小【變式3-3】(2022春·江蘇無錫·高二期末)對于樣本相關系數r,下列說法不正確的是( )A.樣本相關系數r可以用來判斷成對數據相關的正負性B.樣本相關系數C.當時,表明成對樣本數據間沒有線性相關關系D.樣本相關系數r越大,成對樣本數據的線性相關程度也越強【題型4 樣本相關系數的應用】【方法點撥】樣本相關系數是對兩個變量相關程度進行定量刻畫,|r|越大,表明兩個變量之間的線性相關程度越強,運用樣本相關系數進行判斷的一般步驟如下:(1)整理數據,求出相關值;(2)計算樣本相關系數;(3)得出結論.【例4】(2022秋·陜西西安·高二階段練習)某沙漠地區經過治理,生態系統得到很大改善,野生動物數量有所增加.為調查該地區某種野生動物的數量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區,調查得到樣本數據(xi,yi)(i=1,2,…,20),其中xi和yi分別表示第i個樣區的植物覆蓋面積(單位:公頃)和這種野生動物的數量,并計算得,,,,.(1)求該地區這種野生動物數量的估計值(這種野生動物數量的估計值等于樣區這種野生動物數量的平均數乘以地塊數);(2)求樣本(xi,yi) (i=1,2,…,20)的相關系數(精確到0.01);(附:相關系數, )【變式4-1】(2022·全國·高三專題練習)某沙漠地區經過治理,生態系統得到很大改善,野生動物數量有所增加.為調查該地區某種野生動物的數量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區,調查得到樣本數據,其中和分別表示第個樣區的植物覆蓋面積(單位:公頃)和這種野生動物的數量(單位:頭),并計算得,,,,.(1)估計該地區這種野生動物的數量;(2)求樣本的相關系數.(精確到0.01)【變式4-2】(2022·高二課時練習)下圖是我國年至年生活垃圾無害化處理量(單位:億噸)的折線圖.(注:年份代碼分別對應年份.)由折線圖看出,可用線性回歸模型擬合與的關系.請求出相關系數,并用相關系數的大小說明與相關性的強弱.參考數據和公式:,,,樣本相關系數.【變式4-3】(2022·高二課時練習)為調查野生動物保護地某種野生動物的數量,將保護地分成面積相近的300個地塊,并設計兩種抽樣方案.方案一:在該地區應用簡單隨機抽樣的方法抽取30個作為樣本區,依據抽樣數據計算得到相應的相關系數;方案二:在該地區應用分層抽樣的方法抽取30個作為樣本區,調查得到樣本數據,其中和分別表示第i個樣區的植物覆蓋面積(單位:公頃)和這種野生動物的數量,并計算得,,,,.(1)求該地區這種野生動物數量的估計值(這種野生動物數量的估計值等于樣區這種野生動物數量的平均數乘以地塊數);(2)求方案二抽取的樣本的相關系數r(精確到0.01),并判定哪種抽樣方法更能準確地估計這種野生動物的數量.附:若相關系數則相關性很強,的值越大相關性越強. 展開更多...... 收起↑ 資源列表 高中數學培優講義練習(人教A版2019選擇性必修三)專題8.1 成對數據的統計相關性(重難點題型精講) Word版含解析.docx 高中數學培優講義練習(人教A版2019選擇性必修三)專題8.1 成對數據的統計相關性(重難點題型精講)(學生版).docx 縮略圖、資源來源于二一教育資源庫