中文字幕精品无码一区二区,成全视频在线播放观看方法,大伊人青草狠狠久久,亚洲一区影音先锋色资源

9.1.1變量的相關性-高二數學同步精品講義(含解析)(蘇教版2019選擇性必修第二冊)

資源下載
  1. 二一教育資源

9.1.1變量的相關性-高二數學同步精品講義(含解析)(蘇教版2019選擇性必修第二冊)

資源簡介

第九章 統計
9.1.1變量的相關性
課程標準 重難點
1.通過實例,能夠理解兩個變量的線性相關關系以及 正相關、負相關. 2.利用給出的數據會畫兩個變量的散點圖,通過散點 圖能夠判斷出兩個變量的相關性. 3.了解兩個隨機變量間的相關系數r,會利用公式求 相關系數r,并能利用相關系數r判斷兩個隨機變量間線性相關程度的強弱. 重點:借助概率分布直方圖的幾何直觀,了解正態分布的特征; 難點:正態分布的均值、標準差、方差及其含義.
知識點01 變量的相關關系
1.相關關系的概念∶我們所研究的很多問題中,兩個變量之間經常存在著相互影響、相互依賴的關系.這些關系常見的有兩類∶函數關系和相關關系.
[概念辨析]相關關系與函數關系的異同∶
異同點 關系 函數關系 相關關系
相同點 兩者均是兩個變量之間的關系
不同的 是一種確定性關系 是一種非確定性關系
是一種因果關系 不一定是因果關系,也可能是伴隨關系
是一種理想的關系 是更為一般的情況
2.散點圖
(1)概念∶一般地,如果收集到了變量x和變量y的n對數據(簡稱為成對數據),如下表所示:
序號i 1 2 3 ... n
變量x x1 x2 x3 ... xn
變量y y1 y2 y3 ... yn
則在平面直角坐標系xOy中描出點(xi,yi),i=1,2,3,…,n,就可以得到這n對數據的散點圖.
(2)作用∶散點圖展示了樣本點散布的位置.根據散點圖中點的分布趨勢分析兩個變量之間的關系,可直觀地判斷并得出結論.
注意:
(1)散點圖具有直觀、簡明的特點,我們可以根據散點圖來判斷兩個變量有沒有相關關系;
(2)通過散點圖不但可以判斷測量值的大小、變動范圍與整體趨勢,還可以通過觀察剔
除異常數值,提高估計相關程度的準確性;
(3)當所畫的散點圖的橫坐標與縱坐標所對應的數據差距很大時,可在實際作圖時,將
橫坐標與縱坐標取不同的單位長度,使畫出的散點圖形象、美觀.
3.正相關與負相關
(1)從整體上看,當一個變量的值增加時,另一個變量的相應值也呈現增加的趨勢,稱
這兩個變量正相關,散點圖如圖(甲)所示;
(2)從整體上看,當一個變量的值增加時,另一個變量的相應值呈現減少的趨勢,稱這
兩個變量負相關,散點圖如圖(乙)所示.
4. 線性相關與非線性相關∶
(1)線性相關∶如果兩個變量的取值呈現正相關或負相關,而且散點落在一條直線附近,稱這兩個變量線性相關
(2)非線性相關∶如果兩個變量具有相關性,但不是線性相關,就稱這兩個變量非線性相關或曲線相關.【即學即練1】下列語句所表示的事件中的因素不具有相關關系的是()
A. 瑞雪兆豐年B.上梁不正下梁歪C. 吸煙有害健康D.喜鵲叫喜,烏鴉叫喪
【即學即練2】(2023春·上海徐匯·高二統考階段練習)下列關于散點圖的說法中,正確的是( )
A.任意給定統計數據,都可以繪制散點圖 B.從散點圖中可以看出兩個量是否具有一定的關系
C.從散點圖中可以看出兩個量的因果關系 D.從散點圖中無法看出數據的分布情況
知識點02 相關系數
1.定義:統計學里,一般用來衡量y與x的線性相關性強弱,這里的r稱為線性相關系數(簡稱為相關系數).
2.性質:
可以證明,相關系數r具有以下性質∶
|r|≤1,且y與x正相關的充要條件是r>0,y與x負相關的充要條件是r<0;
(2)|r|越小,說明兩個變量之間的線性相關性越弱,也就是得出的回歸直線方程越沒有價值,即方程越不能反映真實的情況; | r|越大,說明兩個變量之間的線性相關性越強,也就是得出的回歸直線方程越有價值.
(3)|r| =1的充要條件是成對數據構成的點都在回歸直線上.
注意:(1)樣本的相關系數r可以定量地反映出變量間的相關程度,明確給出有無必要建立兩變量間的回歸方程;
(2)|r|很小只是說明兩個變量之間的線性相關程度弱,但不一定不相關.
【即學即練3】(多選)(2021春·河北衡水·高二校聯考階段練習)關于相關系數r,下面說法正確的是( )
A.
B.若,則兩個變量線性不相關
C.若,則一個變量增加,另一個變量有減少的趨勢
D.越小,變量之間的線性相關程度越高
【即學即練4】(2017春·天津紅橋·高二統考期中)關于相關系數,下列說法錯誤的是( )
A.當時,表明兩個變量正相關
B.當 時,表明兩個變量負相關
C.的絕對值大于時,認為兩個變量有很強的線性相關性
D.的絕對值越接近于1,表明兩個變量之間幾乎不存在線性相關關系
◆考點01 相關關系與函數關系的辨析
【典例1】(2023·全國·高二專題練習)下列說法正確的是( )
A.中的x,y是具有相關關系的兩個變量
B.正四面體的體積與棱長具有相關關系
C.電腦的銷售量與電腦的價格之間是一種確定性的關系
D.傳染病醫院感染傳染病的醫務人員數與醫院收治的傳染病人數是具有相關關系的兩個變量
【典例2】(多選)(2022·高二課時練習)下列關系中,屬于相關關系的是( ).
A.正方形的邊長與面積之間的關系
B.農作物的產量與施肥量之間的關系
C.出租車車費與行駛的里程之間的關系
D.降雪量與交通事故的發生率之間的關系
【典例3】(2022·高二課時練習)判斷下列變量間哪些能用函數模型刻畫,哪些能用回歸模型刻畫.
回歸模型:________;函數模型:________.
①某公司的銷售收入和廣告支出;
②某城市寫字樓的出租率和每平米月租金;
③航空公司的顧客投訴次數和航班正點率;
④某地區的人均消費水平和人均國內生產總值(GDP);
⑤學生期末考試成績和考前用于復習的時間;
⑥一輛汽車在某段路程中的行駛速度和行駛時間;
⑦正方形的面積與周長.
◆考點02 散點圖與相關性
【典例4】(2022春·陜西渭南·高一校考期末)下列四個圖中,兩個變量x,y具有線性相關關系的是( )
A.①② B.①②④ C.②③④ D.②④
【典例5】(2022·高二課時練習)給出成對值的數據如下:
1 2 4 8
3 5 9 17
則根據數據可以判斷和的關系是______.(填“確定關系”“相關關系”或“沒有關系”)
【典例6】(2022·高二課時練習)某商場五天內某種恤衫的銷售情況如下表:
第天
銷售量y(件)
則下列說法正確的是( )A.與負相關 B.與正相關
C.與不相關 D.與成正比例關系
◆考點03 正負相關的判斷
【典例7】(2023秋·四川成都·高二四川省成都市新都一中校聯考期末)以下兩個變量成負相關的是_____.
①學生的學籍號與學生的數學成績;
②堅持每天吃早餐的人數與患胃病的人數;
③氣溫與冷飲銷售量;
④電瓶車的重量和行駛每千米的耗電量.
【典例8】(2023·高二課時練習)對變量有觀測數據(),得表1;對變量 有觀測數據(),得表2.由這兩個表可以判斷:變量x與y______,變量u與v______.(填寫“正相關”或“負相關”)
表1
x 1 2 3 4 5
y 2.9 3.3 3.6 4.4 5.1
表2
u 1 2 3 4 5
v 25 20 21 15 13
【典例9】(2023秋·四川遂寧·高二遂寧中學校考期末)如圖,是對某位同學一學期次體育測試成績(單位:分)進行統計得到的散點圖,關于這位同學的成績分析,下列結論錯誤的是( )
A.該同學的體育測試成績總的趨勢是在逐步提高,且次測試成績的極差超過分
B.該同學次測試成績的眾數是分
C.該同學次測試成績的中位數是分
D.該同學次測試成績與測試次數具有相關性,且呈正相關
◆考點04 線性相關的強弱
【典例10】(2022·全國·高三專題練習)對于,兩變量,有四組樣本數據,分別算出它們的線性相關系數(如下),則線性相關性最強的是( )
A.-0.82 B.0.78 C.-0.69 D.0.87
【典例11】(2023·全國·高二專題練習)已知四組不同數據的兩變量的線性相關系數如下:數據組①的相關系數;數據組②的相關系數;數據組③的相關系數;數據組④的相關系數.則下列說法正確的是( )
A.數據組①對應的數據點都在同一直線上
B.數據組②中的兩變量線性相關性最強
C.數據組③中的兩變量線性相關性最強
D.數據組④中的兩變量線性相關性最弱
【典例12】(多選)(2023·全國·高二專題練習)某校高三1班48名物理方向的學生在一次質量檢測中,語文成績、數學成績與六科總成績在全年級中的排名情況如下圖所示,“”表示的是該班甲、乙、丙三位同學對應的點.從這次考試的成績看,下列結論正確的是( )
A.該班六科總成績排名前6的同學語文成績比數學成績排名更好
B.在語文和數學兩個科目中,丙同學的成績名次更靠前的科目是語文
C.數學成績與六科總成績的相關性比語文成績與六科總成績的相關性更強
D.在甲、乙兩人中,其語文成績名次比其六科總成績名次靠前的學生是甲
◆考點05 成對數據相關系數的計算
【典例13】(2022·全國·高三專題練習)某種機械設備隨著使用年限的增加,它的使用功能逐漸減退,使用價值逐年減少,通常把它使用價值逐年減少的“量”換算成費用,稱之為“失效費”.某種機械設備的使用年限x(單位:年)與失效費y(單位:萬元)的統計數據如下表所示:
使用年限x(單位:年) 1 2 3 4 5 6 7
失效費y(單位:萬元) 2.90 3.30 3.60 4.40 4.80 5.20 5.90
由上表數據可知,y與x的相關系數為______.
(精確到0.01,參考公式和數據:,,,)
【典例14】(2022·高二課時練習)有人收集了某城市居民年收入(所有居民在一年內收入的總和)與A商品銷售額的10年數據,如表所示.
第n年 1 2 3 4 5 6 7 8 9 10
居民年收入(億元) 32.2 31.1 32.9 35.8 37.1 38 39 43 44.6 46
A商品銷售額(萬元) 25.0 30.0 34.0 37.0 39.0 41.0 42.0 44.0 48.0 51.0
畫出散點圖,判斷成對樣本數據是否線性相關,并通過樣本相關系數推斷居民年收入與A商品銷售額的相關程度和變化趨勢的異同.
參考數據:,,,,.
【典例15】(2023·全國·高二專題練習)樣本相關系數
(1)設由變量x和y獲得的兩組數據分別為和(i=1,2,…,n),其對應關系如下表所示:
變量x …
變量y …
兩組數據和的__________是度量兩個變量x與y之間線性相關程度的統計量,其計算公式為,其中,,,它們分別是這兩組數據的算術平均數.
(2)相關系數r的性質:
①當時,稱成對樣本數據______相關;
當時,成對樣本數據______相關;
當時,成對樣本數據間沒有線性相關關系;
②樣本相關系數r的取值范圍為______;
當越接近1時,成對樣本數據的線性相關程度越______;
當越接近0時,成對樣本數據的線性相關程度越______.
◆考點06 相關系數的實際應用
【典例16】(2023·全國·高二專題練習)某學校組織學生觀看了“天宮課堂”第二課的直播后,極大地激發了學生學習科學知識的興趣,提高了學生學習的積極性,特別是對實驗操作的研究與探究.現有某化學興趣小組的同學在老師的指導下,開展了某項化學實驗操作,為了解實驗效度與實驗中原料的消耗量(單位:)的關系,該校實驗員隨機選取了10個小組的實驗數據如下表.
小組編號 1 2 3 4 5 6 7 8 9 10 總計
實驗效度 6
原料的消耗量 15
并計算得.
(1)求這10個小組的實驗效度與實驗中原料的消耗量的平均值;
(2)求這10個小組的實驗效度與實驗中原料的消耗量的相關系數(精確到);
(3)經該校實驗員統計,以往一個學年各種實驗中需用到原料的實驗有200次左右.假設在一定的范圍內,每次實驗中原料的消耗量與實驗效度近似成正比,其比例系數可近似為樣本中相應的平均值的比值.根據要求,實驗效度平均值需達到.請根據上述數據信息,估計該校本學年原料的消耗量.
附:相關系數
【典例17】(2022秋·陜西西安·高二陜西師大附中校考階段練習)某沙漠地區經過治理,生態系統得到很大改善,野生動物數量有所增加.為調查該地區某種野生動物的數量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區,調查得到樣本數據(xi,yi)(i=1,2,…,20),其中xi和yi分別表示第i個樣區的植物覆蓋面積(單位:公頃)和這種野生動物的數量,并計算得,,,,.
(1)求該地區這種野生動物數量的估計值(這種野生動物數量的估計值等于樣區這種野生動物數量的平均數乘以地塊數);
(2)求樣本(xi,yi) (i=1,2,…,20)的相關系數(精確到0.01);(附:相關系數, )
【典例18】(2022·全國·高三專題練習)某沙漠地區經過治理,生態系統得到很大改善,野生動物數量有所增加.為調查該地區某種野生動物的數量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區,調查得到樣本數據,其中和分別表示第個樣區的植物覆蓋面積(單位:公頃)和這種野生動物的數量(單位:頭),并計算得,,,,.
(1)估計該地區這種野生動物的數量;
(2)求樣本的相關系數.(精確到0.01)
題組A 基礎過關練
一、單選題
1.(2023·全國·高二專題練習)經濟學專業的學生們為研究流通費率y和銷售額x(單位:千萬元)的關系,對同類型10家企業的相關數據()進行整理,并得到如下散點圖:
由此散點圖,在2千萬元至1億元之間,下面四個回歸方程類型中最適宜作為流通費率y和銷售額x的回歸方程類型的是( )
A. B.
C. D.
2.(2023秋·上海浦東新·高二統考期末)小明同學每天閱讀數學文化相關的書籍,他每天閱讀的頁數分別為:4、5、4.5、5、6、8、7、5、4.5、6(單位:頁).下列圖形中不利于描述這些數據的是(  )
A.條形圖 B.莖葉圖 C.散點圖 D.扇形圖
3.(2023·全國·高二專題練習)如圖是近十年來全國城鎮人口、鄉村人口的折線圖(數據來自國家統計局).
根據該折線圖,下列說法錯誤的是( )
A.城鎮人口與年份呈現正相關 B.鄉村人口與年份的相關系數接近
C.城鎮人口逐年增長率大致相同 D.可預測鄉村人口仍呈現下降趨勢
4.(2022·高二課時練習)下面各圖中,散點圖與相關系數r不符合的有( )
A. B.
C. D.
5.(2022·高二課時練習)下列變量之間的關系是相關關系的是(  )
A.正方體的表面積與體積
B.光照時間與果樹的產量
C.勻速行駛車輛的行駛距離與時間
D.某運動會中某代表團的足球隊的比賽成績與乒乓球隊的比賽成績
6.(2022·高二課時練習)變量X與Y相對應的一組數據為,,,,;變量U與V相對應的一組數據為,,,,.記為變量X與Y之間的相關系數.為變量U與V之間的相關系數,則( )
A. B. C. D.
二、多選題
7.(2022·高二課時練習)下列變量間可能用直線擬合的是( )
A.光照時間與大棚內蔬菜的產量 B.某正方形的邊長與此正方形的面積
C.舉重運動員所能舉起的最大重量與他的體重 D.某人的身高與視力
8.(2022春·新疆塔城·高一沙灣縣第一中學校考期末)某市氣象部門根據2020年各月的每天最高氣溫與最低氣溫的平均數據,繪制如下折線圖,那么下列敘述正確的是( )
A.各月的每天最高氣溫平均值與最低氣溫平均值總體呈正相關
B.從2020年1月至8月該市每天最高氣溫平均值與最低氣溫平均值一直在上升
C.全年中各月最高氣溫平均值不低于25℃的月份有5個
D.全年中,2月份的最高氣溫平均值與最低氣溫平均值的差值最大
三、填空題
9.(2022·高二單元測試)若線性回歸方程中的回歸系數,則相關系數______.
10.(2022·高二課時練習)對于相關系數r,下列說法中錯誤的是________.
①r越大,線性相關程度越強;
②越小,線性相關程度越強;
③越大,線性相關程度越弱,越小,線性相關程度越強;
④,且越接近1,線性相關程度越強,越接近0,線性相關程度越弱.
11.(2022春·河南信陽·高二統考期末)若一組觀測值,,…,()對應的點位于同一直線上,則x,y的相關系數為______.
12.(2022春·江蘇南通·高二海門中學校考階段練習)以模型去擬合一組數據時,已知如下數據:,則實數k的值為_______.
四、解答題
13.(2021春·陜西延安·高二子長市中學校考期末)某電器公司的市場研究人員為了解公司的經營狀況,對該公司最近六個月內的市場占有率進行了統計,結果如下表所示:
月份 1月 2月 3月 4月 5月 6月
月份代碼 1 2 3 4 5 6
市場占有率(%) 11 13 16 15 20 21
(1)用相關系數說明市場占有率與月份代碼之間的關系是否可用線性回歸模型擬合?(結果保留兩位小數)
(2)求關于的線性回歸方程,并預測該公司10月份的市場占有率.
參考數據:,,,.
參考公式:相關系數,線性回歸方程的斜率和截距的最小二乘法估計分別為,.
14.(2021春·陜西渭南·高二統考期末)某高中生參加社會實踐活動,對某公司1月份至5月份銷售的某種配件的銷售量及銷售單價進行了調查,銷售單價和銷售量之間的一組數據如下表所示:
月份 1 2 3 4 5
銷售單價元 9 9.5 10 10.5 11
銷售量件 11 10 8 6 5
(1)由上表數據知,可用線性回歸模型擬合與的關系,請用相關系數加以說明;(精確到0.01)
(2)求出關于的線性回歸方程;
(3)預計在今后的銷售中,銷售量與銷售單價仍然服從(2)中的關系,如果該種配件的成本是2.5元/件,那么該種配件的銷售單價應定為多少元才能獲得最大利潤?(注:利潤銷售收入成本)
參考公式:相關系數,線性回歸方程的斜率和截距的最小二乘法估計分別為.
參考數據:
題組B 能力提升練
一、單選題
1.(2023·全國·高三專題練習)在研究急剎車的停車距離問題時,通常假定停車距離等于反應距離(,單位:m)與制動距離(,單位:m)之和.如圖為某實驗所測得的數據,其中“KPH”表示剎車時汽車的初速度(單位:km/h).根據實驗數據可以推測,下面四組函數中最適合描述,與的函數關系的是( )
A., B.,
C., D.,
2.(2022春·上海浦東新·高二上海南匯中學校考期末)要判斷成對數據的線性相關程度的強弱,可以通過比較它們的樣本相關系數r的大小,以下是四組數據的相關系數的值,則線性相關最強的是( )
A. B.
C. D.
3.(2022·全國·高三專題練習)給出下列說法:①回歸直線恒過樣本點的中心,且至少過一個樣本點;②兩個變量相關性越強,則相關系數就越接近1;③將一組數據的每個數據都加一個相同的常數后,方差不變;④在回歸直線方程中,當解釋變量增加一個單位時,預報變量平均減少0.5個單位.其中說法正確的是( )
A.①②④ B.②③④ C.①③④ D.②④
4.(2022春·江西贛州·高二校聯考期中)下列說法:①命題“,若,則”是真命題:②以模型去擬合一組數據時,為了求出回歸方程,設﹐將其變換后得到線性方程,則c,k的值分別是和0.3:③已知是雙曲線的一個焦點,則點F到雙曲線E的漸近線的距離等于b.正確的個數是( )
A.0 B.1 C.2 D.3
5.(2022春·河南南陽·高二校考階段練習)袁隆平院士是我國的雜交水稻之父,他一生致力于雜交水稻的研究,為解決中國人民的溫飽和保障國家糧食安全做出了重大的貢獻.某雜交水稻研究小組先培育出第一代雜交水稻,再由第一代培育出第二代,第二代培育出第三代,以此類推.已知第一代至第四代雜交水稻的每穗總粒數分別為197粒,193粒,201粒,209粒,且親代與子代的每穗總粒數成線性相關.根據以上信息,預測第五代雜交水稻每穗的總粒數為( )
(注:①親代是產生后一代生物的生物,對后代生物來說是親代,所產生的后一代叫子代:②,)
A.211 B.212 C.213 D.214
6.(2022·高二課時練習)已知r1表示變量X與Y之間的線性相關系數,r2表示變量U與V之間的線性相關系數,且r1=0.837,r2=﹣0.957,則( )
A.變量X與Y之間呈正相關關系,且X與Y之間的相關性強于U與V之間的相關性
B.變量X與Y之間呈負相關關系,且X與Y之間的相關性強于U與V之間的相關性
C.變量U與V之間呈負相關關系,且X與Y之間的相關性弱于U與V之間的相關性
D.變量U與V之間呈正相關關系,且X與Y之間的相關性弱于U與V之間的相關性
二、多選題
7.(2023·重慶·統考模擬預測)下列命題中正確的是( ).
A.一組從小到大排列的數據0,1,3,4,6,7,9,x,11,11,去掉x與不去掉x,它們的80%分位數都不變,則
B.兩組數據,,,…,與,,,…,,設它們的平均值分別為與,將它們合并在一起,則總體的平均值為
C.已知離散型隨機變量,則
D.線性回歸模型中,相關系數r的值越大,則這兩個變量線性相關性越強
8.(2022·高二單元測試)四對變量與進行線性相關檢驗,已知是觀測值組數,是相關系數,則變量和具有線性相關關系的是( ).
相關系數的臨界值表
A.、 B.、
C.、 D.、
9.(2022·高二課時練習)已知與之間的四組數據如下表:
2 3 4 5
1.5 3.5
上表數據中的平均值為,若某同學對賦了兩個值,分別為,,得到兩條回歸直線的方程分別為,,對應的相關系數分別為,,則( )A.兩條回歸直線的交點為 B.
C. D.
三、填空題
10.(2022·全國·高三專題練習)某品牌餐飲公司準備在10個規模相當的地區開設加盟店,為合理安排各地區加盟店的個數,先在其中5個地區進行試點,得到試點地區加盟店個數x及單店日平均營業額y(萬元)的::數據如下:
x 1 2 3 4 5
y 10.9 10.2 9.0 7.8 7.1
根據上表可得y關于x線性相關,為保證規模和效益,該公司要求在其他5個地區需滿足同一地區所有加盟店的日平均營業額預計值總和不低于35萬元,則一個地區開設的加盟店個數m的所有可能取值為______.(參考數據:,)
11.(2021春·陜西咸陽·高二武功縣普集高級中學校考階段練習)下列說法:
①線性回歸方程必過;
②命題“”的否定是“”
③相關系數越小,表明兩個變量相關性越弱;
④在一個列聯表中,由計算得,則有的把握認為這兩個變量間有關系;
其中正確的說法是__________.(把你認為正確的結論都寫在橫線上)
本題可參考獨立性檢驗臨界值表:
四、解答題
12.(2023·陜西安康·統考二模)某公司進行工資改革,將工作效率作為工資定檔的一個重要標準,大大提高了員工的工作積極性,但也引起了一些老員工的不滿.為了調查員工的工資與工齡的情況,人力資源部隨機從公司的技術研發部門中抽取了16名員工了解情況,結果如下:
工齡(年): 1 2 3 4 5 6 7 8
年薪(萬): 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
工齡(年): 9 10 11 12 13 14 15 16
年薪(萬): 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
經計算得,,,,其中表示工齡為年的年薪,.
(1)求年薪與工齡的相關系數,并回答是否可以認為年薪與工齡具有線性相關關系(若,則可以認為年薪與工齡不具有線性相關關系).
(2)在抽取的16名員工中,如果年薪都在之內,則繼續推進工資改革,同時給每位老員工相應的補貼,如果有員工年薪在之外,該員工會被人力資源部約談并進行崗位調整,且需要重新計算原抽取的16名員工中留下的員工年薪的均值和標準差,由于人力資源部需要安撫老員工的情緒,工作繁重,現請你幫忙計算留下的員工年薪的均值和標準差.(精確到0.01)
附:樣本的相關系數,,,,.
13.(2022春·重慶沙坪壩·高二重慶八中校考期末)有一個開房門的游戲,其玩法為:
盒中先放入兩把鑰匙和兩把鑰匙,能夠打開房門,不能打開房門.
每次從盒中隨機取一把試開,試開后不放回鑰匙.第一次打開房門后,關上門繼續試開,第二次打開房門后停止抽取,稱為進行了一輪游戲.
若每一輪取鑰匙不超過三次,則該輪“成功”,否則為“失敗”,如果某一輪“成功”,則游戲終止;若“失敗”,則將所有鑰匙重新放入盒中,并再放入一把鑰匙,繼續下一輪抽取,直至“成功”.
(1)有名愛好者獨立參與這個游戲,記表示“成功”時抽取鑰匙的輪次數,表示對應的人數,部分統計數據如下表:
若將作為關于的經驗回歸方程,估計抽取輪才“成功”的人數(人數精確到個位);
(2)由于時間關系,規定:進行游戲時,最多進行三輪,若均未“成功”也要終止游戲.求游戲要進行三輪的概率.
參考公式:最小二乘估計,.
參考數據:取,,其中,.
題組C 培優拔尖練
1.(2022·全國·高三專題練習)近年來,“共享汽車”在我國各城市迅猛發展,為人們的出行提供了便利,但也給城市交通管理帶來了一些困難.為了解“共享汽車”在M省的發展情況,M省某調查機構從該省隨機拍取了5個城市,分別收集和分析了“共享汽車”的A,B,C三項指標數據,, ,數據如下表所示;
城市編號i 1 2 3 4 5
A指標 4 6 2 8 5
B指標 4 4 3 5 4
C指標 3 6 2 5 4
(1)分別求y與x之間的相關系數及z與x之間的相關系數,并比較y與x,z與x之間相關性的強弱;
(2)利用向量夾角來分析y與x之間及z與x之間的相關關系.
附:相關系數.
參考數據:,,,
,,,.
2.(2023·全國·高三專題練習)在某生態系統中,有甲、乙兩個種群,兩種群之間為競爭關系.設t時刻甲、乙種群的數量分別為,(起始時刻為).由數學家Lotka和Volterra提出的模型是函數,滿足方程,,其中a,b,c,d均為非負實數.
(1)下圖為沒有乙種群時,一段時間內甲種群數量與時間的關系折線圖.為預測甲種群的數量變化趨勢,研究人員提出了兩種可能的數學模型:①;②,其中m,n均為大于1的正數.根據折線圖判斷,應選用哪種模型進行預測,并說明理由.
(2)設,.
①函數的單調性;
②根據①中的結論說明:在絕大多數情況下,經過充分長的時間后,或者甲種群滅絕,或者乙種群滅絕.
注:在題設條件下,各種群數量均有上限值.
第九章 統計
9.1.1變量的相關性
課程標準 重難點
1.通過實例,能夠理解兩個變量的線性相關關系以及 正相關、負相關. 2.利用給出的數據會畫兩個變量的散點圖,通過散點 圖能夠判斷出兩個變量的相關性. 3.了解兩個隨機變量間的相關系數r,會利用公式求 相關系數r,并能利用相關系數r判斷兩個隨機變量間線性相關程度的強弱. 重點:借助概率分布直方圖的幾何直觀,了解正態分布的特征; 難點:正態分布的均值、標準差、方差及其含義.
知識點01 變量的相關關系
1.相關關系的概念∶我們所研究的很多問題中,兩個變量之間經常存在著相互影響、相互依賴的關系.這些關系常見的有兩類∶函數關系和相關關系.
[概念辨析]相關關系與函數關系的異同∶
異同點 關系 函數關系 相關關系
相同點 兩者均是兩個變量之間的關系
不同的 是一種確定性關系 是一種非確定性關系
是一種因果關系 不一定是因果關系,也可能是伴隨關系
是一種理想的關系 是更為一般的情況
2.散點圖
(1)概念∶一般地,如果收集到了變量x和變量y的n對數據(簡稱為成對數據),如下表所示:
序號i 1 2 3 ... n
變量x x1 x2 x3 ... xn
變量y y1 y2 y3 ... yn
則在平面直角坐標系xOy中描出點(xi,yi),i=1,2,3,…,n,就可以得到這n對數據的散點圖.
(2)作用∶散點圖展示了樣本點散布的位置.根據散點圖中點的分布趨勢分析兩個變量之間的關系,可直觀地判斷并得出結論.
注意:
(1)散點圖具有直觀、簡明的特點,我們可以根據散點圖來判斷兩個變量有沒有相關關系;
(2)通過散點圖不但可以判斷測量值的大小、變動范圍與整體趨勢,還可以通過觀察剔
除異常數值,提高估計相關程度的準確性;
(3)當所畫的散點圖的橫坐標與縱坐標所對應的數據差距很大時,可在實際作圖時,將
橫坐標與縱坐標取不同的單位長度,使畫出的散點圖形象、美觀.
3.正相關與負相關
(1)從整體上看,當一個變量的值增加時,另一個變量的相應值也呈現增加的趨勢,稱
這兩個變量正相關,散點圖如圖(甲)所示;
(2)從整體上看,當一個變量的值增加時,另一個變量的相應值呈現減少的趨勢,稱這
兩個變量負相關,散點圖如圖(乙)所示.
4. 線性相關與非線性相關∶
(1)線性相關∶如果兩個變量的取值呈現正相關或負相關,而且散點落在一條直線附近,稱這兩個變量線性相關
(2)非線性相關∶如果兩個變量具有相關性,但不是線性相關,就稱這兩個變量非線性相關或曲線相關.【即學即練1】下列語句所表示的事件中的因素不具有相關關系的是()
A. 瑞雪兆豐年B.上梁不正下梁歪C. 吸煙有害健康D.喜鵲叫喜,烏鴉叫喪
【解析】D .選項A,B,C中描述的變量間都具有相關關系,而選項D是迷信說法,沒有科學依據.
【即學即練2】(2023春·上海徐匯·高二統考階段練習)下列關于散點圖的說法中,正確的是( )
A.任意給定統計數據,都可以繪制散點圖 B.從散點圖中可以看出兩個量是否具有一定的關系
C.從散點圖中可以看出兩個量的因果關系 D.從散點圖中無法看出數據的分布情況
【答案】B
【分析】根據散點圖的概念判斷即可.
【詳解】散點圖不適合用于展示百分比占比的數據,另外數據量較少的數據也不適合用散點圖表示,故A錯誤;
散點圖能看出兩個量是否具有一定關系,但是并一定是因果關系,故B正確,C錯誤;
散點圖中能看出數據的分布情況,故D錯誤.
故選:B
知識點02 相關系數
1.定義:統計學里,一般用來衡量y與x的線性相關性強弱,這里的r稱為線性相關系數(簡稱為相關系數).
2.性質:
可以證明,相關系數r具有以下性質∶
|r|≤1,且y與x正相關的充要條件是r>0,y與x負相關的充要條件是r<0;
(2)|r|越小,說明兩個變量之間的線性相關性越弱,也就是得出的回歸直線方程越沒有價值,即方程越不能反映真實的情況; | r|越大,說明兩個變量之間的線性相關性越強,也就是得出的回歸直線方程越有價值.
(3)|r| =1的充要條件是成對數據構成的點都在回歸直線上.
注意:(1)樣本的相關系數r可以定量地反映出變量間的相關程度,明確給出有無必要建立兩變量間的回歸方程;
(2)|r|很小只是說明兩個變量之間的線性相關程度弱,但不一定不相關.
【即學即練3】(多選)(2021春·河北衡水·高二校聯考階段練習)關于相關系數r,下面說法正確的是( )
A.
B.若,則兩個變量線性不相關
C.若,則一個變量增加,另一個變量有減少的趨勢
D.越小,變量之間的線性相關程度越高
【答案】ABC
【分析】根據相關系數的定義以及性質即可求解.
【詳解】,故A正確,若,則兩個變量線性不相關,故B正確,若,則一個變量增加,另一個變量有減少的趨勢,C正確,越大,變量之間的線性相關程度越高,故D錯誤,
故選:ABC
【即學即練4】(2017春·天津紅橋·高二統考期中)關于相關系數,下列說法錯誤的是( )
A.當時,表明兩個變量正相關
B.當 時,表明兩個變量負相關
C.的絕對值大于時,認為兩個變量有很強的線性相關性
D.的絕對值越接近于1,表明兩個變量之間幾乎不存在線性相關關系
【答案】D
【分析】根據相關系數的含義,逐項判定,即可求解.
【詳解】根據相關系數的含義,可得當時,表明兩個變量正相關;當 時,表明兩個變量負相關,的絕對值大于時,認為兩個變量有很強的線性相關性;當的絕對值越接近于1時,兩個變量的相關系越強,所以A、B、C正確,D錯誤.
故選:D.
◆考點01 相關關系與函數關系的辨析
【典例1】(2023·全國·高二專題練習)下列說法正確的是( )
A.中的x,y是具有相關關系的兩個變量
B.正四面體的體積與棱長具有相關關系
C.電腦的銷售量與電腦的價格之間是一種確定性的關系
D.傳染病醫院感染傳染病的醫務人員數與醫院收治的傳染病人數是具有相關關系的兩個變量
【答案】D
【分析】根據相關關系的定義、函數的定義即可判斷
【詳解】A,B均為函數關系,故A、B錯誤;C,D為相關關系,故C錯,D對.
故選:D
【典例2】(多選)(2022·高二課時練習)下列關系中,屬于相關關系的是( ).
A.正方形的邊長與面積之間的關系
B.農作物的產量與施肥量之間的關系
C.出租車車費與行駛的里程之間的關系
D.降雪量與交通事故的發生率之間的關系
【答案】BD
【分析】根據相關關系的概念逐項分析可得答案.
【詳解】A中,正方形的邊長與面積之間的關系是函數關系;
B中,農作物的產量與施肥量之間不具有嚴格的函數關系,但具有相關關系;
C中,出租車車費與行駛的里程之間的關系為確定的函數關系;
D中,降雪量與交通事故的發生率之間具有相關關系.
故選:BD.
【典例3】(2022·高二課時練習)判斷下列變量間哪些能用函數模型刻畫,哪些能用回歸模型刻畫.
回歸模型:________;函數模型:________.
①某公司的銷售收入和廣告支出;
②某城市寫字樓的出租率和每平米月租金;
③航空公司的顧客投訴次數和航班正點率;
④某地區的人均消費水平和人均國內生產總值(GDP);
⑤學生期末考試成績和考前用于復習的時間;
⑥一輛汽車在某段路程中的行駛速度和行駛時間;
⑦正方形的面積與周長.
【答案】 ①②③④⑤ ⑥⑦
【分析】利用回歸模型與函數模型的定義依次分析即可.
【詳解】對于①,銷售收入雖然跟廣告支出有關,但并不是廣告打得多就對銷售得多,還得看產品質量等其他因素,故其為回歸模型;
對于②,某城市寫字樓的出租率和每平米月租金有關,但寫字樓的出租率還跟租戶的收入、寫字樓的地理位置等因素有關,故其為回歸模型;
對于③,航空公司的顧客投訴次數和航班正點率有關,但航班正點率還跟天氣等因素有關,故其為回歸模型;
對于④,某地區的人均消費水平和人均國內生產總值(GDP)有關,但同樣的GDP,一線城市與十八線城市的人均消費顯然是不一樣的,故其為回歸模型;
對于⑤,學生期末考試成績和考前用于復習的時間有關,但顯然跟學生原本的知識基礎、智商水平等因素有關,故其為回歸模型;
對于⑥,一輛汽車在某段路程中的行駛速度和行駛時間,由可知其為函數模型;
對于⑦,正方形的面積為,周長為,故,故其為函數模型.
故答案為:①②③④⑤;⑥⑦
◆考點02 散點圖與相關性
【典例4】(2022春·陜西渭南·高一校考期末)下列四個圖中,兩個變量x,y具有線性相關關系的是( )
A.①② B.①②④ C.②③④ D.②④
【答案】D
【分析】當散點圖中的點集中在一條直線的附近時,說明兩個變量具有線性相關關系,由此進行判斷即可
【詳解】由圖可知,②④中的點集中在一條直線的附近,所以圖②④中的兩個變量具有線性相關關系,
故選:D.
【典例5】(2022·高二課時練習)給出成對值的數據如下:
1 2 4 8
3 5 9 17
則根據數據可以判斷和的關系是______.(填“確定關系”“相關關系”或“沒有關系”)
【答案】確定關系
【分析】根據兩個變量的相關關系的概念分析可得答案.
【詳解】由題表中數據可以得到x,y之間是一種函數關系,函數解析式為,
所以x,y之間是一種確定的關系,即函數關系.
故答案為:確定關系.
【典例6】(2022·高二課時練習)某商場五天內某種恤衫的銷售情況如下表:
第天
銷售量y(件)
則下列說法正確的是( )A.與負相關 B.與正相關
C.與不相關 D.與成正比例關系
【答案】B
【分析】作出散點圖,可得出結論.
【詳解】根據表格中的數據作出散點圖如圖,
可知所有點都在一條直線附近波動,是線性相關的,且值隨著值的增大而增大,即與正相關,
故選:B.
◆考點03 正負相關的判斷
【典例7】(2023秋·四川成都·高二四川省成都市新都一中校聯考期末)以下兩個變量成負相關的是_____.
①學生的學籍號與學生的數學成績;
②堅持每天吃早餐的人數與患胃病的人數;
③氣溫與冷飲銷售量;
④電瓶車的重量和行駛每千米的耗電量.
【答案】②
【分析】根據相關關系的知識確定正確答案.
【詳解】①無相關關系;②負相關;③④正相關.
故答案為:②
【典例8】(2023·高二課時練習)對變量有觀測數據(),得表1;對變量 有觀測數據(),得表2.由這兩個表可以判斷:變量x與y______,變量u與v______.(填寫“正相關”或“負相關”)
表1
x 1 2 3 4 5
y 2.9 3.3 3.6 4.4 5.1
表2
u 1 2 3 4 5
v 25 20 21 15 13
【答案】 正相關 負相關
【分析】根據圖表判斷變量之間的變化關系,即可判斷兩變量間的“正相關”或“負相關”關系.
【詳解】由圖表可知隨著x的增大,相應的y值也增大,其散點圖將呈上升趨勢,故變量正相關,
隨著的增大,相應的值整體上是減小的,其散點圖將呈下降趨勢,故變量負相關,
故答案為:正相關;負相關
【典例9】(2023秋·四川遂寧·高二遂寧中學校考期末)如圖,是對某位同學一學期次體育測試成績(單位:分)進行統計得到的散點圖,關于這位同學的成績分析,下列結論錯誤的是( )
A.該同學的體育測試成績總的趨勢是在逐步提高,且次測試成績的極差超過分
B.該同學次測試成績的眾數是分
C.該同學次測試成績的中位數是分
D.該同學次測試成績與測試次數具有相關性,且呈正相關
【答案】C
【分析】根據給定的散點圖,逐一分析各個選項即可判斷作答.
【詳解】對于A,由散點圖知,8次測試成績總體是依次增大,極差為,A正確;
對于B,散點圖中8個數據的眾數是48,B正確;
對于C,散點圖中的8個數由小到大排列,最中間兩個數都是48,則次測試成績的中位數是分,C不正確;
對于D,散點圖中8個點落在某條斜向上的直線附近,則次測試成績與測試次數具有相關性,且呈正相關,D正確.
故選:C
◆考點04 線性相關的強弱
【典例10】(2022·全國·高三專題練習)對于,兩變量,有四組樣本數據,分別算出它們的線性相關系數(如下),則線性相關性最強的是( )
A.-0.82 B.0.78 C.-0.69 D.0.87
【答案】D
【分析】根據相關系數與變量間相關性的關系,即可得答案.
【詳解】由相關系數的絕對值越大,變量間的線性相關性越強知:各選項中的絕對值最大.
故選:D
【典例11】(2023·全國·高二專題練習)已知四組不同數據的兩變量的線性相關系數如下:數據組①的相關系數;數據組②的相關系數;數據組③的相關系數;數據組④的相關系數.則下列說法正確的是( )
A.數據組①對應的數據點都在同一直線上
B.數據組②中的兩變量線性相關性最強
C.數據組③中的兩變量線性相關性最強
D.數據組④中的兩變量線性相關性最弱
【答案】B
【分析】根據線性相關系數的性質逐個判斷即可
【詳解】對A,數據組①的相關系數,故數據組①對應的數據點無線性關系,故A錯誤;
對BC,數據組②的相關系數為4組中絕對值的最大值,故數據組②中的兩變量線性相關性最強,故B正確,C錯誤;
對D,數據組①的相關系數為4組中絕對值最小,故數據組①中的兩變量線性相關性最弱,故D錯誤
故選:B
【典例12】(多選)(2023·全國·高二專題練習)某校高三1班48名物理方向的學生在一次質量檢測中,語文成績、數學成績與六科總成績在全年級中的排名情況如下圖所示,“”表示的是該班甲、乙、丙三位同學對應的點.從這次考試的成績看,下列結論正確的是( )
A.該班六科總成績排名前6的同學語文成績比數學成績排名更好
B.在語文和數學兩個科目中,丙同學的成績名次更靠前的科目是語文
C.數學成績與六科總成績的相關性比語文成績與六科總成績的相關性更強
D.在甲、乙兩人中,其語文成績名次比其六科總成績名次靠前的學生是甲
【答案】BCD
【分析】結合圖形可分析出答案.
【詳解】由圖可得,該班六科總成績排名前6的同學數學成績比語文成績排名更好,故A錯誤;
由右圖可得丙同學的總成績排在班上倒數第三名,其語文成績排在250到300名之間,
從左圖可得其數學成績排在400名左右,故B正確;
數學成績與六科總成績的相關性比語文成績與六科總成績的相關性更強,因為右圖的點的分布較左圖更分散,故C正確;
由左圖可得甲的總成績排在班上第7名,年級名次100多一點,
對應到右圖可得,其語文成績排在年級近100名,故甲的語文成績名次比其六科總成績名次靠前,
由左圖可得甲的總成績排在班上第27名,年級名次接近250名,
對應到右圖可得,其語文成績排在年級250名之后,故乙的語文成績名次比其六科總成績名次靠后,故D正確;
故選:BCD
◆考點05 成對數據相關系數的計算
【典例13】(2022·全國·高三專題練習)某種機械設備隨著使用年限的增加,它的使用功能逐漸減退,使用價值逐年減少,通常把它使用價值逐年減少的“量”換算成費用,稱之為“失效費”.某種機械設備的使用年限x(單位:年)與失效費y(單位:萬元)的統計數據如下表所示:
使用年限x(單位:年) 1 2 3 4 5 6 7
失效費y(單位:萬元) 2.90 3.30 3.60 4.40 4.80 5.20 5.90
由上表數據可知,y與x的相關系數為______.
(精確到0.01,參考公式和數據:,,,)
【答案】0.99
【分析】分別求出,,,再利用參考公式和數據計算即可.
【詳解】由題意,知,

.
所以.
所以y與x的相關系數近似為0.99.
故答案為:0.99.
【典例14】(2022·高二課時練習)有人收集了某城市居民年收入(所有居民在一年內收入的總和)與A商品銷售額的10年數據,如表所示.
第n年 1 2 3 4 5 6 7 8 9 10
居民年收入(億元) 32.2 31.1 32.9 35.8 37.1 38 39 43 44.6 46
A商品銷售額(萬元) 25.0 30.0 34.0 37.0 39.0 41.0 42.0 44.0 48.0 51.0
畫出散點圖,判斷成對樣本數據是否線性相關,并通過樣本相關系數推斷居民年收入與A商品銷售額的相關程度和變化趨勢的異同.
參考數據:,,,,.
【答案】答案見解析
【分析】根據表中數據畫出散點圖即可,再根據參考數據以及相關系數的公式求值即可.
【詳解】畫出散點圖如下.從散點圖看,A商品銷售額與居民年收入的樣本數據呈現線性相關關系.

可以推斷居民年收入與A商品銷售額正相關,即居民年收入越高,A商品銷售額也越大.
【典例15】(2023·全國·高二專題練習)樣本相關系數
(1)設由變量x和y獲得的兩組數據分別為和(i=1,2,…,n),其對應關系如下表所示:
變量x …
變量y …
兩組數據和的__________是度量兩個變量x與y之間線性相關程度的統計量,其計算公式為,其中,,,它們分別是這兩組數據的算術平均數.
(2)相關系數r的性質:
①當時,稱成對樣本數據______相關;
當時,成對樣本數據______相關;
當時,成對樣本數據間沒有線性相關關系;
②樣本相關系數r的取值范圍為______;
當越接近1時,成對樣本數據的線性相關程度越______;
當越接近0時,成對樣本數據的線性相關程度越______.
【答案】 線性相關系數 正 負 強 弱
【分析】根據相關系數的定義,以及相關的性質內容,即可作答.
【詳解】根據相關系數的定義,,
其中,,,它們分別是這兩組數據的算術平均數.
和的線性相關系數是度量兩個變量x與y之間線性相關程度的統計量.
當時,稱成對樣本數據正相關;
當時,成對樣本數據負相關;
當時,成對樣本數據間沒有線性相關關系;
樣本相關系數r的取值范圍為;
當越接近1時,成對樣本數據的線性相關程度越強;
當越接近0時,成對樣本數據的線性相關程度越弱.
故答案為:線性相關系數;正;負;;強;弱.
◆考點06 相關系數的實際應用
【典例16】(2023·全國·高二專題練習)某學校組織學生觀看了“天宮課堂”第二課的直播后,極大地激發了學生學習科學知識的興趣,提高了學生學習的積極性,特別是對實驗操作的研究與探究.現有某化學興趣小組的同學在老師的指導下,開展了某項化學實驗操作,為了解實驗效度與實驗中原料的消耗量(單位:)的關系,該校實驗員隨機選取了10個小組的實驗數據如下表.
小組編號 1 2 3 4 5 6 7 8 9 10 總計
實驗效度 6
原料的消耗量 15
并計算得.
(1)求這10個小組的實驗效度與實驗中原料的消耗量的平均值;
(2)求這10個小組的實驗效度與實驗中原料的消耗量的相關系數(精確到);
(3)經該校實驗員統計,以往一個學年各種實驗中需用到原料的實驗有200次左右.假設在一定的范圍內,每次實驗中原料的消耗量與實驗效度近似成正比,其比例系數可近似為樣本中相應的平均值的比值.根據要求,實驗效度平均值需達到.請根據上述數據信息,估計該校本學年原料的消耗量.
附:相關系數
【答案】(1)0.6,1.5g
(2)0.75
(3)
【分析】(1)根據數值計算即可;(2)先化簡公式:,,然后再代入相關數據計算可得結果;(3)由比例關系直接計算即可.
【詳解】(1)由題意得這10個小組的實驗效度的平均值為,
這10個小組實驗中原料的消耗量的平均值為.
相關系數
.
(3)設該校本學年原料的消耗量為,
則由題可知,
所以估計該校本學年原料的消耗量為.
【典例17】(2022秋·陜西西安·高二陜西師大附中校考階段練習)某沙漠地區經過治理,生態系統得到很大改善,野生動物數量有所增加.為調查該地區某種野生動物的數量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區,調查得到樣本數據(xi,yi)(i=1,2,…,20),其中xi和yi分別表示第i個樣區的植物覆蓋面積(單位:公頃)和這種野生動物的數量,并計算得,,,,.
(1)求該地區這種野生動物數量的估計值(這種野生動物數量的估計值等于樣區這種野生動物數量的平均數乘以地塊數);
(2)求樣本(xi,yi) (i=1,2,…,20)的相關系數(精確到0.01);(附:相關系數, )
【答案】(1)12000
(2)
【分析】(1)由已知數據求得20個樣區野生動物數量的平均數,乘以200得答案;
(2)由已知直接利用相關系數公式求解.
【詳解】(1)由已知得樣本平均數,從而該地區這種野生動物數量的估計值為60×200=12000.
(2)樣本 的相關系數
【典例18】(2022·全國·高三專題練習)某沙漠地區經過治理,生態系統得到很大改善,野生動物數量有所增加.為調查該地區某種野生動物的數量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區,調查得到樣本數據,其中和分別表示第個樣區的植物覆蓋面積(單位:公頃)和這種野生動物的數量(單位:頭),并計算得,,,,.
(1)估計該地區這種野生動物的數量;
(2)求樣本的相關系數.(精確到0.01)
【答案】(1)
(2)
【分析】(1)計算出樣區野生動物的數量的平均值,乘以地塊數,即得答案;
(2)根據相關系數公式進行計算,可得答案.
【詳解】(1)由已知得樣本平均數 ,
從而該地區這種野生動物數量的估計值為.
(2)由,,,
可得樣本 的相關系數為
.
題組A 基礎過關練
一、單選題
1.(2023·全國·高二專題練習)經濟學專業的學生們為研究流通費率y和銷售額x(單位:千萬元)的關系,對同類型10家企業的相關數據()進行整理,并得到如下散點圖:
由此散點圖,在2千萬元至1億元之間,下面四個回歸方程類型中最適宜作為流通費率y和銷售額x的回歸方程類型的是( )
A. B.
C. D.
【答案】D
【分析】根據散點圖的變化趨勢,分析各選項中方程表示的曲線的特點,看是否合乎題意,即可得答案.
【詳解】根據散點圖,可以知道各點基本上是沿著一條具有遞減趨勢的曲線分布,并且變化趨勢較平緩,
A中表示直線,變化趨勢是定的,不合題意;
B中表示的曲線既有上升又有下降部分,不合題意;
C中表示的曲線不論是上升還是下降,都將比較快,曲線較“陡峭”,不合題意,
D中表示的曲線不論是上升還是下降,都將比較平緩,合乎題意,
故選:D.
2.(2023秋·上海浦東新·高二統考期末)小明同學每天閱讀數學文化相關的書籍,他每天閱讀的頁數分別為:4、5、4.5、5、6、8、7、5、4.5、6(單位:頁).下列圖形中不利于描述這些數據的是(  )
A.條形圖 B.莖葉圖 C.散點圖 D.扇形圖
【答案】C
【分析】根據相關圖的特征理解判斷.
【詳解】條形圖:是用寬度相同的條形的高度(或長度)表示數據的頻數,故符合題意;
莖葉圖:即可以保留原始數據又可以方便記錄數據,故符合題意;
散點圖:用兩組數據構成多個坐標點,通常用于比較跨類別的成對數據,不符合題意;
扇形圖:是用整個圓表示總體,用圓內各個扇形的大小表示各個部分占總體的百分數,扇形圖可以容易看出各個部分所占總體的比例,故符合題意;
故選:C.
3.(2023·全國·高二專題練習)如圖是近十年來全國城鎮人口、鄉村人口的折線圖(數據來自國家統計局).
根據該折線圖,下列說法錯誤的是( )
A.城鎮人口與年份呈現正相關 B.鄉村人口與年份的相關系數接近
C.城鎮人口逐年增長率大致相同 D.可預測鄉村人口仍呈現下降趨勢
【答案】B
【分析】根據折線圖判斷鄉村人口與年份、城鎮人口與年份的相關關系以及線性相關關系的強弱,逐項判斷可得出合適的選項.
【詳解】對于A選項,由折線圖可知,城鎮人口與年份呈現正相關,A對;
對于B選項,因為鄉村人口與年份呈負線性相關關系,且線性相關性很強,所以接近,B錯;
對于C選項,城鎮人口與年份呈現正相關,且線性相關性很強,相關系數接近,
故城鎮人口逐年增長率大致相同,C對;
對于D選項,由折線圖可知,鄉村人口與年份呈負線性相關關系,可預測鄉村人口仍呈現下降趨勢,D對.
故選:B.
4.(2022·高二課時練習)下面各圖中,散點圖與相關系數r不符合的有( )
A. B.
C. D.
【答案】B
【分析】根據散點圖和相關系數的知識確定正確選項.
【詳解】對于A,散點圖上所有點都在一條斜率小于0的直線上,所以相關系數r=-1,A正確;
對于B,散點圖上所有點都在一條斜率大于0的直線上,所以相關系數r=1,B錯誤;
對于C,散點圖上所有點從左到右是向下的帶狀分布,所以相關系數,C正確;
對于D,散點圖中,x,y之間的相關關系非常不明顯,所以相關系數r=0,D正確.
故選:B.
5.(2022·高二課時練習)下列變量之間的關系是相關關系的是(  )
A.正方體的表面積與體積
B.光照時間與果樹的產量
C.勻速行駛車輛的行駛距離與時間
D.某運動會中某代表團的足球隊的比賽成績與乒乓球隊的比賽成績
【答案】B
【分析】A與C是一種函數關系,D不具備相關關系,B滿足相關關系.
【詳解】對于A,正方體的體積確定,則表面積隨之確定,是一種確定性關系,A錯誤;
對于B,光照時間越長,果樹的產量相對越大,是一種線性相關關系,B正確;
對于C,行駛速度與時間是一種確定的函數關系,C錯誤;
對于D,足球比賽成績與乒乓球比賽成績沒有關系,不具有相關關系,D錯誤.
故選:B
6.(2022·高二課時練習)變量X與Y相對應的一組數據為,,,,;變量U與V相對應的一組數據為,,,,.記為變量X與Y之間的相關系數.為變量U與V之間的相關系數,則( )
A. B. C. D.
【答案】B
【分析】根據題意可得數據間的正負關系,從而進行判斷即可.
【詳解】由變量X與Y的對應數據可得變量X與Y之間呈正相關,因此;由變量U與V的對應數據可得變量U與V之間呈負相關,因此.故.
故選:B
二、多選題
7.(2022·高二課時練習)下列變量間可能用直線擬合的是( )
A.光照時間與大棚內蔬菜的產量 B.某正方形的邊長與此正方形的面積
C.舉重運動員所能舉起的最大重量與他的體重 D.某人的身高與視力
【答案】AC
【分析】判斷兩個變量之間是否有線性相關性進行求解.
【詳解】對于選項A,光照時間與大棚內蔬菜的產量中的兩個變量之間均存在某種關系,若存在線性關系就可用直線擬合,故A正確;
對于選項B,某正方形的邊長與此正方形的面積這兩個變量之間是確定的函數關系,不能用直線擬合,故B錯誤;
對于選項C,舉重運動員所能舉起的最大重量與他的體重中的兩個變量之間均存在某種關系,若存在線性關系就可用直線擬合,故C正確;
對于選項D,某人的身高與視力這兩個變量之間無任何關系,不能用直線擬合,故D錯誤.
故選:AC.
8.(2022春·新疆塔城·高一沙灣縣第一中學校考期末)某市氣象部門根據2020年各月的每天最高氣溫與最低氣溫的平均數據,繪制如下折線圖,那么下列敘述正確的是( )
A.各月的每天最高氣溫平均值與最低氣溫平均值總體呈正相關
B.從2020年1月至8月該市每天最高氣溫平均值與最低氣溫平均值一直在上升
C.全年中各月最高氣溫平均值不低于25℃的月份有5個
D.全年中,2月份的最高氣溫平均值與最低氣溫平均值的差值最大
【答案】ACD
【分析】觀察繪制出的折線圖逐項判斷即可.
【詳解】由繪制出的折線圖知,對于A項,各月最高氣溫平均值與最低氣溫平均值為正相關,故A正確;
對于B項,1月到2月的最低氣溫平均值下降,故B不正確;
對于C項,全年中各月最高氣溫平均值不低于25℃的月份有5月,6月,7月,8月,9月共5個,故C正確;
對于D項,2月的最高氣溫平均值與最低氣溫平均值的差值最大,故D正確.
故答案為:ACD.
三、填空題
9.(2022·高二單元測試)若線性回歸方程中的回歸系數,則相關系數______.
【答案】0
【分析】結合已知條件,利用回歸系數公式和相關系數公式求解即可.
【詳解】∵,
∴,
∴.
故答案為:0.
10.(2022·高二課時練習)對于相關系數r,下列說法中錯誤的是________.
①r越大,線性相關程度越強;
②越小,線性相關程度越強;
③越大,線性相關程度越弱,越小,線性相關程度越強;
④,且越接近1,線性相關程度越強,越接近0,線性相關程度越弱.
【答案】①②③
【分析】根據相關系數的性質依次判斷即可.
【詳解】相關系數,且越接近1,線性相關程度越強,越接近0,線性相關程度越弱,
故①②③錯誤,④正確.
故答案為:①②③
11.(2022春·河南信陽·高二統考期末)若一組觀測值,,…,()對應的點位于同一直線上,則x,y的相關系數為______.
【答案】
【分析】根據相關系數的定義可得答案.
【詳解】由已知條件和相關系數的定義得,x,y的相關系數為.
故答案為:
12.(2022春·江蘇南通·高二海門中學校考階段練習)以模型去擬合一組數據時,已知如下數據:,則實數k的值為_______.
【答案】3
【分析】由指數的運算性質知,即可求結果.
【詳解】由 ,則.
故答案為:3
四、解答題
13.(2021春·陜西延安·高二子長市中學校考期末)某電器公司的市場研究人員為了解公司的經營狀況,對該公司最近六個月內的市場占有率進行了統計,結果如下表所示:
月份 1月 2月 3月 4月 5月 6月
月份代碼 1 2 3 4 5 6
市場占有率(%) 11 13 16 15 20 21
(1)用相關系數說明市場占有率與月份代碼之間的關系是否可用線性回歸模型擬合?(結果保留兩位小數)
(2)求關于的線性回歸方程,并預測該公司10月份的市場占有率.
參考數據:,,,.
參考公式:相關系數,線性回歸方程的斜率和截距的最小二乘法估計分別為,.
【答案】(1)答案見解析
(2),預測該公司10月份的市場占有率為29%
【分析】(1)根據題中所給的相關系數公式,結合相關系數的性質進行運算求解判斷即可;
(2)根據題中所給的公式進行求解即可.
【詳解】(1)∵,,,
∴,
∴兩變量之間具有較強的線性相關關系,
故市場占有率y與月份代碼x之間的關系可用線性回歸模型擬合;
(2),
又,,
∴,
故y關于x的線性回歸方程為,
當時,,
∴預測該公司10月份的市場占有率為29%.
14.(2021春·陜西渭南·高二統考期末)某高中生參加社會實踐活動,對某公司1月份至5月份銷售的某種配件的銷售量及銷售單價進行了調查,銷售單價和銷售量之間的一組數據如下表所示:
月份 1 2 3 4 5
銷售單價元 9 9.5 10 10.5 11
銷售量件 11 10 8 6 5
(1)由上表數據知,可用線性回歸模型擬合與的關系,請用相關系數加以說明;(精確到0.01)
(2)求出關于的線性回歸方程;
(3)預計在今后的銷售中,銷售量與銷售單價仍然服從(2)中的關系,如果該種配件的成本是2.5元/件,那么該種配件的銷售單價應定為多少元才能獲得最大利潤?(注:利潤銷售收入成本)
參考公式:相關系數,線性回歸方程的斜率和截距的最小二乘法估計分別為.
參考數據:
【答案】(1)答案見解析
(2)
(3)7.5元
【分析】(1)根據所給公式及數據求出相關系數,即可判斷;
(2)根據所給公式及數據求出、,即可得到回歸方程;
(3)設銷售利潤為,則,,再根據二次函數的性質計算可得.
【詳解】(1)解: ,,,
由于與的相關系數近似為,說明與的線性相關程度相當高,
從而可以用線性回歸模型擬合與的關系.
(2)解:,,
又,,
關于的線性回歸方程為.
(3)解:設銷售利潤為,則,
整理得,
所以當時,故該配件的銷售單價應定為元才能獲得最大利潤.
題組B 能力提升練
一、單選題
1.(2023·全國·高三專題練習)在研究急剎車的停車距離問題時,通常假定停車距離等于反應距離(,單位:m)與制動距離(,單位:m)之和.如圖為某實驗所測得的數據,其中“KPH”表示剎車時汽車的初速度(單位:km/h).根據實驗數據可以推測,下面四組函數中最適合描述,與的函數關系的是( )
A., B.,
C., D.,
【答案】B
【分析】設,,根據圖象得到函數圖象上的點,作出散點圖,即可得到答案.
【詳解】設,.
由圖象知,過點,,,,,,,,,,,,,,.
作出散點圖,如圖1.
由圖1可得,與呈現線性關系,可選擇用.
過點,,,,,,,,,,,,,,.
作出散點圖,如圖2.
由圖2可得,與呈現非線性關系,比較之下,可選擇用.
故選:B.
2.(2022春·上海浦東新·高二上海南匯中學校考期末)要判斷成對數據的線性相關程度的強弱,可以通過比較它們的樣本相關系數r的大小,以下是四組數據的相關系數的值,則線性相關最強的是( )
A. B.
C. D.
【答案】A
【分析】利用相關系數的含義,判斷每個選項里的相關系數的絕對值的大小即可.
【詳解】當時,表明兩個變量正相關;當時,表明兩個變量負相關; ,且 越接近于1,相關程度越大;越接近于0,相關程度越小,
故 ,因此線性相關最強的是A,
故選:A
3.(2022·全國·高三專題練習)給出下列說法:①回歸直線恒過樣本點的中心,且至少過一個樣本點;②兩個變量相關性越強,則相關系數就越接近1;③將一組數據的每個數據都加一個相同的常數后,方差不變;④在回歸直線方程中,當解釋變量增加一個單位時,預報變量平均減少0.5個單位.其中說法正確的是( )
A.①②④ B.②③④ C.①③④ D.②④
【答案】B
【分析】① 中,根據回歸直線方程的特征,可判定是不正確;② 中,根據相關系數的意義,可判定是正確的;③ 中,根據方差的計算公式,可判定是正確的;④中,根據回歸系數的含義,可判定是正確的.
【詳解】對于① 中,回歸直線恒過樣本點的中心,但不一定過一個樣本點,所以不正確;
對于② 中,根據相關系數的意義,可得兩個變量相關性越強,則相關系數就越接近1,所以是正確的;
對于③ 中,根據方差的計算公式,可得將一組數據的每個數據都加一個相同的常數后,方差是不變的,所以是正確的;
對于④ 中,根據回歸系數的含義,可得在回歸直線方程中,當解釋變量增加一個單位時,預報變量平均減少0.5個單位,所以是正確的.
故選:B.
4.(2022春·江西贛州·高二校聯考期中)下列說法:①命題“,若,則”是真命題:②以模型去擬合一組數據時,為了求出回歸方程,設﹐將其變換后得到線性方程,則c,k的值分別是和0.3:③已知是雙曲線的一個焦點,則點F到雙曲線E的漸近線的距離等于b.正確的個數是( )
A.0 B.1 C.2 D.3
【答案】D
【分析】對于①,先求出其逆否命題,再判斷逆否命題的真假,從而可判斷出原命題的真假,對于②,由,兩邊取對數,對應,從而可求出c,k的值,對于③,先求出以曲線的漸近線方程,然后利用點到直線的距離公式求解判斷
【詳解】對于①,命題“,若,則”的逆否命題為“若,則”為真命題,所以原命題是真命題,所以①正確,
對于②,由,兩邊取對數,得,令,則,
因為,所以,所以,所以②正確,
對于③,雙曲線的漸近線方程為,由雙曲線的對稱性,取一條漸近線方程,即,則到直線的距離為,即點F到雙曲線E的漸近線的距離等于b,所以③正確,
故選:D
5.(2022春·河南南陽·高二校考階段練習)袁隆平院士是我國的雜交水稻之父,他一生致力于雜交水稻的研究,為解決中國人民的溫飽和保障國家糧食安全做出了重大的貢獻.某雜交水稻研究小組先培育出第一代雜交水稻,再由第一代培育出第二代,第二代培育出第三代,以此類推.已知第一代至第四代雜交水稻的每穗總粒數分別為197粒,193粒,201粒,209粒,且親代與子代的每穗總粒數成線性相關.根據以上信息,預測第五代雜交水稻每穗的總粒數為( )
(注:①親代是產生后一代生物的生物,對后代生物來說是親代,所產生的后一代叫子代:②,)
A.211 B.212 C.213 D.214
【答案】C
【分析】利用最小二乘法求得親代與子代的每穗總粒數之間的線性回歸方程,進而得解.
【詳解】由題意,設親代每穗總粒數,子代的每穗總粒數,
則,

所以線性回歸方程為
當時,
預測第五代雜交水稻每穗的總粒數為213
故選:C
6.(2022·高二課時練習)已知r1表示變量X與Y之間的線性相關系數,r2表示變量U與V之間的線性相關系數,且r1=0.837,r2=﹣0.957,則( )
A.變量X與Y之間呈正相關關系,且X與Y之間的相關性強于U與V之間的相關性
B.變量X與Y之間呈負相關關系,且X與Y之間的相關性強于U與V之間的相關性
C.變量U與V之間呈負相關關系,且X與Y之間的相關性弱于U與V之間的相關性
D.變量U與V之間呈正相關關系,且X與Y之間的相關性弱于U與V之間的相關性
【答案】C
【分析】根據線性相關系數|r|越接近1,表示兩個變量之間的相關性越強,線性相關系數r的正負表示兩個變量之間呈正相關關系或負相關關系.
【詳解】因為線性相關系數r1=0.837,r2=﹣0.957,
所以變量X與Y之間呈正相關關系,變量U與V之間呈負相關關系,
X與Y之間的相關性弱于U與V之間的相關性.
故選:C
二、多選題
7.(2023·重慶·統考模擬預測)下列命題中正確的是( ).
A.一組從小到大排列的數據0,1,3,4,6,7,9,x,11,11,去掉x與不去掉x,它們的80%分位數都不變,則
B.兩組數據,,,…,與,,,…,,設它們的平均值分別為與,將它們合并在一起,則總體的平均值為
C.已知離散型隨機變量,則
D.線性回歸模型中,相關系數r的值越大,則這兩個變量線性相關性越強
【答案】AB
【分析】根據百分位數的計算公式,計算即可驗證選項A;由平均值的定義和公式驗證選項B;由二項分布的方差公式計算結果驗證選項C;由線性相關系數的性質判斷選項D.
【詳解】對于A:一組從小到大排列的數據0,1,3,4,6,7,9,x,11,11,共10個數據,
因為80%×10=8,所以樣本數據的80%分位數為第8個和第9個數據的平均數,即,
若去掉x,一組從小到大排列的數據0,1,3,4,6,7,9,11,11,共9個數據,
因為80%×9=7.2,所以樣本數據的80%分位數為第8個數據,即,
去掉x與不去掉x,它們的80%分位數都不變,則,解得,A選項正確;
對于B:兩組數據,,,…,與,,,…,,設它們的平均值分別為與,將它們合并在一起,有,則總體的平均值為 ,B選項正確;
對于C:已知離散型隨機變量, 有,則,C選項錯誤;
對于D: 線性回歸模型中,相關系數的值越大,則這兩個變量線性相關性越強,D選項錯誤.
故選:AB
8.(2022·高二單元測試)四對變量與進行線性相關檢驗,已知是觀測值組數,是相關系數,則變量和具有線性相關關系的是( ).
相關系數的臨界值表
A.、 B.、
C.、 D.、
【答案】AC
【分析】由于小概率與在附表中分別查得值,然后與選項中的值比較即可求解.
【詳解】由于小概率與在附表中分別查得:
A選項的,B選項的,C選項的,D選項的,
因此知A、C中相關系數比大,變量和具有線性相關關系,
而B、D中的相關系數小于,故變量與不具有線性相關關系,
故選:AC.
9.(2022·高二課時練習)已知與之間的四組數據如下表:
2 3 4 5
1.5 3.5
上表數據中的平均值為,若某同學對賦了兩個值,分別為,,得到兩條回歸直線的方程分別為,,對應的相關系數分別為,,則( )A.兩條回歸直線的交點為 B.
C. D.
【答案】ACD
【分析】由已知數據求出樣本中心點可判斷A;分別求出,時的值,再由公式計算出,,,可判斷BC;由公式求出和可判斷D,進而可得正確選項.
【詳解】因為,,所以兩條回歸直線過樣本點的中心,即兩條回歸直線的交點為,故選項A正確;
當時,由,可得,


所以,,
當時,由,可得,

所以,,
所以,,故選項B錯誤,選項C正確;
當,時,因為,
所以,
當,時,,
所以,則,故選項D正確,
故選:ACD.
三、填空題
10.(2022·全國·高三專題練習)某品牌餐飲公司準備在10個規模相當的地區開設加盟店,為合理安排各地區加盟店的個數,先在其中5個地區進行試點,得到試點地區加盟店個數x及單店日平均營業額y(萬元)的::數據如下:
x 1 2 3 4 5
y 10.9 10.2 9.0 7.8 7.1
根據上表可得y關于x線性相關,為保證規模和效益,該公司要求在其他5個地區需滿足同一地區所有加盟店的日平均營業額預計值總和不低于35萬元,則一個地區開設的加盟店個數m的所有可能取值為______.(參考數據:,)
【答案】5,6,7
【分析】根據題意求出,利用最小二乘法求出,進而求出即可得出線性回歸方程,根據題意列出不等式,解之即可.
【詳解】由題意可得,,,


設線性回歸方程為,
則,,
故線性回歸方程為.
根據題意,,解得,又,
所以m的所有可能取值為5,6,7.
故答案為:5,6,7
11.(2021春·陜西咸陽·高二武功縣普集高級中學校考階段練習)下列說法:
①線性回歸方程必過;
②命題“”的否定是“”
③相關系數越小,表明兩個變量相關性越弱;
④在一個列聯表中,由計算得,則有的把握認為這兩個變量間有關系;
其中正確的說法是__________.(把你認為正確的結論都寫在橫線上)
本題可參考獨立性檢驗臨界值表:
【答案】①④
【詳解】分析:根據性回歸方程,獨立性檢驗,相關關系,以及命題的否定等知識,選出正確的,得到結果.
詳解:線性回歸方程必過樣本中心點,故①正確.
命題“”的否定是“” 故②錯誤
③相關系數r絕對值越小,表明兩個變量相關性越弱,故不正確;
④在一個列聯表中,由計算得,則有的把握認為這兩個變量間有關系,正確.
故答案為①④.
點睛:本題以命題真假的判斷為載體,著重考查了相關系數、命題的否定、獨立性檢驗、回歸直線方程等知識點,屬于中檔題.
四、解答題
12.(2023·陜西安康·統考二模)某公司進行工資改革,將工作效率作為工資定檔的一個重要標準,大大提高了員工的工作積極性,但也引起了一些老員工的不滿.為了調查員工的工資與工齡的情況,人力資源部隨機從公司的技術研發部門中抽取了16名員工了解情況,結果如下:
工齡(年): 1 2 3 4 5 6 7 8
年薪(萬): 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
工齡(年): 9 10 11 12 13 14 15 16
年薪(萬): 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
經計算得,,,,其中表示工齡為年的年薪,.
(1)求年薪與工齡的相關系數,并回答是否可以認為年薪與工齡具有線性相關關系(若,則可以認為年薪與工齡不具有線性相關關系).
(2)在抽取的16名員工中,如果年薪都在之內,則繼續推進工資改革,同時給每位老員工相應的補貼,如果有員工年薪在之外,該員工會被人力資源部約談并進行崗位調整,且需要重新計算原抽取的16名員工中留下的員工年薪的均值和標準差,由于人力資源部需要安撫老員工的情緒,工作繁重,現請你幫忙計算留下的員工年薪的均值和標準差.(精確到0.01)
附:樣本的相關系數,,,,.
【答案】(1),可以認為年薪與工齡不具有線性相關關系
(2)均值為萬元,標準差為
【分析】(1)由樣本數據得相關系數, 可以認為年薪與工齡不具有線性相關關系;
(2) 由樣本數據可以看出工齡為13年的員工年薪在以外,留下15名員工,求剩下員工年薪的均值和標準差即可.
【詳解】(1)由樣本數據得的相關系數為,
,因此可以認為年薪與工齡不具有線性相關關系.
(2)由于,,由樣本數據可以看出工齡為13年的員工年薪在以外,
因此會被約談并進行崗位調整,所以留下15名員工,剩下員工年薪的均值為萬元,
余下員工年薪的方差為
所以標準差的估計值為
13.(2022春·重慶沙坪壩·高二重慶八中校考期末)有一個開房門的游戲,其玩法為:
盒中先放入兩把鑰匙和兩把鑰匙,能夠打開房門,不能打開房門.
每次從盒中隨機取一把試開,試開后不放回鑰匙.第一次打開房門后,關上門繼續試開,第二次打開房門后停止抽取,稱為進行了一輪游戲.
若每一輪取鑰匙不超過三次,則該輪“成功”,否則為“失敗”,如果某一輪“成功”,則游戲終止;若“失敗”,則將所有鑰匙重新放入盒中,并再放入一把鑰匙,繼續下一輪抽取,直至“成功”.
(1)有名愛好者獨立參與這個游戲,記表示“成功”時抽取鑰匙的輪次數,表示對應的人數,部分統計數據如下表:
若將作為關于的經驗回歸方程,估計抽取輪才“成功”的人數(人數精確到個位);
(2)由于時間關系,規定:進行游戲時,最多進行三輪,若均未“成功”也要終止游戲.求游戲要進行三輪的概率.
參考公式:最小二乘估計,.
參考數據:取,,其中,.
【答案】(1)人
(2)
【分析】(1)利用參考數據以及最小二乘法公式求出、的值,可得出經驗回歸方程,然后在回歸方程中令,可求得結果;
(2)設事件為“第一輪成功”,事件為“第二輪成功”,則、相互獨立,分析可知游戲要進行三輪,即前兩輪均失敗,計算出、的值,利用對立事件和獨立事件的概率公式可求得所求事件的概率.
【詳解】(1)解:令,設,
由條件知,,
所以,
,從而,
故所求的回歸方程為.
所以,估計當時,,即抽取輪才“成功”的人數約為人.
(2)解:由條件知,游戲要進行三輪,即前兩輪均失敗.
設事件為“第一輪成功”,事件為“第二輪成功”,則、相互獨立.
因為,,
所以,前兩輪均失敗的概率為.
故游戲要進行三輪的概率為.
題組C 培優拔尖練
1.(2022·全國·高三專題練習)近年來,“共享汽車”在我國各城市迅猛發展,為人們的出行提供了便利,但也給城市交通管理帶來了一些困難.為了解“共享汽車”在M省的發展情況,M省某調查機構從該省隨機拍取了5個城市,分別收集和分析了“共享汽車”的A,B,C三項指標數據,, ,數據如下表所示;
城市編號i 1 2 3 4 5
A指標 4 6 2 8 5
B指標 4 4 3 5 4
C指標 3 6 2 5 4
(1)分別求y與x之間的相關系數及z與x之間的相關系數,并比較y與x,z與x之間相關性的強弱;
(2)利用向量夾角來分析y與x之間及z與x之間的相關關系.
附:相關系數.
參考數據:,,,
,,,.
【答案】(1),,y與x之間的相關性比z與x之間的相關性強;
(2)y與x之間的相關性比z與x之間的相關性強.
【分析】(1)應用相關系數公式求,并比較大小,即可得結論;
(2)將各數據集中數據減去對應平均數得到數據集對應的向量,應用向量夾角的坐標表示求向量夾角余弦值,根據其符號和絕對值大小,確定結論.
(1)
由已知,,,,
所以,

所以y與x、z與x正相關,又,則y與x之間的相關性比z與x之間的相關性強.
(2)
由(1)知:,,,
將題表中x,y,z的相關數據分別減去,,,
記,


則,,,
于是,

所以y與x、z與x正相關,又,則y與x之間的相關性比z與x之間的相關性強.
2.(2023·全國·高三專題練習)在某生態系統中,有甲、乙兩個種群,兩種群之間為競爭關系.設t時刻甲、乙種群的數量分別為,(起始時刻為).由數學家Lotka和Volterra提出的模型是函數,滿足方程,,其中a,b,c,d均為非負實數.
(1)下圖為沒有乙種群時,一段時間內甲種群數量與時間的關系折線圖.為預測甲種群的數量變化趨勢,研究人員提出了兩種可能的數學模型:①;②,其中m,n均為大于1的正數.根據折線圖判斷,應選用哪種模型進行預測,并說明理由.
(2)設,.
①函數的單調性;
②根據①中的結論說明:在絕大多數情況下,經過充分長的時間后,或者甲種群滅絕,或者乙種群滅絕.
注:在題設條件下,各種群數量均有上限值.
【答案】(1)應選用模型②預測甲種群數量的變化趨勢;理由見解析
(2)①為常函數;②答案見解析
【分析】(1)根據圖像特點即可判斷答案
(2)第一小問可先求出,根據值的正負情況判斷的單調性;第二小問由(i)知 為常數,,通過對種群初始數量和時刻數量的分類討論來確定種群的變化趨勢,從而得出結論
【詳解】(1)由折線圖知,甲種群數量的增長速度隨著時間的推移而加快.而增長速度大致對應種群數量對時間的導數.
如選用模型①,,是關于時間的減函數,不符合折線圖;
如選用模型②,,是關于時間的增函數,符合折線圖.
所以應選用模型②預測甲種群數量的變化趨勢
(2)由題設知,.
(i),.
消去條件中的得,所以.
所以為常函數.
(ii)由(i),,.
由于各種群數量均有上限值,不妨設甲乙種群數量的上限值分別為,.
①若,.
則當時,,此時可以近似認為甲種群滅絕;
②若,.
則當時,,此時可以近似認為乙種群滅絕;
③若,,甲乙種群數量之比保持恒定,可能不出現滅絕的情況.
綜上所述,對所有的情況,經過充分長的時間后,或者甲種群滅絕,或者乙種群滅絕
【點睛】本題屬于中檔偏難題,考察非線性回歸、創新情境等,,結合生態學知識、線性微分方程組等知識,以統計學基礎知識為載體,考察考生的綜合能力.

展開更多......

收起↑

資源預覽

    <track id="r4fhd"></track>

    <pre id="r4fhd"><abbr id="r4fhd"><code id="r4fhd"></code></abbr></pre>
      <ul id="r4fhd"></ul>

        <menu id="r4fhd"></menu>
        1. 主站蜘蛛池模板: 澄城县| 棋牌| 阳新县| 天峻县| 太仓市| 吉首市| 巴塘县| 云龙县| 禄丰县| 东方市| 兴仁县| 资中县| 莱州市| 肥乡县| 禄劝| 林州市| 武安市| 瓮安县| 张家港市| 铁力市| 谢通门县| 黎川县| 南雄市| 基隆市| 新乐市| 永康市| 富裕县| 休宁县| 灵璧县| 河东区| 阿勒泰市| 雅江县| 宣汉县| 光泽县| 曲麻莱县| 山东省| 那坡县| 贡觉县| 永靖县| 巍山| 精河县|