資源簡(jiǎn)介 第八章 成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析——高二數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)期末復(fù)習(xí)知識(shí)大盤點(diǎn)學(xué)習(xí)目標(biāo)整合1.成對(duì)數(shù)據(jù)的相關(guān)關(guān)系 (1)會(huì)畫出成對(duì)樣本數(shù)據(jù)的散點(diǎn)圖. (2)會(huì)通過(guò)散點(diǎn)圖判斷成對(duì)樣本數(shù)據(jù)的相關(guān)性. (3)結(jié)合實(shí)例,了解樣本相關(guān)系數(shù)的統(tǒng)計(jì)含義,會(huì)通過(guò)相關(guān)系數(shù)比較多組成對(duì)數(shù)據(jù)的相關(guān)性.2.一元線性回歸模型及其應(yīng)用 (1)了解一元線性回歸模型的含義,了解模型參數(shù)的統(tǒng)計(jì)意義,了解最小二乘原理,掌握一元線性回歸模型參數(shù)的最小二乘估計(jì)方法,會(huì)使用相關(guān)的統(tǒng)計(jì)軟件. (2)會(huì)用一元線性回歸模型進(jìn)行預(yù)測(cè)實(shí)際問(wèn)題.3.分類變量與列聯(lián)表 (1)通過(guò)實(shí)例,理解列聯(lián)表的統(tǒng)計(jì)意義. (2)通過(guò)實(shí)例,了解列聯(lián)表與獨(dú)立性檢驗(yàn)及其應(yīng)用.教材習(xí)題變式【課后習(xí)題】1.變量x與y的成對(duì)樣本數(shù)據(jù)的散點(diǎn)圖如下圖所示,據(jù)此可以推斷變量x與y之間( ).A.很可能存在負(fù)相關(guān) B.一定存在正相關(guān)C.很可能存在正相關(guān) D.一定不存在負(fù)相關(guān)2.對(duì)于變量Y和x的成對(duì)樣本數(shù)據(jù),由一元線性回歸模型得到經(jīng)驗(yàn)回歸模型,對(duì)應(yīng)的殘差如圖所示.模型誤差( ).A.滿足一元線性回歸模型的所有假設(shè)B.不滿足一元線性回歸模型的的假設(shè)C.不滿足一元線性回歸模型的的假設(shè)D.不滿足一元線性回歸模型的和的假設(shè)3.根據(jù)分類變量x與y的成對(duì)樣本數(shù)據(jù),計(jì)算得到.依據(jù)的獨(dú)立性檢驗(yàn),結(jié)論為( ).A.變量x與y不獨(dú)立B.變量x與y不獨(dú)立,這個(gè)結(jié)論犯錯(cuò)誤的概率不超過(guò)0.05C.變量x與y獨(dú)立D.變量x與y獨(dú)立,這個(gè)結(jié)論犯錯(cuò)誤的概率不超過(guò)0.054.8.3節(jié)例4中推斷吸煙與患肺癌是有關(guān)聯(lián)的,能用一元線性回歸模型建立它們之間的關(guān)系嗎?為什么?5.根據(jù)8.1.2節(jié)例3中的數(shù)據(jù),建立臂展關(guān)于身高的經(jīng)驗(yàn)回歸模型,畫出殘差圖,描述殘差圖的特點(diǎn).6.下表是1896-2016年男子三級(jí)跳遠(yuǎn)奧運(yùn)會(huì)冠軍的成績(jī),請(qǐng)分析這組數(shù)據(jù),能用一元線性回歸模型刻畫這組數(shù)據(jù)嗎?年份 成績(jī)/m 年份 成績(jī)/m 年份 成績(jī)/m 年份 成績(jī)/m1896 13.71 1928 15.21 1964 16.85 1992 18.171900 14.47 1932 15.72 1968 17.39 1996 18.091904 14.35 1936 16.00 1972 17.35 2000 17.711908 14.92 1948 15.40 1976 17.29 2004 17.791912 14.64 1952 16.22 1980 17.35 2008 17.671920 14.50 1956 16.35 1984 17.25 2012 17.811924 15.53 1960 16.81 1988 17.61 2016 17.867.汽車輪胎凹槽深度是影響汽車剎車的因素,汽車行駛會(huì)導(dǎo)致輪胎胎面磨損.某實(shí)驗(yàn)室通過(guò)試驗(yàn)測(cè)得行駛里程與某品牌輪胎凹槽深度的數(shù)據(jù),請(qǐng)根據(jù)數(shù)據(jù)建立輪胎凹槽深度和汽車行駛里程的關(guān)系,并解釋模型的含義.行駛里程/萬(wàn)km 0.00 0.64 1.29 1.93 2.57 3.22 3.86 4.51 5.15輪胎凹槽深度/ 10.02 8.37 7.39 6.48 5.82 5.20 4.55 4.16 3.828.為考察某種藥物預(yù)防疾病的效果,進(jìn)行動(dòng)物試驗(yàn),得到如下列聯(lián)表:單位:只藥物 疾病 合計(jì)未患病 患病未服用 75 66 141服用 112 47 159合計(jì) 187 113 300依據(jù)的獨(dú)立性檢驗(yàn),能否認(rèn)為藥物有效呢?如何解釋得到的結(jié)論?9.氣象部門由每天的最高氣溫的數(shù)據(jù),得到每月最高氣溫的平均數(shù),簡(jiǎn)稱平均高溫.下表是2017年31個(gè)城市1月和7月的平均高溫?cái)?shù)據(jù).城市 1月平均高溫/℃ 7月平均高溫/℃ 城市 1月平均高溫/℃ 7月平均高溫/℃北京 3 32 南京 9 35成都 12 32 南寧 20 33重慶 12 36 上海 10 36福州 17 36 沈陽(yáng) -3 31廣州 21 33 石家莊 3 33貴陽(yáng) 9 28 太原 3 32哈爾濱 -11 30 天津 3 33海口 22 32 烏魯木齊 -3 32杭州 11 36 武漢 10 34合肥 9 35 西安 8 36呼和浩特 -3 30 西寧 4 27濟(jì)南 6 33 銀川 2 32昆明 17 24 長(zhǎng)春 -8 29拉薩 8 23 長(zhǎng)沙 11 35蘭州 5 33 鄭州 7 34南昌 13 35(1)畫出并觀察各城市1月與7月的平均高溫的散點(diǎn)圖,你認(rèn)為1月與7月的平均高溫有線性趨勢(shì)嗎?描述散點(diǎn)圖的特點(diǎn).(2)結(jié)合地理知識(shí)并用統(tǒng)計(jì)方法分析表中的數(shù)據(jù),解釋這兩個(gè)月平均高溫的關(guān)系.【變式訓(xùn)練】10.隨著“一帶一路”經(jīng)貿(mào)合作持續(xù)深化,西安某地對(duì)外貿(mào)易近幾年持續(xù)繁榮,2023年6月18日,該地很多商場(chǎng)都在搞“618”促銷活動(dòng).市物價(jià)局派人對(duì)某商品同一天的銷售量及其價(jià)格進(jìn)行調(diào)查,得到該商品的售價(jià)x(單位:元)和銷售量y(單位:百件)之間的一組數(shù)據(jù)(如表所示),用最小二乘法求得y關(guān)于x的線性回歸方程是,預(yù)測(cè)當(dāng)售價(jià)為45元時(shí),銷售量件數(shù)大約為(單位:百件)( )x 20 25 30 35 40y 5 7 8 9 11A.12 B.12.5 C.13 D.11.7511.若由列聯(lián)表中的數(shù)據(jù)計(jì)算得,則有_________的把握認(rèn)為兩個(gè)變量有關(guān)系( )0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.0011.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828A. B. C. D.12.色差和色度是衡量毛線玩具質(zhì)量?jī)?yōu)劣的兩個(gè)重要指標(biāo),現(xiàn)抽檢一批毛線玩具并將測(cè)得數(shù)據(jù)列于表中.已知該產(chǎn)品的色度y和色差x之間滿足線性相關(guān)關(guān)系,且,現(xiàn)有一對(duì)測(cè)量數(shù)據(jù)為,則該數(shù)據(jù)的殘差為( )色差x 21 23 25 27色度y 15 18 19 20A.-0.96 B.-0.8 C.0.8 D.0.9613.某醫(yī)療機(jī)構(gòu)通過(guò)抽樣調(diào)查(樣本容量),利用列聯(lián)表和統(tǒng)計(jì)量研究患肺病是否與吸煙有關(guān).計(jì)算得,經(jīng)查對(duì)臨界值表知,現(xiàn)給出四個(gè)結(jié)論,其中正確的是( )A.在100個(gè)吸煙的人中約有95個(gè)人患肺病B.若某人吸煙,那么他有95%的可能性患肺病C.有95%的把握認(rèn)為“患肺病與吸煙有關(guān)”D.只有5%的把握認(rèn)為“患肺病與吸煙有關(guān)”14.2020年以來(lái),5G技術(shù)在我國(guó)已經(jīng)進(jìn)入高速發(fā)展的階段,5G手機(jī)的銷量也逐漸上升,某手機(jī)店統(tǒng)計(jì)了2022年1~5月5G手機(jī)的實(shí)際銷量如下表所示:月份 1月 2月 3月 4月 5月月份編號(hào)x 1 2 3 4 5銷量y/部 50 96 a 185 227若y與x線性相關(guān),且求得線性回歸方程為,則下列結(jié)論錯(cuò)誤的是( )A.B.y與x正相關(guān)C.y與x的相關(guān)系數(shù)為負(fù)數(shù)D.估計(jì)2022年7月該手機(jī)店的5G手機(jī)銷量為320部15.有兩個(gè)分類變量X,Y,其列聯(lián)表如表所示:a其中a,均為大于5的整數(shù),若在犯錯(cuò)誤的概率不超過(guò)0.05的前提下認(rèn)為X,Y有關(guān),則a的值為( )A.8 B.9 C.8或9 D.6或816.某班班主任對(duì)全班50名學(xué)生學(xué)習(xí)積極性與對(duì)待班級(jí)工作的態(tài)度進(jìn)行了調(diào)查,統(tǒng)計(jì)數(shù)據(jù)如下表所示:主動(dòng)參加班級(jí)工作 不太主動(dòng)參加班級(jí)工作 合計(jì)學(xué)習(xí)積極性高 18 7 25學(xué)習(xí)積極性一般 6 19 25合計(jì) 24 26 50根據(jù)表中數(shù)據(jù)分析,以下說(shuō)法正確的是( )臨界值表:0.05 0.025 0.010 0.005 0.0013.841 5.024 6.635 7.879 10.828A.有的把握認(rèn)為學(xué)生的學(xué)習(xí)積極性與對(duì)待班級(jí)工作的態(tài)度有關(guān)系B.有的把握認(rèn)為學(xué)生的學(xué)習(xí)積極性與對(duì)待班級(jí)工作的態(tài)度沒(méi)有關(guān)系C.有的把握認(rèn)為學(xué)生的學(xué)習(xí)積極性與對(duì)待班級(jí)工作的態(tài)度沒(méi)有關(guān)系D.沒(méi)有充分的證據(jù)顯示學(xué)生的學(xué)習(xí)積極性與對(duì)待班級(jí)工作的態(tài)度有關(guān)系17.某工廠為了對(duì)研發(fā)的一種產(chǎn)品進(jìn)行合理定價(jià),將該產(chǎn)品按事先擬定的價(jià)格進(jìn)行試銷,得到如下數(shù)據(jù):單價(jià)x(元) 9 9.2 9.4 9.6 9.8 10銷量y(件) 100 94 93 90 85 78預(yù)計(jì)在今后的銷售中,銷量與單價(jià)仍然服從這種線性相關(guān)關(guān)系,且該產(chǎn)品的成本是5元/件,為使工廠獲得最大利潤(rùn),該產(chǎn)品的單價(jià)應(yīng)定為( )參考公式:對(duì)于一組數(shù)據(jù),,…,,其回歸直線的斜率和截距的最小二乘估計(jì)分別為,.參考數(shù)據(jù):,.A.9.4元 B.9.5元 C.9.6元 D.9.7元18.(多選)疫苗是為預(yù)防、控制傳染病的發(fā)生、流行,用于人體預(yù)防接種的預(yù)防性生物制品,其前期研發(fā)過(guò)程中,一般都會(huì)進(jìn)行動(dòng)物保護(hù)測(cè)試,為了考察某種疫苗預(yù)防效果,在進(jìn)行動(dòng)物試驗(yàn)時(shí),得到如下統(tǒng)計(jì)數(shù)據(jù):未發(fā)病 發(fā)病 總計(jì)未注射疫苗 30注射疫苗 40總計(jì) 70 30 100附表及公式:0.05 0.025 0.010 0.005 0.0013.841 5.024 6.635 7.879 10.828,其中.現(xiàn)從試驗(yàn)動(dòng)物中任取一只,取得“注射疫苗”的概率為0.5,則下列判斷正確的是( )A.注射疫苗發(fā)病的動(dòng)物數(shù)為10B.某個(gè)發(fā)病的小動(dòng)物為未注射疫苗動(dòng)物的概率為C.能在犯錯(cuò)概率不超過(guò)0.005的前提下,認(rèn)為疫苗有效D.該疫苗的有效率約為80%19.(多選)某小區(qū)2019年12月至2020年12月期間,當(dāng)月在售二手房均價(jià)(單位:萬(wàn)元/平方米)的散點(diǎn)圖如圖所示.(圖中月份代碼1~13分別對(duì)應(yīng)2019年12月2020年12月)根據(jù)散點(diǎn)圖選擇和兩個(gè)模型進(jìn)行擬合,經(jīng)過(guò)數(shù)據(jù)處理得到的兩個(gè)回歸方程分別為和,并得到一些統(tǒng)計(jì)量的值如下表:相關(guān)系數(shù)r 0.9023 0.9723若是樣本數(shù)據(jù)中x的平均數(shù),是樣本數(shù)據(jù)中y的平均數(shù),則下列說(shuō)法正確的是( )A.當(dāng)月在售二手房均價(jià)y與月份代碼x呈負(fù)相關(guān)關(guān)系B.由估計(jì)2021年3月在售二手房均價(jià)為1.0509萬(wàn)元/平方米C.曲線與都經(jīng)過(guò)點(diǎn)D.模型的擬合效果比模型好20.用模型去擬合一組數(shù)據(jù)時(shí),為了求出回歸方程,設(shè),求得線性回歸方程為,則k的值為_(kāi)_______.21.為了判斷高二年級(jí)學(xué)生是否選修文科與性別的關(guān)系,現(xiàn)隨機(jī)抽取50名高二年級(jí)學(xué)生,得到如下列聯(lián)表.理科 文科男 13 10女 7 20已知,.根據(jù)表中數(shù)據(jù),得到,則認(rèn)為學(xué)生選修文科與性別有關(guān)系出錯(cuò)的可能性為_(kāi)__________.22.2023年春節(jié)到來(lái)之前,某市物價(jià)部門對(duì)本市5家商場(chǎng)的某種商品一天的銷售量及其價(jià)格進(jìn)行調(diào)查,5家商場(chǎng)的這種商品的價(jià)格x(單位:元/件)與銷售量y(單位:件)之間的一組數(shù)據(jù)如下表所示:價(jià)格x 8 9.5 m 10.5 12銷售量y 16 n 8 6 5經(jīng)分析知,銷售量y(件)與價(jià)格x(元/件)之間有較強(qiáng)的線性關(guān)系,其線性回歸方程為,且,則__________.23.今年以來(lái),人們的出行需求持續(xù)釋放,各種旅游項(xiàng)目態(tài)勢(shì)火爆,旅游預(yù)訂人數(shù)也開(kāi)始增多.某調(diào)查組對(duì)400名不同年齡段的游客進(jìn)行了問(wèn)卷調(diào)查,其中有200名游客進(jìn)行了預(yù)訂,這200名游客中各年齡段所占百分比如圖所示:年齡在19~35歲的人群稱為青年人群,已知在所調(diào)查的游客中隨機(jī)抽取1人,抽到無(wú)預(yù)訂的青年游客的概率為.(1)請(qǐng)將下面的列聯(lián)表補(bǔ)充完整,并判斷能否在犯錯(cuò)誤的概率不超過(guò)0.001的前提下,認(rèn)為旅游預(yù)訂與是不是青年有關(guān);有預(yù)訂游客 無(wú)預(yù)訂游客 合計(jì)青年非青年合計(jì)(2)按照分層抽樣的方法,從有預(yù)訂游客中選取5人,再?gòu)倪@5人中任意選取3人,求3人中至少有2人是青年游客的概率.附:,其中.0.05 0.010 0.0013.841 6.635 10.82824.網(wǎng)購(gòu)是人們重要的購(gòu)物方式,截至2021年12月,我國(guó)網(wǎng)絡(luò)購(gòu)物用戶規(guī)模達(dá)8.42億,較2020年12月增長(zhǎng)5968萬(wàn),占網(wǎng)民整體的.某電商對(duì)其旗下的一家專營(yíng)店近五年來(lái)每年的利潤(rùn)額y(單位:萬(wàn)元)與年份序號(hào)t(按時(shí)間先后順序排)進(jìn)行了統(tǒng)計(jì),并得到如下數(shù)據(jù):t 1 2 3 4 5y 2.6 3.1 4.5 6.8 8.0(1)依據(jù)表中給出的數(shù)據(jù),是否可用線性回歸模型擬合y與t的關(guān)系?請(qǐng)計(jì)算相關(guān)系數(shù)r并加以說(shuō)明;(計(jì)算結(jié)果精確到0.01,若,則線性相關(guān)程度很高,可用線性回歸模型擬合)(2)試用最小二乘法求出利潤(rùn)額y與時(shí)間t的回歸方程,并估計(jì)當(dāng)時(shí)的利潤(rùn)額.參考公式:,,.參考數(shù)據(jù):,,,.答案以及解析1.答案:C2.答案:C3.答案:C4.答案:不能,理由見(jiàn)解析解析:不能,因?yàn)橐辉€性回歸模型是刻畫數(shù)值變量之間關(guān)系的模型.5.答案:圖見(jiàn)解析,除個(gè)別點(diǎn)外,殘差圖中的點(diǎn)比較均勻地集中在以橫軸為對(duì)稱軸的水平帶狀區(qū)域內(nèi)解析:由例3知,臂展y與身高x正線性相關(guān).由數(shù)據(jù)知,,,,,,經(jīng)驗(yàn)回歸方程為.殘差圖如圖.特點(diǎn):除個(gè)別點(diǎn)外,殘差圖中的點(diǎn)比較均勻地集中在以橫軸為對(duì)稱軸的水平帶狀區(qū)域內(nèi).6.答案:圖見(jiàn)解析解析:畫出散點(diǎn)圖,如圖所示.由散點(diǎn)圖可以看出,年份與成績(jī)正線性相關(guān),所以能用一元線性回歸模型刻畫.7.答案:見(jiàn)解析解析:作出散點(diǎn)圖,如圖.通過(guò)散點(diǎn)圖可知,發(fā)現(xiàn)散點(diǎn)落在某條曲線附近.設(shè)曲線方程為,則,令,則.故可得到新數(shù)據(jù)x 0.00 0.64 1.29 1.93 2.57 3.22 3.86 4.51 5.152.30 2.12 2.00 1.87 1.76 1.65 1.51 1.43 1.34由新數(shù)據(jù)作出散點(diǎn)圖,如圖.發(fā)現(xiàn)散點(diǎn)圖呈現(xiàn)很強(qiáng)的線性相關(guān)關(guān)系.用一元線性回歸模型刻畫新成對(duì)數(shù)據(jù),得到經(jīng)驗(yàn)回歸方程為,將代入,,.又,模型的擬合效果較好,通過(guò)它可以很好的預(yù)測(cè)輪 凹槽深度或汽車行駛里程.8.答案:認(rèn)為服用藥物有效,這個(gè)推斷有可能犯錯(cuò),但犯錯(cuò)的概率不超過(guò)0.05;理由見(jiàn)解析解析:零假設(shè):藥物無(wú)效.由列聯(lián)表數(shù)據(jù)可得,我們推斷不成立,即認(rèn)為藥物有效,該推斷犯錯(cuò)誤的概率不超過(guò)0.05.又未服用者未患病和患病的頻率分別為,,服用者未患病和患病的頻率分別為,,所以未服用者患病的頻率約為服用者患病頻率的1.58倍,即未服用者患病的概率大.因此我們認(rèn)為服用藥物有效,這個(gè)推斷有可能犯錯(cuò),但犯錯(cuò)的概率不超過(guò)0.05.9.答案:(1)有線性趨勢(shì),散點(diǎn)圖中的散點(diǎn)呈正相關(guān)關(guān)系(2)見(jiàn)解析解析:(1)散點(diǎn)圖如下:由散點(diǎn)圖知,1月與7月的平均高溫有線性趨勢(shì),散點(diǎn)圖中的散點(diǎn)呈正相關(guān)關(guān)系.(2)根據(jù)最小二乘法可得經(jīng)驗(yàn)回歸方程為.由方程可知,一段1月平均高溫越高,7月平均高溫越高,并且北方城市的1月平均高溫與7月平均高溫低于南方城市的1月平均高溫和7月平均高溫.10.答案:D解析:因?yàn)椋曰貧w直線過(guò)點(diǎn),故,即,所以.將代入中,得.故選D.11.答案:C解析:因?yàn)椋杂械陌盐照J(rèn)為兩個(gè)變量有關(guān)系.故選C.12.答案:C解析:由題意可知,,,將代入,即,解得,所以,當(dāng)時(shí),,所以該數(shù)據(jù)的殘差為.故選C.13.答案:C解析:計(jì)算得,經(jīng)查對(duì)臨界值表知,有的把握說(shuō)患肺病與吸煙有關(guān),故選C.14.答案:C解析:根據(jù)題表中的數(shù)據(jù),可得,易知,,解得,故A中結(jié)論正確;由線性回歸方程中x的系數(shù)大于0,可知y與x正相關(guān),且相關(guān)系數(shù),故B中結(jié)論正確,C中結(jié)論錯(cuò)誤;當(dāng)時(shí),,故D中結(jié)論正確.故選C.15.答案:C解析:根據(jù)公式,得,又且,,求得當(dāng)或9時(shí)滿足題意.故選C.16.答案:A解析:因?yàn)椋杂械陌盐照J(rèn)為學(xué)生的學(xué)習(xí)積極性與對(duì)待班級(jí)工作的態(tài)度有關(guān)系,故選A.17.答案:B解析:由題意,得,,,,則.設(shè)工廠獲得利潤(rùn)L元,則,當(dāng)時(shí),L取得最大值.所以當(dāng)單價(jià)定為9.5元時(shí),工廠獲得最大利潤(rùn),故選B.18.答案:ABD解析:完善列聯(lián)表如下:未發(fā)病 發(fā)病 總計(jì)未注射疫苗 30 20 50注射疫苗 40 10 50總計(jì) 70 30 100由列聯(lián)表知,A正確,,B正確,,不能在犯錯(cuò)的概率不超過(guò)0.005的前提下,認(rèn)為疫苗有效,C錯(cuò)誤;疫苗的有效率約為,D正確.故選ABD.19.答案:BD解析:對(duì)于A,由題圖可知,散點(diǎn)呈從左下到右上方向發(fā)展的趨勢(shì),所以當(dāng)月在售二手房均價(jià)y與月份代碼x具有正相關(guān)關(guān)系,故A不正確;對(duì)于B,2021年3月對(duì)應(yīng)的月份代碼為16,當(dāng)時(shí),,所以可以估計(jì)2021年3月在售二手房均價(jià)為1.0509萬(wàn)元/平方米,故B正確;對(duì)于C,非線性回歸曲線不一定經(jīng)過(guò)點(diǎn),故C不正確;對(duì)于D,越大,擬合效果越好,由,知D正確.故選BD.20.答案:0.3解析:由題意知,,故,設(shè),求得線性回歸方程為,兩式相比較,得,故答案為0.3.21.答案:解析:,且,認(rèn)為學(xué)生選修文科與性別有關(guān)系出錯(cuò)的可能性為.22.答案:10解析:由題表中的數(shù)據(jù),得,,將代入,得,即,所以,又因?yàn)椋?br/>所以,.23.答案:(1)能在犯錯(cuò)誤的概率不超過(guò)0.001的前提下,認(rèn)為旅游預(yù)訂與是不是青年有關(guān)(2)解析:(1)在200名有預(yù)訂游客中,青年游客的人數(shù)為;在200名無(wú)預(yù)訂游客中,青年游客的人數(shù)為.可知列聯(lián)表如下:有預(yù)訂游客 無(wú)預(yù)訂游客 合計(jì)青年 120 75 195非青年 80 125 205合計(jì) 200 200 400所以,所以能在犯錯(cuò)誤的概率不超過(guò)0.001的前提下,認(rèn)為旅游預(yù)訂與是不是青年有關(guān).(2)按分層抽樣,從有預(yù)訂游客中選取5人,其中青年游客的人數(shù)為,非青年游客的人數(shù)為2,所以從這5人中任意選取3人,其中至少有2人是青年游客的概率.24.答案:(1),故y與t的線性相關(guān)程度很高,可以用線性回歸模型擬合(2)回歸方程,利潤(rùn)額為10.8萬(wàn)元解析:(1)由題表,得,.因?yàn)椋?br/>所以.故y與t的線性相關(guān)程度很高,可以用線性回歸模型擬合.(2)由(1)知,,,所以,,所以.當(dāng)時(shí),.所以估計(jì)當(dāng)時(shí)的利潤(rùn)額為10.8萬(wàn)元.重難知識(shí)易混易錯(cuò)【重難知識(shí)】1.變量間的相關(guān)關(guān)系(1)常見(jiàn)的兩變量之間的關(guān)系有兩類:一類是函數(shù)關(guān)系,另一類是相關(guān)關(guān)系.與函數(shù)關(guān)系不同,相關(guān)關(guān)系是一種非確定性關(guān)系.(2)在散點(diǎn)圖中,點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),兩個(gè)變量的這種相關(guān)關(guān)系稱為正相關(guān),點(diǎn)散布在從左上角到右下角的區(qū)域內(nèi),兩個(gè)變量的相關(guān)關(guān)系稱為負(fù)相關(guān).2.兩個(gè)變量的線性相關(guān)(1)從散點(diǎn)圖上看,如果這些點(diǎn)從整體上看大致分布在通過(guò)散點(diǎn)圖中心的一條直線附近,稱兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線.(2)回歸直線方程①最小二乘法:通過(guò)求的最小值而得到回歸直線的方法,即使得樣本數(shù)據(jù)的點(diǎn)到回歸直線的距離的平方和最小的方法叫做最小二乘法.②回歸方程:方程是兩個(gè)具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù)的回歸方程,其中是待定參數(shù).,其中稱為樣本點(diǎn)的中心.(3)相關(guān)系數(shù)r①;②當(dāng)時(shí),表明兩個(gè)變量正相關(guān);當(dāng)時(shí),表明兩個(gè)變量負(fù)相關(guān).r的絕對(duì)值越接近于1,表明兩個(gè)變量的線性相關(guān)性越強(qiáng);r的絕對(duì)值越接近于0,表明兩個(gè)變量之間幾乎不存在線性相關(guān)關(guān)系.當(dāng)r的絕對(duì)值大于或等于0.75時(shí),認(rèn)為兩個(gè)變量有很強(qiáng)的線性相關(guān)關(guān)系.(4)回歸分析是對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法.在線性回歸模型中,因變量y的值由自變量x和隨機(jī)誤差e共同確定,即自變量x只能解釋部分y的變化,在統(tǒng)計(jì)中,我們把自變量x稱為解釋變量,因變量y稱為預(yù)報(bào)變量.3.分類變量:變量的不同“值”表示個(gè)體所屬的不同類別,像這樣的變量稱為分類變量.4.列聯(lián)表:列出兩個(gè)分類變量的頻數(shù)表,稱為列聯(lián)表.假設(shè)有兩個(gè)分類變量X和Y,它們的可能取值分別為和,其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為:總計(jì)a bc d總計(jì)可構(gòu)造一個(gè)隨機(jī)變量,其中為樣本容量.5.獨(dú)立性檢驗(yàn)利用獨(dú)立性假設(shè)、隨機(jī)變量來(lái)確定是否有一定把握認(rèn)為“兩個(gè)分類變量有關(guān)系”的方法稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn).兩個(gè)分類變量X和Y是否有關(guān)系的判斷標(biāo)準(zhǔn):統(tǒng)計(jì)學(xué)研究表明:當(dāng)時(shí),認(rèn)為X與Y無(wú)關(guān);當(dāng)時(shí),有95%的把握說(shuō)X與Y有關(guān);當(dāng)時(shí),有99%的把握說(shuō)X與Y有關(guān);當(dāng)時(shí),有99.9%的把握說(shuō)X與Y有關(guān).【典型例題】1.已知某產(chǎn)品的營(yíng)銷費(fèi)用x(單位:萬(wàn)元)與銷售額y(單位:萬(wàn)元)的統(tǒng)計(jì)數(shù)據(jù)如表所示:營(yíng)銷費(fèi)用x/萬(wàn)元 2 3 4 5銷售額y/萬(wàn)元 15 20 30 35根據(jù)上表可得y關(guān)于x的回歸直線方程為,則當(dāng)該產(chǎn)品的營(yíng)銷費(fèi)用為6萬(wàn)元時(shí),銷售額為( )A.40.5萬(wàn)元 B.41.5萬(wàn)元 C.42.5萬(wàn)元 D.45萬(wàn)元2.(多選)已知某中學(xué)的高中女生體重y(單位:kg)與身高x(單位;cm)具有線性相關(guān)關(guān)系,根據(jù)一組樣本數(shù)據(jù),由最小二乘法近似得到y(tǒng)關(guān)于x的回歸直線方程為,則下列結(jié)論中正確的是()A.y與x是正相關(guān)的B.該回歸直線必過(guò)點(diǎn)C.若該中學(xué)某高中女生身高增加1cm,則其體重約增加0.85kgD.若該中學(xué)某高中女生身高為160cm,則其體重必為50.29kg3.某班班主任對(duì)全班50名學(xué)生進(jìn)行了喜歡玩電腦游戲與認(rèn)為作業(yè)多少是否有關(guān)系的調(diào)查,所得數(shù)據(jù)如下表:認(rèn)為作業(yè)多 認(rèn)為作業(yè)不多 總計(jì)喜歡玩電腦游戲 18 9 27不喜歡玩電腦游戲 8 15 23總計(jì) 26 24 50根據(jù)以上數(shù)據(jù)得__________(結(jié)果保留到小數(shù)點(diǎn)后三位).由此得出結(jié)論:喜歡玩電腦游戲與認(rèn)為作業(yè)多少有關(guān)系的把握為_(kāi)________%.4.銷售費(fèi)用預(yù)算是以銷售收入預(yù)算為基礎(chǔ),通過(guò)分析銷售收入、銷售利潤(rùn)和銷售費(fèi)用的關(guān)系,力求實(shí)現(xiàn)銷售費(fèi)用的最有效使用.根據(jù)往年的相關(guān)數(shù)據(jù)顯示,某高新技術(shù)企業(yè)的年銷售費(fèi)用占年銷售收入的為合理區(qū)間,當(dāng)年銷售費(fèi)用超出年銷售收入的,說(shuō)明企業(yè)的銷售環(huán)節(jié)出現(xiàn)一定的問(wèn)題,需要加強(qiáng)銷售管理.下表為該企業(yè)的年銷售費(fèi)用x(單位:千萬(wàn)元)和年銷售收入y(單位:千萬(wàn)元)的相關(guān)數(shù)據(jù):2017 2018 2019 2020 2021 2022x 3 5 6 8 9 11y 31 50 54 86 85 114(1)求年銷售費(fèi)用x的方差.(2)通過(guò)數(shù)據(jù)分析,該企業(yè)的年銷售用x與年銷售收入y之間符合線性相關(guān)關(guān)系,求出線性回歸方程.(3)若該企業(yè)2023年預(yù)算年銷售費(fèi)用為12千萬(wàn)元,試預(yù)測(cè)2023年的年銷售收入,并判斷2023年的年銷售費(fèi)用預(yù)測(cè)值是否在合理區(qū)間內(nèi).(精確到0.01千萬(wàn)元)參考數(shù)據(jù):374.參考公式:,,,.5.為響應(yīng)國(guó)家在《“十四五”工業(yè)綠色發(fā)展規(guī)劃》中提出的“推動(dòng)綠色發(fā)展,促進(jìn)人與自然和諧共生”理念,某企業(yè)計(jì)劃生產(chǎn)一批太陽(yáng)能電池板,現(xiàn)有甲、乙兩種生產(chǎn)工藝可供選擇.為了解兩種生產(chǎn)工藝所生產(chǎn)的電池板的質(zhì)量情況,從中各隨機(jī)抽取100件進(jìn)行質(zhì)量檢測(cè),得到如下所示的頻率分布直方圖.并規(guī)定:綜合得分質(zhì)量等級(jí) 二等品 一等品(1)從這100個(gè)甲工藝所生產(chǎn)的電池板中按質(zhì)量等級(jí)分層抽樣抽取4個(gè),再?gòu)倪@4個(gè)中隨機(jī)抽取2個(gè)做進(jìn)一步研究,求恰有1個(gè)質(zhì)量等級(jí)為一等品電池板的概率;(2)根據(jù)頻率分布直方圖完成下面的列聯(lián)表,并判斷是否有的把握認(rèn)為電池板的質(zhì)量等級(jí)與生產(chǎn)工藝有關(guān) 一等品 二等品甲生產(chǎn)工藝乙生產(chǎn)工藝附:0.050 0.010 0.001k 3.841 6.635 10.828答案以及解析1.答案:C解析:由題中表格數(shù)據(jù)可知,,因?yàn)榛貧w直線一定經(jīng)過(guò)點(diǎn),所以,解得,所以回歸直線方程為,將代入,得.所以當(dāng)該產(chǎn)品的營(yíng)銷費(fèi)用為6萬(wàn)元時(shí),銷售額為42.5萬(wàn)元.故選:C.2.答案:ABC解析:根據(jù)y關(guān)于x的回歸直線方程,易知y與x是正相關(guān)的,所以A正確;回歸直線過(guò)點(diǎn),所以B正確;根據(jù)回歸直線方程的斜率為0.85,可知該中學(xué)某高中女生身高增加1cm,其體重約增加0.85kg,所以C正確;回歸直線方程確定之后只能用于預(yù)測(cè),所以D錯(cuò)誤.故選ABC.3.答案:5.059;95解析:由的計(jì)算公式可得.,有95%的把握認(rèn)為二者有關(guān)系.4.答案:(1)(2)(3)2023年的年銷隺費(fèi)用預(yù)測(cè)值在合理區(qū)間內(nèi)解析:(1)由已知,得,所以.(2)因?yàn)椋?br/>所以.由題表中的數(shù)據(jù),得.又因?yàn)椋裕?br/>所以,所以該企業(yè)的年銷售費(fèi)用x與年銷售收入y之間的線性回歸方程為.(3)由(2)可得2023年的年銷售收入的預(yù)測(cè)值(千萬(wàn)元).所以2023年的年銷售費(fèi)用預(yù)測(cè)值在合理區(qū)間內(nèi).5.答案:(1)(2)有的把握認(rèn)為電池板的質(zhì)量等級(jí)與生產(chǎn)工藝有關(guān)解析:(1)根據(jù)綜合得分與質(zhì)量等級(jí)的關(guān)系,結(jié)合頻率分布直方圖可知,甲生產(chǎn)工藝所生產(chǎn)的100件產(chǎn)品中,一等品有件,二等品有件,從這100個(gè)甲工藝所生產(chǎn)的電池板中按質(zhì)量等級(jí)分層抽樣抽取4個(gè),則一等品抽取3個(gè),記為A,B,C;二等品抽取1個(gè),記為a.再?gòu)倪@4個(gè)中隨機(jī)抽取2個(gè),所有可能的結(jié)果為AB,AC,Aa,BC,Ba,Ca,共6種,其中恰有1個(gè)質(zhì)量等級(jí)為一等品的電池板對(duì)應(yīng)的結(jié)果有Aa,Ba,Ca,共3種,故所求概率為.(2)由(1)可知,甲生產(chǎn)工藝所生產(chǎn)的100件產(chǎn)品中,一等品有75件,二等品有25件;乙生產(chǎn)工藝所生產(chǎn)的100件產(chǎn)品中,一等品有件,二等品有件.得到列聯(lián)表如下:一等品 二等品甲生產(chǎn)工藝 75 25乙生產(chǎn)工藝 45 55故有的把握認(rèn)為電池板的質(zhì)量等級(jí)與生產(chǎn)工藝有關(guān).核心素養(yǎng)對(duì)接高考【核心素養(yǎng)】回歸分析在高考中考查較多,主要考查求回歸方程、利用回歸方程進(jìn)行預(yù)測(cè),一般以解答題的形式出現(xiàn),難度中等,有時(shí)也以小題形式出現(xiàn),考查變量的相關(guān)性;對(duì)于獨(dú)立性檢驗(yàn),一般以解答題中的一問(wèn)進(jìn)行考查,多與概率知識(shí)結(jié)合命題,特別是以社會(huì)現(xiàn)實(shí)問(wèn)題為背景的統(tǒng)計(jì)、統(tǒng)計(jì)案例與概率相結(jié)合的綜合題是今后命題的重點(diǎn)與難點(diǎn),這與新課標(biāo)對(duì)數(shù)據(jù)分析核心素養(yǎng)的要求密切相關(guān).【真題對(duì)接】1.【2022年新高考Ⅰ卷】一醫(yī)療團(tuán)隊(duì)為研究某地的一種地方性疾病與當(dāng)?shù)鼐用竦男l(wèi)生習(xí)慣(衛(wèi)生習(xí)慣分為良好和不夠良好兩類)的關(guān)系,在已患該疾病的病例中隨機(jī)調(diào)查了100例(稱為病例組),同時(shí)在未患該疾病的人群中隨機(jī)調(diào)查了100人(稱為對(duì)照組),得到如下數(shù)據(jù):不夠良好 良好病例組 40 60對(duì)照組 10 90(1)能否有99%的把握認(rèn)為患該疾病群體與未患該疾病群體的衛(wèi)生習(xí)慣有差異?(2)從該地的人群中任選一人,A表示事件“選到的人衛(wèi)生習(xí)慣不夠良好”,B表示事件“選到的人患有該疾病”,與的比值是衛(wèi)生習(xí)慣不夠良好對(duì)患該疾病風(fēng)險(xiǎn)程度的一項(xiàng)度量指標(biāo),記該指標(biāo)為R.(ⅰ)證明:;(ⅱ)利用該調(diào)查數(shù)據(jù),給出,的估計(jì)值,并利用(ⅰ)的結(jié)果給出R的估計(jì)值.附:,0.050 0.010 0.001k 3.841 6.635 10.8282.【2020年新高考Ⅰ卷】為加強(qiáng)環(huán)境保護(hù),治理空氣污染,環(huán)境監(jiān)測(cè)部門對(duì)某市空氣質(zhì)量進(jìn)行調(diào)研,隨機(jī)抽查了100天空氣中的和濃度(單位:),得下表:32 18 46 8 123 7 10(1)估計(jì)事件“該市一天空氣中濃度不超過(guò)75,且濃度不超過(guò)150”的概率;(2)根據(jù)所給數(shù)據(jù),完成下面的列聯(lián)表:(3)根據(jù)(2)中的列聯(lián)表,判斷是否有99%的把握認(rèn)為該市一天空氣中濃度與濃度有關(guān).附:,0.050 0.010 0.0013.841 6.635 10.828答案以及解析1.解析:(1).因?yàn)椋?br/>所以有的把握認(rèn)為患該疾病群體與未患該疾病群體的衛(wèi)生習(xí)慣有差異.(2)(ⅰ).(ⅱ)由調(diào)查數(shù)據(jù)得,病例組中衛(wèi)生習(xí)慣不夠良好的頻率為,對(duì)照組中衛(wèi)生習(xí)慣不夠良好的頻率為,所以的估計(jì)值為0.4,的估計(jì)值為0.1.的估計(jì)值為0.6,的估計(jì)值為0.9,利用(ⅰ)的結(jié)果可得R的估計(jì)值為.2.解析:(1)根據(jù)抽查數(shù)據(jù),該市100天的空氣中濃度不超過(guò)75,且濃度不超過(guò)150的天數(shù)為,因此,該市一天空氣中濃度不超過(guò)75,且濃度不超過(guò)150的概率的估計(jì)值為.(2)根據(jù)抽查數(shù)據(jù),可得列聯(lián)表:64 1610 10(3)根據(jù)(2)的列聯(lián)表得.由于,故有99%的把握認(rèn)為該市一天空氣中濃度與濃度有關(guān). 展開(kāi)更多...... 收起↑ 資源預(yù)覽 縮略圖、資源來(lái)源于二一教育資源庫(kù)