資源簡(jiǎn)介 8.3.1分類變量與列聯(lián)表 導(dǎo)學(xué)案學(xué)習(xí)目標(biāo)(1)了解分類變量與數(shù)值變量的區(qū)別.(2)了解回歸與相關(guān)的區(qū)別.(3)通過實(shí)例,理解通過比較相關(guān)比率,利用2×2列聯(lián)表或等高圖可以初步檢驗(yàn)兩個(gè)隨機(jī)變量的獨(dú)立性.(4)通過對(duì)建立回歸分析模型步驟的回憶,獲得分析統(tǒng)計(jì)案例的一般性過程;能夠?qū)⒀芯拷y(tǒng)計(jì)案例的一般化步驟應(yīng)用到新的統(tǒng)計(jì)案例中.(5)理解通過比較相關(guān)比率判斷隨機(jī)變量獨(dú)立性得到的結(jié)果有可能會(huì)犯錯(cuò)誤.重點(diǎn)難點(diǎn)1.重點(diǎn):(1)通過案例的分析研究,展現(xiàn)統(tǒng)計(jì)中數(shù)據(jù)分析的全過程.(2)讓學(xué)生體會(huì)分析分類變量關(guān)聯(lián)性的方法,并意識(shí)到這種分析得到的結(jié)果有可能是錯(cuò)誤的.2.難點(diǎn):分析清楚回歸與相關(guān)的區(qū)別.課前預(yù)習(xí) 自主梳理知識(shí)點(diǎn)一 分類變量為了表述方便,我們經(jīng)常會(huì)使用一種特殊的隨機(jī)變量,以區(qū)別不同的現(xiàn)象或性質(zhì),這類隨機(jī)變量稱為分類變量.分類變量的取值可以用實(shí)數(shù)表示.知識(shí)點(diǎn)二 2×2列聯(lián)表1.2×2列聯(lián)表給出了成對(duì)分類變量數(shù)據(jù)的交叉分類頻數(shù).2.定義一對(duì)分類變量X和Y,我們整理數(shù)據(jù)如下表所示:X Y 合計(jì)Y=0 Y=1X=0 a b a+bX=1 c d c+d合計(jì) a+c b+d n=a+b+c+d像這種形式的數(shù)據(jù)統(tǒng)計(jì)表稱為2×2列聯(lián)表.知識(shí)點(diǎn)三 獨(dú)立性檢驗(yàn)1.定義:利用χ2的取值推斷分類變量X和Y是否獨(dú)立的方法稱為χ2獨(dú)立性檢驗(yàn),讀作“卡方獨(dú)立性檢驗(yàn)”.簡(jiǎn)稱獨(dú)立性檢驗(yàn).2.χ2=,其中n=a+b+c+D.3.獨(dú)立性檢驗(yàn)解決實(shí)際問題的主要環(huán)節(jié)(1)提出零假設(shè)H0:X和Y相互獨(dú)立,并給出在問題中的解釋.(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計(jì)算χ2的值,并與臨界值xα比較.(3)根據(jù)檢驗(yàn)規(guī)則得出推斷結(jié)論.(4)在X和Y不獨(dú)立的情況下,根據(jù)需要,通過比較相應(yīng)的頻率,分析X和Y間的影響規(guī)律.自主檢測(cè)1.判斷正誤,正確的寫“正確”,錯(cuò)誤的寫“錯(cuò)誤”.(1)分類變量中的變量與函數(shù)中的變量是同一概念.( )(2)列聯(lián)表中的數(shù)據(jù)是兩個(gè)分類變量的頻數(shù).( )(3)列聯(lián)表、頻率分析法、等高條形圖都可初步分析兩分類變量是否有關(guān)系.( )(4)列聯(lián)表只有4個(gè)格子. ( )(5)的大小是判斷事件A與B是否相關(guān)的統(tǒng)計(jì)量.( )(6)當(dāng)時(shí)有的把握說事件A與B有關(guān).( )2.下列關(guān)于獨(dú)立性檢驗(yàn)的敘述:①常用等高條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征;②獨(dú)立性檢驗(yàn)依據(jù)小概率原理;③樣本不同,獨(dú)立性檢驗(yàn)的結(jié)論可能有差異;④對(duì)分類變量與的隨機(jī)變量的觀測(cè)值來說,越小,與有關(guān)系的把握程度就越大.其中正確的個(gè)數(shù)為A.1 B.2 C.3 D.43.隨著國家二孩政策的全面放開,為了調(diào)查一線城市和非一線城市的二孩生育意愿,某機(jī)構(gòu)用簡(jiǎn)單隨機(jī)抽樣方法從不同地區(qū)調(diào)查了100位育齡婦女,結(jié)果如下表.非一線 一線 總計(jì)愿生 45 20 65不愿生 13 22 35總計(jì) 58 42 100計(jì)算得,.參照下表,0.050 0.010 0.0013.841 6.635 10.828下列結(jié)論正確的是( )A.在犯錯(cuò)誤的概率不超過的前提下,認(rèn)為“生育意愿與城市級(jí)別有關(guān)”B.在犯錯(cuò)誤的概率不超過的前提下,認(rèn)為“生育意愿與城市級(jí)別無關(guān)”C.有以上的把握認(rèn)為“生育意愿與城市級(jí)別有關(guān)”D.有以上的把握認(rèn)為“生育意愿與城市級(jí)別無關(guān)”4.某學(xué)校為了制定治理學(xué)校門口上學(xué)、放學(xué)期間家長(zhǎng)接送孩子亂停車現(xiàn)象的措施,對(duì)全校學(xué)生家長(zhǎng)進(jìn)行了問卷調(diào)查.根據(jù)從中隨機(jī)抽取的50份調(diào)查問卷,得到了如下的列聯(lián)表:同意限定區(qū)域停車 不同意限定區(qū)域停車 合計(jì)男 20 5 25女 10 15 25合計(jì) 30 20 50附:0.010 0.005 0.0016.635 7.879 10.828則認(rèn)為“是否同意限定區(qū)域停車與家長(zhǎng)性別有關(guān)”的把握約為( )A.0. 1% B.0.5% C.99.5% D.99.9%5.為大力提倡“厲行節(jié)約,反對(duì)浪費(fèi)”,某市通過隨機(jī)詢問100名性別不同的居民是否能做到“光盤”行動(dòng),得到如下列聯(lián)表:做不到“光盤” 能做到“光盤”男 45 10女 30 15附:參照附錄,得到的正確結(jié)論是( )A.在犯錯(cuò)誤的概率不超過的前提下,認(rèn)為“該市居民能否做到‘光盤’與性別有關(guān)”B.在犯錯(cuò)誤的概率不超過的前提下,認(rèn)為“該市居民能否做到‘光盤’與性別有關(guān)”C.有以上的把握認(rèn)為“該市居民能否做到‘光盤’與性別無關(guān)”D.有以上的把握認(rèn)為“該市居民能否做到‘光盤’與性別有關(guān)”新課導(dǎo)學(xué)學(xué)習(xí)探究環(huán)節(jié)一 創(chuàng)設(shè)情境,引入課題飲用水的質(zhì)量是人類普遍關(guān)心的問題.根據(jù)統(tǒng)計(jì),飲用優(yōu)質(zhì)水的518人中,身體狀況優(yōu)秀的有466人,飲用一般水的312人中,身體狀況優(yōu)秀的有218人.問題人的身體健康狀況與飲用水的質(zhì)量之間有關(guān)系嗎?提示我們可以根據(jù)2×2列聯(lián)表來判斷人的身體健康狀況與飲用水的質(zhì)量之間的關(guān)系.也就是本節(jié)課所要學(xué)習(xí)的內(nèi)容.前面兩節(jié)所討論的變量,如人的身高、樹的胸徑、樹的高度、短跑100m世界紀(jì)錄和創(chuàng)紀(jì)錄的時(shí)間等,都是數(shù)值變量.數(shù)值變量的取值為實(shí)數(shù),其大小和運(yùn)算都有實(shí)際含義.在現(xiàn)實(shí)生活中,人們經(jīng)常需要回答一定范圍內(nèi)的兩種現(xiàn)象或性質(zhì)之間是否存在關(guān)聯(lián)性或相互影響的問題.例如,就讀不同學(xué)校是否對(duì)學(xué)生的成績(jī)有影響,不同班級(jí)學(xué)生用于體育鍛煉的時(shí)間是否有差別,吸煙是否會(huì)增加患肺癌的風(fēng)險(xiǎn),等等.本節(jié)將要學(xué)習(xí)的獨(dú)立性檢驗(yàn)方法為我們提供了解決這類問題的方案.在討論上述問題時(shí),為了表述方便,我們經(jīng)常會(huì)使用一種特殊的隨機(jī)變量,以區(qū)別不同的現(xiàn)象或性質(zhì),這類隨機(jī)變量稱為分類變量.分類變量的取值可以用實(shí)數(shù)表示,例如,學(xué)生所在的班級(jí)可以用1,2,3等表示,男性、女性可以用1,0表示,等等.在很多時(shí)候,這些數(shù)值只作為編號(hào)使用,并沒有通常的大小和運(yùn)算意義.本節(jié)我們主要討論取值于{0,1}的分類變量的關(guān)聯(lián)性問題.如何利用統(tǒng)計(jì)數(shù)據(jù)判斷一對(duì)分類變量之間是否具有關(guān)聯(lián)性呢?對(duì)于這樣的統(tǒng)計(jì)問題,有時(shí)可以利用普查數(shù)據(jù),通過比較相關(guān)的比率給出問題的準(zhǔn)確回答,但在大多數(shù)情況下,需要借助概率的觀點(diǎn)和方法.我們先看下面的具體問題.【設(shè)計(jì)意圖】理解數(shù)值變量與分類變量的區(qū)別對(duì)理解回歸分析法與相關(guān)分析法的區(qū)別起著至關(guān)要的作用,概念解析1的設(shè)計(jì)意圖即是幫助理解回歸分析法與相關(guān)分析法的區(qū)別,為突破這一教學(xué)難點(diǎn)做鋪墊.問題 為了有針對(duì)性地提高學(xué)生體育鍛煉的積極性,某中學(xué)需要了解性別因素是否對(duì)本校學(xué)生體育鍛煉的經(jīng)常性有影響,為此對(duì)學(xué)生是否經(jīng)常鍛煉的情況進(jìn)行了普查.全校學(xué)生的普查數(shù)據(jù)如下:523名女生中有331名經(jīng)常鍛煉;601名男生中有473名經(jīng)常鍛煉.你能利用這些數(shù)據(jù),說明該校女生和男生在體育鍛煉的經(jīng)常性方面是否存在差異嗎?這是一個(gè)簡(jiǎn)單的統(tǒng)計(jì)問題.最直接的解答方法是,比較經(jīng)常鍛煉的學(xué)生在女生和男生中的比率.為了方便,我們?cè)O(shè),.那么,只要求出和的值,通過比較這兩個(gè)值的大小,就可以知道女生和男生在鍛煉的經(jīng)常性方面是否有差異,由所給的數(shù)據(jù),經(jīng)計(jì)算得到,.由可知,男生經(jīng)常鍛煉的比率比女生高出15.4個(gè)百分點(diǎn),所以該校的女生和男生在體育鍛煉的經(jīng)常性方面有差異,而且男生更經(jīng)常鍛煉.【設(shè)計(jì)意圖】給出本節(jié)課第一個(gè)重點(diǎn),判斷兩個(gè)分類變量之間關(guān)聯(lián)關(guān)系的方法1—頻率分析法.環(huán)節(jié)二 觀察分析,感知概念上面的問題還可以通過建立一個(gè)古典概型,使用條件概率的語言,給出另外一種解答方法.用表示該校全體學(xué)生構(gòu)成的集合,這是我們所關(guān)心的對(duì)象的總體.考慮以為樣本空間的古典概型,并定義一對(duì)分類變量X和Y如下:對(duì)于中的每一名學(xué)生,分別令 .【設(shè)計(jì)意圖】給出本節(jié)課第二個(gè)重點(diǎn),判斷兩個(gè)分類變量之間關(guān)聯(lián)關(guān)系方法1的另外一種表述方法—使用條件概率的語言,給出解答.環(huán)節(jié)三 抽象概括,形成概念我們希望通過比較條件概率和回答上面的問題.按照條件概率的直觀解釋,如果從該校女生和男生中各隨機(jī)選取一名學(xué)生,那么該女生屬于經(jīng)常鍛煉群體的概率是,而該男生屬于經(jīng)常鍛煉群體的概率是.因此,“性別對(duì)體育鍛煉的經(jīng)常性沒有影響”可以描述為;而“性別對(duì)體育鍛煉的經(jīng)常性有影響”可以描述為.為了清楚起見,我們用表格整理數(shù)據(jù),如表8.3-1所示.表8.3-1 單位:人性別 鍛煉 合計(jì)不經(jīng)常(Y=0) 經(jīng)常(Y=1)女生(X=0) 192 331 523男生(X=1) 128 473 601合計(jì) 320 804 1124【設(shè)計(jì)意圖】給出本節(jié)課第三個(gè)重點(diǎn),舉例說明什么是2×2列聯(lián)表.我們用表示事件和的積事件,用表示事件和的積事件.根據(jù)古典概型和條件概率的計(jì)算公式,我們有,.由大于可以做出判斷,在該校的學(xué)生中,性別對(duì)體育鍛煉的經(jīng)常性有影響,即該校的女生和男生在體育鍛煉的經(jīng)常性方面存在差異,而且男生更經(jīng)常鍛煉.環(huán)節(jié)四 辨析理解 深化概念在實(shí)踐中,由于保存原始數(shù)據(jù)的成本較高,人們經(jīng)常按研究問題的需要,將數(shù)據(jù)分類統(tǒng)計(jì),并做成表格加以保存.我們將如表8.3-1這種形式的數(shù)據(jù)統(tǒng)計(jì)表稱為列聯(lián)表(contingency table).列聯(lián)表給出了成對(duì)分類變量數(shù)據(jù)的交叉分類頻數(shù).以表8.3-1為例,它包含了X和Y的如下信息:最后一行的前兩個(gè)數(shù)分別是事件和中樣本點(diǎn)的個(gè)數(shù);最后一列的前兩個(gè)數(shù)分別是事件和中樣本點(diǎn)的個(gè)數(shù);中間的四個(gè)格中的數(shù)是表格的核心部分,給出了事件中樣本點(diǎn)的個(gè)數(shù);右下角格中的數(shù)是樣本空間中樣本點(diǎn)的總數(shù).在上面問題的兩種解答中,使用了學(xué)校全部學(xué)生的調(diào)查數(shù)據(jù),利用這些數(shù)據(jù)能夠完全確定解答問題所需的比率和條件概率.然而,對(duì)于大多數(shù)實(shí)際問題,我們無法獲得所關(guān)心的全部對(duì)象的數(shù)據(jù),因此無法準(zhǔn)確計(jì)算出有關(guān)的比率或條件概率.在這種情況下,上述古典概型和條件概率的觀點(diǎn)為我們提供了一個(gè)解決問題的思路.比較簡(jiǎn)單的做法是利用隨機(jī)抽樣獲得一定數(shù)量的樣本數(shù)據(jù),再利用隨機(jī)事件發(fā)生的頻率穩(wěn)定于概率的原理對(duì)問題答案作出推斷.將所關(guān)心的對(duì)象的體看成古典概型的樣本空間,就可以用概率的語言刻畫相關(guān)的問題,進(jìn)而用頻率穩(wěn)定于概率的原理推斷問題的答案.很多統(tǒng)計(jì)方法都是基于這種思想建立起來的.將所關(guān)心的對(duì)象的全體看成古典概型的樣本空間,就可以用概率的語言刻畫相關(guān)的問題,進(jìn)而用頻率穩(wěn)定于概率的原理推斷問題的答案.很多統(tǒng)計(jì)方法都是基于這種思相建立起來的.環(huán)節(jié)五 概念應(yīng)用,鞏固內(nèi)化例1為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡(jiǎn)單隨機(jī)抽樣的方法抽取88名學(xué)生.通過測(cè)驗(yàn)得到了如下數(shù)據(jù):甲校43名學(xué)生中有10名數(shù)學(xué)成績(jī)優(yōu)秀;乙校45名學(xué)生中有7名數(shù)學(xué)成績(jī)優(yōu)秀.試分析兩校學(xué)生中數(shù)學(xué)成績(jī)優(yōu)秀率之間是否存在差異.解:用表示兩所學(xué)校的全體學(xué)生構(gòu)成的集合.考慮以為樣本空間的古典概型.對(duì)于中每一名學(xué)生,定義分類變量和如下: 我們將所給數(shù)據(jù)整理成表8.3-2.學(xué)校 數(shù)學(xué)成績(jī) 合計(jì)不優(yōu)秀(Y=0) 優(yōu)秀(Y=1)甲校(X=0) 33 10 43乙校(X=1) 38 7 45合計(jì) 71 17 88表8.3-2是關(guān)于分類變量和的抽樣數(shù)據(jù)的列聯(lián)表:最后一行的前兩個(gè)數(shù)分別是事件和的頻數(shù);最后一列的前兩個(gè)數(shù)分別是事件和的頻數(shù);中間的四個(gè)格中的數(shù)是事件的頻數(shù);右下角格中的數(shù)是樣本容量.因此,甲校學(xué)生中數(shù)學(xué)成績(jī)不優(yōu)秀和數(shù)學(xué)成績(jī)優(yōu)秀的頻率分別為和.乙校學(xué)生中數(shù)學(xué)成績(jī)不優(yōu)秀和數(shù)學(xué)成績(jī)優(yōu)秀的頻率分別為和.【設(shè)計(jì)意圖】(1)鞏固判斷兩個(gè)分類變量之間關(guān)聯(lián)關(guān)系的方法1—頻率分析法.(2)引出判斷兩個(gè)分類變量之間關(guān)聯(lián)關(guān)系的方法1—圖形分析法.(3)由于頻率和概率之間存在誤差,所以此例題可以說明方法一的局限性,為引出第二節(jié)課,獨(dú)立性檢驗(yàn)做鋪墊.我們可以用等高堆積條形圖直觀地展示上述計(jì)算結(jié)果,如圖8.3-1所示.在圖8.3-1中,左邊的藍(lán)色和紅色條的高度分別是甲校學(xué)生中數(shù)學(xué)成績(jī)不優(yōu)秀和數(shù)學(xué)成績(jī)優(yōu)秀的頻率;右邊的藍(lán)色和紅色條的高度分別是乙校學(xué)生中數(shù)學(xué)成績(jī)不優(yōu)秀和數(shù)學(xué)成績(jī)優(yōu)秀的頻率.通過比較發(fā)現(xiàn),兩個(gè)學(xué)校學(xué)生抽樣數(shù)據(jù)中數(shù)學(xué)成績(jī)優(yōu)秀的頻率存在差異,甲校的頻率明顯高于乙校的頻率.依據(jù)頻率穩(wěn)定于概率的原理,我們可以推斷.也就是說,如果從甲校和乙校各隨機(jī)選取一名學(xué)生,那么甲校學(xué)生數(shù)學(xué)成績(jī)優(yōu)秀的概率大于乙校學(xué)生數(shù)學(xué)成績(jī)優(yōu)秀的概率.因此,可以認(rèn)為兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率存在差異,甲校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率比乙校學(xué)生的高.【設(shè)計(jì)意圖】給出本節(jié)課重點(diǎn),判斷兩個(gè)分類變量之間關(guān)聯(lián)關(guān)系的方法1—圖形分析法.思考:你認(rèn)為“兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率存在差異”這一結(jié)論是否有可能是錯(cuò)誤的?事實(shí)上,“兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率存在差異”這個(gè)結(jié)論是根據(jù)兩個(gè)頻率間存在差異推斷出來的.有可能出現(xiàn)這種情況:在隨機(jī)抽取的這個(gè)樣本中,兩個(gè)頻率間確實(shí)存在差異,但兩校學(xué)生的數(shù)學(xué)成績(jī)優(yōu)秀率實(shí)際上是沒有差別的.這就是說,樣本的隨機(jī)性導(dǎo)致了兩個(gè)頻率間出現(xiàn)較大差異.在這種情況下,我們推斷出的結(jié)論就是錯(cuò)誤的.后面我們將討論犯這種錯(cuò)誤的概率大小問題.環(huán)節(jié)六 歸納總結(jié),反思提升本節(jié)課學(xué)習(xí)的概念有哪些?(1)相關(guān)關(guān)系.(2)散點(diǎn)圖.(3)正相關(guān)、負(fù)相關(guān)、線性相關(guān)、非線性相關(guān).(4)樣本相關(guān)系數(shù).2.方法歸納:數(shù)形結(jié)合.3.常見誤區(qū):相關(guān)關(guān)系與函數(shù)關(guān)系不分,樣本相關(guān)系數(shù)絕對(duì)值的大小與相關(guān)程度的關(guān)系.環(huán)節(jié)七 目標(biāo)檢測(cè),作業(yè)布置完成教材:教材第127頁練習(xí)第4題.備用練習(xí)6.為了考查某種病毒疫苗的效果,現(xiàn)隨機(jī)抽取100只小白鼠進(jìn)行試驗(yàn),得到如下2×2列聯(lián)表:感染 未感染 總計(jì)服用 10 40 50未服用 20 30 50總計(jì) 30 70 100附:,其中.0.10 0.05 0.025 0.010 0.005 0.0012.706 3.841 5.024 6.635 7.879 10.828根據(jù)以上數(shù)據(jù),得到的結(jié)論正確的是( )A.在犯錯(cuò)誤的概率不超過2.5%的前提下,認(rèn)為“小白鼠是否被感染與有沒有服用疫苗有關(guān)”B.在犯錯(cuò)誤的概率不超過2.5%的前提下,認(rèn)為“小白鼠是否被感染與有沒有服用疫苗無關(guān)”C.有95%的把握認(rèn)為“小白鼠是否被感染與有沒有服用疫苗有關(guān)”D.有95%的把握認(rèn)為“小白鼠是否被感染與有沒有服用疫苗無關(guān)”7.已知某產(chǎn)品連續(xù)4個(gè)月的廣告費(fèi)用(千元)與銷售額(萬元),經(jīng)過對(duì)這些數(shù)據(jù)的處理,得到如下數(shù)據(jù)信息:①廣告費(fèi)用和銷售額之間具有較強(qiáng)的線性相關(guān)關(guān)系;②;③回歸直線方程中的=0.8(用最小二乘法求得);那么,廣告費(fèi)用為8千元時(shí),可預(yù)測(cè)銷售額約為( )A.4.5萬元 B.4.9萬元 C.6.3萬元 D.6.5萬元8.以下四個(gè)命題,其中正確的個(gè)數(shù)有( )①由獨(dú)立性檢驗(yàn)可知,有的把握認(rèn)為物理成績(jī)與數(shù)學(xué)成績(jī)有關(guān),某人數(shù)學(xué)成績(jī)優(yōu)秀,則他有的可能物理優(yōu)秀.②兩個(gè)隨機(jī)變量相關(guān)性越強(qiáng),則相關(guān)系數(shù)的絕對(duì)值越接近于;③在線性回歸方程中,當(dāng)解釋變量每增加一個(gè)單位時(shí),預(yù)報(bào)變量平均增加個(gè)單位;④對(duì)分類變量與,它們的隨機(jī)變量的觀測(cè)值來說,越小,“與有關(guān)系”的把握程度越大.A.1 B.2 C.3 D.49.據(jù)一組樣本數(shù)據(jù),…,,求得經(jīng)驗(yàn)回歸方程為,且.現(xiàn)發(fā)現(xiàn)這組樣本數(shù)據(jù)中有兩個(gè)樣本點(diǎn)和誤差較大,去除后重新求得的經(jīng)驗(yàn)回歸直線的斜率為1.2,則( )A.去除兩個(gè)誤差較大的樣本點(diǎn)后,的估計(jì)值增加速度變快B.去除兩個(gè)誤差較大的樣本點(diǎn)后,重新求得的回歸方程一定過點(diǎn)C.去除兩個(gè)誤差較大的樣本點(diǎn)后,重新求得的回歸方程為D.去除兩個(gè)誤差較大的樣本點(diǎn)后,相應(yīng)于樣本點(diǎn)的殘差為0.0510.5G技術(shù)在我國已經(jīng)進(jìn)入高速發(fā)展的階段,5G手機(jī)的銷量也逐漸上升,某手機(jī)商城統(tǒng)計(jì)了最近5個(gè)月手機(jī)的實(shí)際銷量,如下表所示:時(shí)間 1 2 3 4 5銷售量(千只) 0.5 0.8 1.0 1.2 1.5若與線性相關(guān),且線性回歸方程為,則下列說法不正確的是( )A.由題中數(shù)據(jù)可知,變量與正相關(guān),且相關(guān)系數(shù)B.線性回歸方程中C.殘差的最大值與最小值之和為0D.可以預(yù)測(cè)時(shí)該商場(chǎng)手機(jī)銷量約為1.72(千只)試卷第1頁,共3頁試卷第1頁,共3頁參考答案:1. 錯(cuò)誤 正確 正確 錯(cuò)誤 正確 正確【分析】根據(jù)題意,結(jié)合獨(dú)立性檢驗(yàn)的定義,以及統(tǒng)計(jì)圖表的定義,逐項(xiàng)判定,即可求解.【詳解】(1)根據(jù)分類變量的定義,可得分類變量中的變量與函數(shù)中的變量是不是同一概念,故(1)錯(cuò)誤;(2)根據(jù)獨(dú)立性檢驗(yàn)的概念,可得列聯(lián)表中的數(shù)據(jù)是兩個(gè)分類變量的頻數(shù),故(2)正確;(3)由列聯(lián)表、頻率分析法、等高條形圖的概念,可得其都是初步分析兩分類變量是否有關(guān)系,故(3)正確;(4)由的列聯(lián)表不只4個(gè)格子,故(4)錯(cuò)誤;(5)根據(jù)獨(dú)立性檢驗(yàn)的定義,則的大小是判斷事件A與B是否相關(guān)的統(tǒng)計(jì)量,故(5)正確;(6)當(dāng)時(shí),根據(jù)獨(dú)立性檢驗(yàn)的概念,可得的把握說事件A與B有關(guān),故(6)正確.故答案:(1)錯(cuò)誤;(2)正確;(3)正確;(4)錯(cuò)誤;(5)正確;(6)正確.2.C【詳解】分析:根據(jù)獨(dú)立性檢驗(yàn)的定義及思想,可得結(jié)論.詳解:①常用等高條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征;正確;②獨(dú)立性檢驗(yàn)依據(jù)小概率原理;正確;③樣本不同,獨(dú)立性檢驗(yàn)的結(jié)論可能有差異;正確;④對(duì)分類變量與的隨機(jī)變量的觀測(cè)值來說,越大,與有關(guān)系的把握程度就越大.故④錯(cuò)誤.故選C.點(diǎn)睛:本題考查了獨(dú)立性檢驗(yàn)的原理,考查了推理能力,屬于基礎(chǔ)題.3.C【分析】根據(jù)的值與臨界值比較即可判斷進(jìn)而可得正確選項(xiàng).【詳解】因?yàn)椋杂幸陨系陌盐照J(rèn)為“生育意愿與城市級(jí)別有關(guān)”,故選項(xiàng)A、B、D不正確,故選:C.4.C【分析】根據(jù)獨(dú)立性檢驗(yàn)的公式得,進(jìn)而根據(jù)表格即可得答案.【詳解】由題中數(shù)據(jù)可得.又查表可得,所以“是否同意限定區(qū)域停車與家長(zhǎng)性別有關(guān)”的把握約為99.5%.故選:C.5.D【分析】由獨(dú)立性檢驗(yàn)的方法,算出,參照附表即可【詳解】,參照附表,得到的正確結(jié)論是有90%以上的把握認(rèn)為“該市居民能否做到‘光盤’與性別有關(guān)”.故選:D6.C【分析】根據(jù)給定的列聯(lián)表,計(jì)算出的觀測(cè)值,再與臨界值比對(duì)作答.【詳解】依題意,,顯然有,所以有95%的把握認(rèn)為“小白鼠是否被感染與有沒有服用疫苗有關(guān)”,選項(xiàng)A,B,D不正確,C正確.故選:C7.C【分析】由已知可求出,進(jìn)而可求出,即可得到回歸方程,令,可求出答案.【詳解】由題意,,因?yàn)椋裕?br/>則回歸直線方程為.當(dāng)時(shí),.故選C.【點(diǎn)睛】本題考查了線性回歸方程的求法,考查了計(jì)算能力,屬于基礎(chǔ)題.8.B【分析】根據(jù)獨(dú)立性檢驗(yàn)的定義判斷①、④,根據(jù)相關(guān)系數(shù)的概念判斷②,根據(jù)回歸直線方程的性質(zhì)判斷③;【詳解】解:對(duì)于①:認(rèn)為數(shù)學(xué)成績(jī)與物理成績(jī)有關(guān),不出錯(cuò)的概率是,不是數(shù)學(xué)成績(jī)優(yōu)秀,物理成績(jī)就有的可能優(yōu)秀,不正確;對(duì)于②:兩個(gè)隨機(jī)變量相關(guān)性越強(qiáng),則相關(guān)系數(shù)的絕對(duì)值越接近于,故正確;對(duì)于③:在線性回歸方程中,當(dāng)解釋變量每增加一個(gè)單位時(shí),預(yù)報(bào)變量平均增加個(gè)單位,故正確;對(duì)于④,隨機(jī)變量的觀測(cè)值越小,說明兩個(gè)相關(guān)變量有關(guān)系的把握程度越小,不正確;故選:B.9.C【分析】對(duì)A:比較原線性回歸方程的斜率和新回歸方程的斜率,即可求解;對(duì)B:由新的樣本可求解;對(duì)C:由線性回歸方程的性質(zhì),即可求解;對(duì)D:利用殘差公式,即可求解.【詳解】對(duì)A,因?yàn)椋匀コ齼蓚€(gè)誤差較大的樣本點(diǎn)后的估計(jì)值增加速度變慢,故A錯(cuò)誤;對(duì)B,當(dāng)時(shí),,設(shè)去掉兩個(gè)誤差較大的樣本點(diǎn)后,橫坐標(biāo)的平均值為,縱坐標(biāo)的平均值為,則,,故B錯(cuò)誤;對(duì)C,因?yàn)槿コ齼蓚€(gè)誤差較大的樣本點(diǎn)后,重新求得回歸直線的斜率為1.2,所以,解得,所以去除兩個(gè)誤差較大的樣本點(diǎn)后的經(jīng)驗(yàn)回歸方程為,故C正確;對(duì)D,因?yàn)椋裕蔇錯(cuò)誤.故選:C.10.B【分析】根據(jù)已知數(shù)據(jù),分析總體單調(diào)性,并注意到增量不相等,不是嚴(yán)格在一條直線上,從而判定A;求得樣本中心點(diǎn)坐標(biāo),代入已給出的回歸方程,求解,從而判定B;根據(jù)殘差定義求得各個(gè)殘差,進(jìn)而得到殘差的最大值與最小值,從而判定C;利用回歸方程預(yù)測(cè)計(jì)算即可判定D.【詳解】從數(shù)據(jù)看y隨x的增加而增加,故變量與正相關(guān),由于各增量并不相等,故相關(guān)系數(shù),故A正確;由已知數(shù)據(jù)易得代入中得到,故B錯(cuò)誤;,,,,,,,,,,,殘差的最大值與最小值之和為0,故正確;時(shí)該商場(chǎng)手機(jī)銷量約為,故D正確.故選:B答案第1頁,共2頁答案第1頁,共2頁 展開更多...... 收起↑ 資源預(yù)覽 縮略圖、資源來源于二一教育資源庫