資源簡介 8.1 成對數據的統計相關性課標解讀1.理解兩個變量的相關關系的概念.2.會作散點圖,并利用散點圖判斷兩個變量之間是否具有相關關系.3.會根據相關系數判斷兩個變量的相關程度.新知初探·課前預習——突出基礎性教 材 要 點要點一 變量的相關關系1.相關關系:兩個變量有關系,但又沒有確切到可由其中的一個去________決定另一個的程度,這種關系稱為相關關系 .2.散點圖:將樣本中的每一個序號下的成對數據用____________中的點表示出來得到的統計圖.3.正相關與負相關正相關 負相關當一個變量的值增加時,另一個變量的相應值也呈現________的趨勢 當一個變量的值增加時,另一個變量的相應值呈現________的趨勢4.線性相關:如果兩個變量的取值呈現正相關或負相關,而且散點落在________附近,則稱這兩個變量線性相關 .要點二 樣本的相關系數1.相關系數:r==.我們稱r為變量x和變量y的樣本相關系數.2.樣本相關系數r是一個描述成對樣本數據的數字特征,它的正負和絕對值的大小可以反映成對數據的變化特征:(1)當r>0時,稱成對樣本數據________相關;(2)當r<0時,稱成對樣本數據________相關.3.樣本相關系數r 的取值范圍為________,樣本相關系數r的絕對值大小可以反映成對數據之間線性相關的程度:(1)當|r|越接近1時,成對數據的線性相關程度越強;(2)當|r|越接近0時,成對數據的線性相關程度越弱.助 學 批 注批注 相關關系中兩個變量間是一種不確定的關系,若兩個變量間具有確定性關系,即因果關系,則稱之為函數關系.批注 如果兩個變量具有相關性,但不是線性相關,那我們稱這兩個變量非線性相關或曲線相關.批注 樣本相關系數r有時也稱樣本線性相關系數,|r|刻畫了樣本點集中于某條直線的程度.當r=0時,只表明成對樣本數據間沒有線性相關關系,但不排除它們之間有其它相關關系.夯 實 雙 基 1.判斷正誤(正確的畫“√”,錯誤的畫“×”)(1)兩個變量之間產生相關關系的原因受許多不確定的隨機因素的影響.( )(2)樣本的容量對用樣本相關系數估計兩個變量的相關系數的效果沒有影響.( )(3)兩個變量的相關系數越大,它們的相關程度越強.( )(4)若相關系數r=0,則兩變量x,y之間沒有關系.( )2.下列兩個量之間的關系是相關關系的是( )A.勻速直線運動中時間與位移的關系B.學生的成績和身高C.兒童的年齡與體重D.物體的體積和質量3.若變量y與x之間的樣本相關系數r=-0.983 2,則變量y與x之間( )A.具有很弱的線性相關關系B.具有較強的線性相關關系C.它們的線性相關關系還需要進一步確定D.不確定4.如圖所示的兩個變量具有相關關系的是________(填序號).題型探究·課堂解透——強化創新性 題型 1 相關關系的判斷例1 (多選)下列變量之間的關系是相關關系的是( )A.二次函數y=ax2+bx+c中,a,c是已知常數,取b為自變量,因變量是判別式Δ=b2-4acB.光照時間和果樹畝產量C.降雪量和交通事故發生率D.每畝田施肥量和糧食畝產量方法歸納函數關系是一種確定的關系,而相關關系是非隨機變量與隨機變量的關系.函數關系是一種因果關系,而相關關系不一定是因果關系,也可能是伴隨關系.鞏固訓練1 下列兩個變量之間的關系是相關關系的是( )A.正方體的棱長和體積B.單位圓中角的度數和所對弧長C.畝產量為常數時,土地面積和總產量D.日照時間與水稻的畝產量題型 2 線性相關關系的判斷例2 某零售店近5個月的銷售額和利潤額資料如下表所示:商店名稱 A B C D E銷售額x/千萬元 3 5 6 7 9利潤額y/百萬元 2 3 3 4 5(1)根據上表數據作出散點圖;(2)觀察散點圖判斷利潤額y關于銷售額x是否具有線性相關關系.如果具有線性相關關系,那么是正相關還是負相關?方法歸納由散點圖判斷兩個變量正、負相關的方法當散點圖中的點散布在平面直角坐標系中從左下角到右上角的區域時,兩個變量正相關;當散點圖中的點散布在平面直角坐標系中從左上角到右下角的區域時,兩個變量負相關.鞏固訓練2 對變量x,y有觀測數據(xi,yi)(i=1,2,…,10),得散點圖如圖(1);對變量u,v有觀測數據(ui,vi)(i=1,2,…,10),得散點圖如圖(2).由這兩個散點圖可以判斷( )A.變量x與y正相關,u與v正相關B.變量x與y正相關,u與v負相關C.變量x與y負相關,u與v正相關D.變量x與y負相關,u與v負相關題型 3 樣本相關系數的應用例3 互聯網使我們的生活日益便捷,網絡外賣也開始成為不少人日常生活中不可或缺的一部分,某市一調查機構針對該市市場占有率較高的甲、乙兩家網絡外賣企業(以下稱外賣甲、外賣乙)的經營情況進行了調查,調查結果如下表:日期 1日 2日 3日 4日 5日外賣甲日接單:x(百單) 5 2 9 8 11外賣乙日接單:y(百單) 2 3 10 5 15據統計表明,y與x之間具有線性相關關系,請用樣本相關系數r對y與x之間的相關性強弱進行判斷.(若|r|>0.8,則可認為y與x有較強的線性相關關系)參考數據:(xi-)(yi-)=66,≈77.參考公式:相關系數r=.方法歸納線性相關系數是從數值上來判斷變量間的線性相關程度,是定量的方法.與散點圖相比較,線性相關系數要精細得多,需要注意的是線性相關系數r的絕對值小,只是說明線性相關程度低,但不一定不相關,可能是非線性相關.鞏固訓練3 [2022·廣東潮州高二期末]對四組數據進行統計,獲得如圖所示的散點圖,關于其相關系數的關系,正確的有( )A.r1C.r3>0 D.r4>08.1 成對數據的統計相關性新知初探·課前預習[教材要點]要點一1.精確地2.直角坐標系3.增加 減少4.一條直線要點二2.(1)正 (2)負3.[-1,1][夯實雙基]1.(1)√ (2)× (3)× (4)×2.解析:A、D是函數關系;B是不相關關系;C是相關關系,故選C.答案:C3.解析:變量y與x之間的樣本相關系數r=-0.983 2,|r|=0.983 2,接近1,樣本相關系數的絕對值越大,相關性越強,∴變量y與x之間有較強的線性相關關系,故選B.答案:B4.解析:①是確定的函數關系;②中的點大都分布在一條曲線周圍;③中的點大都分布在一條直線周圍;④中點的分布沒有任何規律可言,x,y不具有相關關系.答案:②③題型探究·課堂解透例1 解析:在A中,由于取b為自變量,因變量是判別式Δ=b2-4ac,判別式與b是函數關系,兩者不是相關關系;一般來說,光照時間越長,果樹畝產量越高;降雪量越大,交通事故發生率越高;施肥量越多,糧食畝產量越高,所以B,C,D是相關關系.故選BCD.答案:BCD鞏固訓練1 解析:不確定性是相關關系的一個重要特征.故選D.答案:D例2 解析:(1)散點圖如圖所示:(2)由散點圖可知,所有散點接近一條直線排列,所以利潤額與銷售額是線性相關關系,由圖可知當銷售額增加時,利潤額呈現增加的趨勢,所以是正相關.鞏固訓練2 解析:由兩個散點圖的形狀判斷,x與y負相關,u與v是正相關.故選C.答案:C例3 解析:由題意知,==7,==7.樣本相關系數r==≈0.857>0.8.故可認為y與x有較強的線性相關關系.鞏固訓練3 解析:由圖形特征可知r1,r4都是負相關,都是負數,r1比r4的相關系數更強,所以r1答案:AC8.2 一元線性回歸模型及其應用課標解讀1.結合具體實例,了解一元線性回歸模型的含義,了解模型參數的統計意義.2.了解最小二乘原理,掌握一元線性回歸模型參數的最小二乘估計方法,會使用相關的統計軟件.3.針對實際問題,會用一元線性回歸模型進行預測.新知初探·課前預習——突出基礎性教 材 要 點要點一 一元線性回歸模型我們稱為Y關于x的一元線性回歸模型 ,其中Y稱為因變量或響應變量,x稱為自變量或解釋變量;a和b為模型的未知參數,a稱為________參數,b稱為________參數;e是Y與bx+a之間的________.要點二 線性回歸方程與最小二乘法將=________稱為Y關于x的經驗回歸方程 ,也稱經驗回歸函數或經驗回歸公式,其圖形稱為經驗回歸直線 .這種求經驗回歸方程的方法叫做最小二乘法,求得的叫做b,a的最小二乘估計.要點三 殘差對于響應變量Y,通過觀測得到的數據稱為觀測值,通過經驗回歸方程得到的稱為預測值,________減去________稱為殘差.殘差是隨機誤差的估計結果,通過對殘差的分析可以判斷模型刻畫數據的效果,以及判斷原始數據中是否存在可疑數據等,這方面工作稱為殘差分析.要點四 用R2比較模型的擬合效果用R2來比較兩個模型的擬合效果,R2的計算公式為R2=1-. R2越大,意味著殘差平方和(yi-i)2越小,即模型的擬合效果________;R2越小,殘差平方和越大,即模型的擬合效果________.助 學 批 注批注 由于所有的樣本點不共線,而只是散布在某條直線的附近,因此一元線性回歸模型反映了表示成對樣本數據的點散布于直線y=bx+a附近的線性相關關系.批注 在經驗回歸方程=x+中,是經驗回歸直線的斜率,是截距.一般地,當回歸系數>0時,說明兩個變量呈正相關關系,它的意義是當每增大一個單位時,平均增大個單位;當<0時,說明兩個變量呈負相關關系,它的意義是當x每增大一個單位時,平均減小||個單位.批注 經驗回歸直線一定過點(),點()通常稱為樣本點的中心.夯 實 雙 基 1.判斷正誤(正確的畫“√”,錯誤的畫“×”)(1)經驗回歸方程適用于一切樣本和總體.( )(2)經驗回歸方程一般都有局限性.( )(3)樣本取值的范圍會影響經驗回歸方程的適用范圍.( )(4)經驗回歸方程得到的預測值是預測變量的精確值.( )2.某商品銷售量y(件)與銷售價格x(元/件)負相關,則其經驗回歸方程可能是( )A.=-10x+200 B.=10x+200C.=-10x-200 D.=10x-2003.甲、乙、丙、丁四位同學在建立變量x,y的回歸模型時,分別選擇了4種不同模型,計算可得它們的R2分別如下表:甲 乙 丙 丁R2 0.98 0.78 0.50 0.85哪位同學建立的回歸模型擬合效果最好?( )A.甲 B.乙C.丙 D.丁4.為了解某社區居民的家庭年收入x與年支出y的關系,隨機調查了該社區5戶家庭,依據統計數據得到回歸直線方程=0.76x+0.4,據此估計,該社區一戶收入為15萬元家庭年支出為________萬元.題型探究·課堂解透——強化創新性題型 1 經驗回歸方程例1 [2022·江蘇蘇州實驗中學高二期中]對于數據組:x 2 3 4 5y 1.9 4.1 6.1 7.9(1)作散點圖,你能直觀上得到什么結論?(2)求線性回歸方程.方法歸納求經驗回歸方程的一般步驟鞏固訓練1 (1)為了解兒子身高與其父親身高的關系,隨機抽取5對父子的身高數據如下:父親身高x/cm 174 176 176 176 178兒子身高y/cm 175 175 176 177 177則y對x的經驗回歸方程為( )A.=x-1 B.=x+1C.=88+x D.=176(2)[2022·河北滄州高二期末]已知x與y的數據如表所示,根據表中數據,利用最小二乘法求得y關于x的經驗回歸方程為=0.7x+1.05,則m的值是( )x 2 3 4 5y 2.5 3.0 m 4.5A.3.8 B.3.9C.4.0 D.4.1題型 2利用經驗回歸方程對總體進行估計例2 [2022·河北張家口高二期末]某市統計了近7年的實際利用外資金額y(單位:億元)的數據,得到下面的表格:年份 2015 2016 2017 2018 2019 2020 2021年份代號x 1 2 3 4 5 6 7實際利用外資金額 y(單位:億元) 25 41 50 58 64 78 89由表中數據,求得變量x,y的相關系數r≈0.993 1,可判定變量x,y線性相關關系較強.(1)建立y關于x的經驗回歸方程;(2)根據(1)的結果,預測該市實際利用外資金額首次超過150億元的年份.參考數據:=405,=1 900.方法歸納解決此類問題的關鍵是準確求出經驗回歸方程,再根據題意代入數據求出預測值.鞏固訓練2 [2022·山東濟寧高二期末]2021年9月,山東省政府辦公廳印發《山東省電動自行車管理辦法》(以下簡稱《辦法》),自2022年5月1日起施行.《辦法》的第十九條第三款規定:駕乘電動自行車人員規范佩戴安全頭盔.佩戴頭盔是一項對家庭與社會負責的行為.某市為貫徹《辦法》精神,加強對市民的安全教育,自2022年5月1日起,在該市某主干路口連續監控5周,每周抓拍到駕乘電動自行車人員未規范佩戴安全頭盔的統計數據如下表:周數 第1周 第2周 第3周 第4周 第5周周數序號x 1 2 3 4 5未規范佩戴 頭盔人數y 1 150 1 000 900 750 600(1)請利用所給數據求未規范佩戴頭盔人數y與周數序號x之間的經驗回歸方程=x+;(2)利用(1)中建立的經驗回歸方程估算該路口第6周未規范佩戴頭盔的人數.參考數據:=11 850,=4 400題型 3經驗回歸分析例3 共享單車進駐城市,綠色出行引領時尚,某市有統計數據顯示,某站點6天的使用單車用戶的數據如下,用兩種模型①y=bx+a;②y=b+a分別進行擬合,得到相應的回歸方程=10.7x+3.4,=35.5-22.8,進行殘差分析得到如表所示的殘差值及一些統計量的值:日期x(天) 1 2 3 4 5 6 =3.5 =41 =1 049 =91用戶y(人) 13 22 43 45 55 68模型①的 殘差值 -1.1 -2.8 7.5 -1.2 -1.9 0.4模型②的 殘差值 0.3 -5.4 4.3 -3.2 -1.6 3.8(1)殘差值的絕對值之和越小說明模型擬合效果越好,根據殘差,比較模型①,②的擬合效果,應選擇哪一個模型?并說明理由;(2)殘差絕對值大于3的數據認為是異常數據,需要剔除,剔除異常數據后,重新求出(1)中所選模型的回歸方程.方法歸納刻畫回歸效果的三種方法鞏固訓練3 某種農作物可以生長在灘涂和鹽堿地,它的灌溉方式是將海水稀釋后進行灌溉.某實驗基地為了研究海水濃度x(%)對畝產量y(t)的影響,通過在試驗田的種植實驗,測得了該農作物的畝產量與海水濃度的數據如下表海水濃度x(%) 3 4 5 6 7畝產量y(t) 0.56 0.52 0.46 0.35 0.31殘差 -0.02 0.01 m n 0.01繪制散點圖發現,可以用線性回歸模型擬合畝產量y(t)與海水濃度x(%)之間的相關關系,用最小二乘法計算得y與x之間的線性回歸方程為=-0.07x+.(1)求,m,n的值;(2)統計學中常用相關指數R2來刻畫回歸效果,R2越大,回歸效果越好,如假設R2=0.85,就說明預報變量y的差異有85%是解釋變量x引起的.請計算相關指數R2(精確到0.01),并指出畝產量的變化多大程度上是由澆灌海水濃度引起的?附:殘差i=yi-i,相關指數R2=1-,其中(yi-)2=0.046 28.2 一元線性回歸模型及其應用新知初探·課前預習[教材要點]要點一截距 斜率 隨機誤差要點二x+要點三觀測值 預測值要點四越好 越差[夯實雙基]1.(1)× (2)√ (3)√ (4)×2.解析:∵y與x負相關,∴排除B,D,又∵C項中x>0時,<0不合題意,∴C錯.故選A.答案:A3.解析:R2越大,表示回歸模型的擬合效果越好.故選A.答案:A4.解析:令x=15,所以=0.76×15+0.4=11.8.答案:11.8題型探究·課堂解透例1 解析:(1)由圖知:兩個變量呈線性相關關系且正相關.(2)由數據知:==3.5,==5,=2×1.9+3×4.1+4×6.1+5×7.9=80,=54,所以===2,令y=x+,則=5-2×3.5=-2,綜上,回歸直線方程為y=2x-2.鞏固訓練1 解析:(1)由題意得==176(cm),==176(cm),由于()一定滿足經驗回歸方程,經驗證知選C.(2)因為=×(2+3+4+5)==×(2.5+3.0+m+4.5)=,所以樣本中心為(),將其代入回歸方程=0.7x+1.05,得=0.7×+1.05,解得m=4.故選C.答案:(1)C (2)C例2 解析:(1)由表格數據和參考數據,得==4,==,=12+22+32+42+52+62+72=140,則===10,==-10×4=,所以y關于x的經驗回歸方程為=10x+.(2)由(1)可知,10x+>150,解得x>,所以首次超過150億元的年份代號為14,故預測2028年該市實際利用外資金額首次超過150億元.鞏固訓練2 解析:(1)由表中數據知,==3,===880,=12+22+32+42+52=55,所以===-135,所以==880-(-135)×3=1 285,故所求經驗回歸方程為=-135x+1 285.(2)令x=6,則=-135×6+1 285=475人,預計該路口第6周未規范佩戴頭盔的人數為475人.例3 解析:(1)應該選擇模型①,模型①的殘差值的絕對值之和為1.1+2.8+7.5+1.2+1.9+0.4=14.9;模型②的殘差值的絕對值之和為0.3+5.4+4.3+3.2+1.6+3.8=18.6.∵14.9<18.6,∴模型①的擬合效果較好,應該選模型①.(2)剔除異常數據,即剔除第3天的數據后,得=(3.5×6-3)=3.6,=(41×6-43)=40.6,=1 049-3×43=920,=91-32=82.∴====11,==40.6-11×3.6=1.∴y關于x的回歸方程為y=11x+1.鞏固訓練3 解析:(1)由題設,==5,==0.44,所以0.44=-0.07×5+,可得=0.79,m=0.46+0.07×5-0.79=0.02,n=0.35+0.07×6-0.79=-0.02.(2)由(1)知:(yi-i)2=0.000 4×3+0.000 1×2=0.001 4,(yi-)2=0.046 2,所以R2=1-=≈0.97,故畝產量的變化有97%是由澆灌海水濃度引起的.8.3 列聯表與獨立性檢驗課標解讀1.通過實例,理解2×2列聯表的統計意義.2.通過實例,了解2×2列聯表獨立性檢驗及其應用.新知初探·課前預習——突出基礎性教 材 要 點要點一 分類變量與列聯表1.分類變量:區別不同的現象或性質的________稱為分類變量 .2.2×2列聯表 一般地,假設有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數列聯表(稱為2×2列聯表)為y1 y2 合計x1 a b a+bx2 c d ________合計 ________ b+d ________要點二 獨立性檢驗1.獨立性檢驗:利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ2獨立性檢驗 ,讀作“卡方獨立性檢驗”,簡稱獨立性檢驗.2.χ2=,其中n=a+b+c+d.助 學 批 注批注 (1)分類變量的取值一定是離散的.(2)分類變量是大量存在的,如是否吸煙,商品的等級等.批注 能清晰給出成對分類變量數據的交叉分類頻數,是傳統的調查研究中最常用的表格之一.批注 (1)卡方越小,獨立性越強,相關性越弱;卡方越大,獨立性越弱,相關性越強.(2)當χ2≥xα時,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α;當χ2<xα時,我們沒有充分證據推斷H0不成立,可以認為X和Y獨立.夯 實 雙 基 1.判斷正誤(正確的畫“√”,錯誤的畫“×”)(1)列聯表中的數據是兩個分類變量的頻數.( )(2)事件A與B的獨立性檢驗無關,即兩個事件互不影響.( )(3)χ2的大小是判斷事件A與B是否相關的統計量.( )(4)獨立性檢驗的方法和數學上的反證法是一樣的.( )2.為調查中學生近視情況,測得某校150名男生中有80名近視,在140名女生中有70名近視.在檢驗這些學生眼睛近視是否與性別有關時,用下列哪種方法最有說服力( )A.回歸分析 B.均值與方差C.獨立性檢驗 D.概率3.在吸煙與患肺病是否有關的研究中,下列屬于兩個分類變量的是( )A.吸煙,不吸煙 B.患病,不患病C.是否吸煙,是否患病 D.以上都不對4.下面是一個2×2列聯表,則表中a處的值為________.y1 y2 合計x1 a b 73x2 2 25 c合計 d 46題型探究·課堂解透——強化創新性 題型 1 用2×2列聯表判斷兩個分類變量間的關聯關系例1 [2022·河北石家莊高二期末]在下列兩個分類變量X,Y的樣本頻數列聯表中,可以判斷X、Y之間有無關系的是( )y1 y2 總計x1 a b a+bx2 c d c+d總計 a+c b+d a+b+c+dA.B.C. D.方法歸納用2×2列聯表判斷兩個分類變量間的關聯關系鞏固訓練1 在調查的480名男性中有38名患有色盲,520名女性中有6名患有色盲,請根據題目的條件列出2×2列聯表并由列聯表估計色盲與性別是否有關.題型 2 獨立性檢驗思想的基本應用例2 [2022·山東菏澤高二期末]為加強素質教育,提升學生綜合素養,立德中學為高一年級提供了“書法”和“剪紙”兩門選修課.為了了解選擇“書法”或“剪紙”是否與性別有關,調查了高一年級1 500名學生的選擇傾向,隨機抽取了100人,統計選擇兩門課程人數如下表:(1)補全2×2列聯表;選書法 選剪紙 共計男生 40 50女生共計 30(2)依據小概率值α=0.05的獨立性檢驗,能否認為選擇“書法”或“剪紙”與性別有關?參考附表:α 0.100 0.050 0.025x0 2.706 3.841 5.024方法歸納利用獨立性檢驗思想解題的一般步驟鞏固訓練2 [2022·遼寧撫順·高二期末]食品安全問題越來越受到大家的關注,某組織隨機調查詢問了500名消費者在購買食品時是否查看營養成分表和生產日期,得到如下列聯表數據.查看 不查看 總計男性消費者 60女性消費者 260總計 150 500(1)將列聯表中數據填寫完整;(2)判斷能否有99.5%的把握認為消費者是否查看營養成分表和生產日期與性別有關.題型 3 獨立性檢驗的綜合應用例3 [2022·湖北武漢高二期末]某工廠為提高生產效率,開展技術創新活動,提出了完成某項生產任務的甲,乙兩種新的生產方式.為比較兩種生產方式的效率,選取40名工人,將他們隨機分成兩組,每組20人,第一組工人用甲種生產方式,第二組工人用乙種生產方式.根據工人完成生產任務的工作時間(單位:min)繪制了如下表格:完成任務工作時間 (60,70] (70,80] (80,90] (90,100]甲種生產方式 2人 3人 10人 5人乙種生產方式 5人 10人 4人 1人(1)將完成生產任務所需時間超過80 min和不超過80 min的工人數填入下面列聯表:生產方式 工作時間 合計超過80 min 不超過80 min甲乙合計(2)根據(1)中的列聯表,依據小概率值α=0.01的獨立性檢驗,能否認為甲,乙兩種生產方式的效率有差異?(3)若從完成生產任務所需的工作時間在(60,70]的工人中選取3人去參加培訓,設X為選出的3人中采用甲種生產方式的人數,求隨機變量X的分布列和數學期望.方法歸納獨立性檢驗解答題常與概率、分層抽樣、頻率直方圖、計數原理、經驗回歸方程、正態分布等知識結合考查.解決此類問題的關鍵是正確應用各個知識點,注意參考公式和數據.鞏固訓練3 [2022·河北保定高二期末]某校舉辦數學競賽,競賽分為初賽和決賽.現從通過初賽的學生中選拔男生30名,女生30名參加決賽,根據決賽得分情況,按[50,60),[60,70),[70,80),[80,90),[90,100]分成5組,得到如圖所示的頻率分布直方圖,若規定得分不低于80分者在本次競賽中表現優秀,其中表現優秀的女學生有5名.(1)求學生得分的平均值(各組數據以該組數據的中點值作代表);(2)請完成下面的2×2列聯表,并依據α=0.1的獨立性檢驗,能否認為是否在數學競賽中表現優秀與性別有關?性別 是否表現優秀 合計優秀 不優秀男生女生 5合計 608.3 列聯表與獨立性檢驗新知初探·課前預習[教材要點]要點一1.隨機變量2.c+d a+c a+b+c+d[夯實雙基]1.(1)√ (2)× (3)√ (4)×2.解析:分析已知條件,易得如下表格:男生 女生 合計近視 80 70 150不近視 70 70 140合計 150 140 290根據列聯表可得:χ2,再根據與臨界值比較,檢驗這些中學生眼睛近視是否與性別有關,故利用獨立性檢驗的方法最有說服力.故選C.答案:C3.解析:“是否吸煙”是分類變量,它的兩個不同取值:吸煙和不吸煙.“是否患病”是分類變量,它的兩個不同取值:患病和不患病.可知A、B都是一個分類變量所取的兩個不同值.故選C.答案:C4.解析:依題意得b=46-25=21,a=73-b=52.答案:52題型探究·課堂解透例1 解析:∵χ2=,則分類變量X和Y有關系時,ad與bc差距會比較大,由==,故與的值相差應該大,即的大小可以判斷X、Y之間有無關系.故選D.答案:D鞏固訓練1 解析:根據題目所給的數據列出如下列聯表:色盲 不色盲 合計男 38 442 480女 6 514 520合計 44 956 1 000∵====,顯然>,且兩個比例的值相差較大,故可以粗略估計患不患色盲與性別有關.例2 解析:(1)根據題意補全2×2列聯表,如下:選書法 選剪紙 共計男生 40 10 50女生 30 20 50共計 70 30 100(2)先假設H0:選擇“書法”或“剪紙”與性別無關.根據列聯表中數據,得χ2=≈4.762>3.841,根據小概率α=0.050的獨立性檢驗,推斷H0不成立,即有95%的把握認為選“書法”或“剪紙”與性別有關.鞏固訓練2 解析:(1)查看 不查看 總計男性消費者 60 90 150女性消費者 90 260 350總計 150 350 500(2)由題可知χ2=≈10.204.又因為查表可得P(χ2≥7.879)=0.005,且10.204>7.879,所以有99.5%的把握認為消費者是否查看營養成分表和生產日期與性別有關.例3 解析:(1)根據已知數據可得列聯表如下:生產方式 工作時間 合計超過80 min 不超過80 min甲 15 5 20乙 5 15 20合計 20 20 40(2)設H0:甲,乙兩種生產方式的效率無差異,根據(1)中列聯表中的數據,經計算得χ2==10>6.635,依據小概率值α=0.01的獨立性檢驗,我們推斷H0不成立,即認為甲,乙兩種生產方式的效率有差異,此推斷犯錯誤的概率不大于0.01.(3)由題意知,隨機變量X的所有可能取值為0,1,2,P(X=0)==,P(X=1)==,P(X=2)==,所以X的分布列為X 0 1 2P所以E(X)=0×+1×+2×=.鞏固訓練3 解析:(1)由頻率分布直方圖可得(0.015+n+0.035+0.015+0.01)×10=1,解得n=0.025.則學生得分的平均值=55×0.15+65×0.25+75×0.35+85×0.15+95×0.1=73(分).(2)由頻率分布直方圖可知表現優秀的人數為60×(0.015+0.01)×10=15,則表現優秀的男學生人數為15-5=10.女學生中表現不優秀的人數為30-5=25,男學生中表現不優秀的人數為30-10=20.先假設H0:是否在數學競賽中表現優秀與性別無關.得到2×2列聯表如下:性別 是否表現優秀 合計優秀 不優秀男生 10 20 30女生 5 25 30合計 15 45 60則χ2==≈2.222<2.706.根據小概率值α=0.1的獨立性檢驗,我們推斷H0成立,即認為是否在數學競賽中表現優秀與性別沒有關聯,此推斷犯錯誤的概率不大于0.1.專項培優3章末復習課 · · 考點一 一元線性回歸模型及其應用1.該知識點是具有線性相關關系的兩變量的一種擬合應用,目的是借助函數的思想對實際問題做出預測和分析.2.通過對一元線性回歸模型及其應用的考查,提升學生的數學建模、數據分析核心素養.例1 [2022·全國乙卷]某地經過多年的環境治理,已將荒山改造成了綠水青山.為估計一林區某種樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:m2)和材積量(單位:m3),得到如下數據:樣本號i 1 2 3 4 5 6 7 8 9 10 總和根部橫截面積xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6材積量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9并計算得=0.038,=1.615 8,iyi=0.247 4.(1)估計該林區這種樹木平均一棵的根部橫截面積與平均一棵的材積量;(2)求該林區這種樹木的根部橫截面積與材積量的樣本相關系數(精確到0.01);(3)現測量了該林區所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和為186 m2.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數據給出該林區這種樹木的總材積量的估計值.附:相關系數r=,≈1.377.例2 [2022·湖北武漢高二期末]為了了解A地區足球特色學校的發展狀況,某調查機構得到如下統計數據:年份x 2014 2015 2016 2017 2018足球特色學校y(百個) 0.30 0.60 1.00 1.40 1.70(1)根據上表數據,計算y與x的相關系數r,并說明y與x的線性相關性強弱.(已知:0.75≤|r|≤1,則認為y與x線性相關性很強;0.3≤|r|<0.75,則認為y與x線性相關性一般;|r|≤0.3,則認為y與x線性相關性較弱.)(2)求y關于x的線性回歸方程,并預測A地區2023年足球特色學校的個數(精確到個位).參考公式:r=,(xi-)2=10,(yi-)2=1.3,≈3.605 6,=,=-.考點二 獨立性檢驗的應用1.獨立性檢驗研究的問題是有多大把握認為兩個分類變量之間有關系.為此需先列出2×2列聯表,從表格中可以直觀地得到兩個分類變量是否有關系.獨立性檢驗的思想是:可以先假設二者無關系,求統計量χ2的值,若χ2大于臨界值,則拒絕假設,否則,接受假設.2.通過對獨立性檢驗的應用的考查,提升學生的數學運算、數據分析核心素養.例3 [2022·新高考Ⅰ卷節選]一醫療團隊為研究某地的一種地方性疾病與當地居民的衛生習慣(衛生習慣分為良好和不夠良好兩類)的關系,在已患該疾病的病例中隨機調查了100例(稱為病例組),同時在未患該疾病的人群中隨機調查了100人(稱為對照組),得到如下數據:不夠良好 良好病例組 40 60對照組 10 90能否有99%的把握認為患該疾病群體與未患該疾病群體的衛生習慣有差異?附:K2=, P(K2≥k) 0.050 0.010 0.001k 3.841 6.635 10.828例4 [2022·全國甲卷]甲、乙兩城之間的長途客車均由A和B兩家公司運營,為了解這兩家公司長途客車的運行情況,隨機調查了甲、乙兩城之間的500個班次,得到下面列聯表:準點班次數 未準點班次數A 240 20B 210 30(1)根據上表,分別估計這兩家公司甲、乙兩城之間的長途客車準點的概率;(2)能否有90%的把握認為甲、乙兩城之間的長途客車是否準點與客車所屬公司有關?附:K2=,P(K2≥k) 0.100 0.050 0.010k 2.706 3.841 6.635章末復習課考點聚焦·分類突破例1 解析:(1)該林區這種樹木平均一棵的根部橫截面積==0.06(m2),平均一棵的材積量==0.39(m3).(2)由題意,得==0.038-10×0.062=0.002,==1.615 8-10×0.392=0.094 8,==0.247 4-10×0.06×0.39=0.013 4,所以相關系數r==≈≈0.97.(3)因為樹木的材積量與其根部橫截面積近似成正比,所以比例系數k===6.5,所以該林區這種樹木的總材積量的估計值為186×6.5=1 209(m3).例2 解析:(1)因為=×(2 014+2 015+2 016+2 017+2 018)=2 016,=×(0.30+0.60+1.00+1.40+1.70)=1,=(2 014-2 016)(0.30-1)+(2 015-2 016)(0.60-1)+(2 016-2 016)(1.00-1)+(2 017-2 016)(1.40-1)+(2 018-2 016)(1.70-1)=3.6,所以r===≈0.9984>0.75,∴y與x線性相關性很強.(2)因為===0.36,==1-2 016×0.36=-724.76,所以y關于x的線性回歸方程是=0.36x-724.76.當x=2 023時,=0.36×2 023-724.76=3.52預測A地區2023年足球特色學校的個數為352.例3 解析:由題意,得K2==24>6.635,∴有99%的把握認為患該疾病群體與未患該疾病群體的衛生習慣有差異.例4 解析:(1)A公司一共調查了260個班次,其中有240個班次準點,故A公司甲、乙兩城之間的長途客車準點的概率是=.B公司一共調查了240個班次,其中有210個班次準點,故B公司甲、乙兩城之間的長途客車準點的概率是=.(2)因為K2==≈3.205>2.706,所以有90%的把握認為甲、乙兩城之間的長途客車是否準點與客車所屬公司有關. 展開更多...... 收起↑ 資源列表 新教材2023版高中數學第八章成對數據的統計分析8.1成對數據的統計相關性學生用書新人教A版選擇性必修第三冊.doc 新教材2023版高中數學第八章成對數據的統計分析8.2一元線性回歸模型及其應用學生用書新人教A版選擇性必修第三冊.doc 新教材2023版高中數學第八章成對數據的統計分析8.3列聯表與獨立性檢驗學生用書新人教A版選擇性必修第三冊.doc 新教材2023版高中數學第八章成對數據的統計分析專項培優章末復習課學生用書新人教A版選擇性必修第三冊.doc 縮略圖、資源來源于二一教育資源庫