資源簡介 4.3 統計模型4.3.1 一元線性回歸模型[課標解讀] 1.成對數據的統計相關性:①結合實例,了解樣本相關系數的統計含義,了解樣本相關系數與標準化數據向量夾角的關系.②結合實例,會通過相關系數比較多組成對數據的相關性.2.一元線性回歸模型:①結合具體實例,了解一元線性回歸模型的含義,了解模型參數的統計意義,了解最小二乘原理,掌握一元線性回歸模型參數的最小二乘估計方法,會使用相關的統計軟件.②針對實際問題,會用一元線性回歸模型進行預測.【教材要點】知識點一 相關關系1.兩個變量的關系分類 函數關系 相關關系特征 兩變量關系具有________ 兩變量關系具有________2.散點圖:將樣本中n對數據(xi,yi)(i=1,2,…,n)描在________________中得到的圖形.3.兩個變量之間有一定的關系,但沒有達到可以相互決定的程度,他們之間的關系具有一定的隨機性,統計學上稱為相關關系.4.線性相關:如果變量x與變量y之間的關系可以近似地用一次函數來刻畫,則稱x與y線性相關.5.如果一個變量增大,另一個變量大體上也增大,則稱這兩個變量正相關.如果一個變量增大,另一個變量大體上減少,則稱這兩個變量負相關.知識點二 回歸直線方程知識點三 回歸直線方程的性質1.回歸直線過樣本點的中心(,);2.一次函數=x+的單調性由的符號決定,函數遞增的充要條件是>0.這說明x與y正相關的充要條件是>0;x與y負相關的充要條件是<0.3.回歸方程中的實際意義是,當x增大一個單位時,大約增大 個單位.知識點四 相關系數計算 r==性質 范圍 |r|≤1且x與y正相關的充要條件是r>0 x與y負相關的充要條件是r<0線性相關程度 |r|越接近1,線性相關性越強 |r|越接近0,線性相關性越弱 |r|=1的充要條件是成對數據構成的點都在回歸直線上知識點五 非線性回歸兩個變量x與y的關系,不再是線性相關關系,成為非線性相關關系,所得到的方程稱為非線性回歸方程(也簡稱回歸方程),一般地,非線性回歸方程的曲線類型可以通過做出散點圖進行猜測,而回歸方程有時可以通過變量替換后,借助求回歸直線的過程確定.當然,確定了非線性回歸方程之后,也可以利用它進行預測.【基礎自測】1.設某大學的女生體重y(單位:kg)與身高x(單位:cm)具有線性相關關系.根據一組樣本數據(xi,yi)(i=1,2,…,n),用最小二乘法建立的回歸方程為=0.85x-85.71,則下列結論中正確的是________.(填序號)①y與x具有正的線性相關關系;②回歸直線過樣本點的中心(,);③若該大學某女生身高增加1 cm,則其體重約增加0.85 kg;④若該大學某女生身高為170 cm,則可斷定其體重必為58.79 kg.2.下列判斷正確的是____________.(1)求回歸直線方程前必須進行相關性檢驗;(2)兩個變量的相關系數越大,它們的相關程度越強;(3)若相關系數r=0,則兩變量x,y之間沒有關系.3.下列結論正確的是( )①函數關系是一種確定性關系;②相關關系是一種非確定性關系;③回歸分析是對具有函數關系的兩個變量進行統計分析的一種方法;④回歸分析是對具有相關關系的兩個變量進行統計分析的一種常用方法.A.①② B.①②③C.①②④ D.①②③④4.下表是x和y之間的一組數據,則y關于x的回歸直線方程必過點( )x 1 2 3 4y 1 3 5 7A.(2,3) B.(1.5,4)C.(2.5,4) D.(2.5,5)題型1 相關關系與線性相關關系的判斷(數據分析)例1 (1)(多選)下列關系中,屬于相關關系的是( )A.正方形的邊長與面積之間的關系B.生活習慣與健康狀況的關系C.人的身高與年齡之間的關系D.降雪量與交通事故的發生率之間的關系狀元隨筆 緊扣相關關系的概念加以判斷.(2)某市天然氣消耗量y(單位:百萬立方米)與使用天然氣戶數x(單位:萬戶)的歷史記錄的資料如表所示:第i年 1 2 3 4 5戶數x/萬戶 1 1.2 1.6 1.8 2天然氣消耗量y/百萬立方米 6 7 9.8 12 12.1第i年 6 7 8 9 10戶數x/萬戶 2.5 3.2 4 4.2 4.5天然氣消耗量y/百萬立方米 14.5 20 24 25.4 27.5判斷變量x,y之間是否具有線性相關關系.狀元隨筆 根據散點圖判斷.方法歸納1.函數關系與相關關系函數關系是一種確定的關系,而相關關系是一種不確定的關系.函數關系是一種因果關系,而相關關系不一定是因果關系,也可能是伴隨關系.2.兩個變量是否相關的兩種判斷方法(1)實際經驗法:借助積累的經驗進行分析判斷;(2)散點圖法:繪制散點圖,如果發現點的分布從整體上看大致在一條直線附近,那么這兩個變量就是線性相關的,注意不要受個別點的位置的影響.跟蹤訓練1 (1)下列兩個變量間的關系不是函數關系的是( )A.圓的半徑與周長B.角的度數與它的正切值C.糧食畝產量為常數時,土地面積與糧食總產量D.日照時間與水稻的單位產量(2)下列說法正確的是( )A.相關關系是函數關系B.函數關系是相關關系C.線性相關關系是一次函數關系D.相關關系有兩種,分別是線性相關關系和非線性相關關系(3)試從各散點圖中點的分布狀況,直觀上判斷兩個變量之間有線性相關關系的是( )題型2 回歸直線方程及其應用(數據分析、數學運算)角度1 求回歸直線方程并預測例2 某種產品的廣告費用支出x(單位:百萬元)與銷售額y(單位:百萬元)之間有如下的對應數據:x/百萬元 2 4 5 6 8y/百萬元 30 40 60 50 70(1)畫出散點圖;(2)求回歸直線方程;(3)試預測廣告費用支出為10百萬元時,銷售額多大?參考公式:==-狀元隨筆 (1)按表中的數據在平面直角坐標系中描點即得散點圖;(2)由公式求出,,寫出回歸直線方程;(3)利用回歸方程分析.角度2 線性相關性強弱的判斷例3 某廠的生產原料耗費x(單位:百萬元)與銷售額y(單位:百萬元)之間有如下的對應關系:x/百萬元 2 4 6 8y/百萬元 30 40 50 70x與y之間是否具有線性相關關系?若有,判斷相關性的強弱,并求其回歸直線方程.參考公式:r==狀元隨筆 利用散點圖判斷是否線性相關,利用相關系數判斷相關性的強弱.方法歸納1.線性回歸分析的步驟(1)收集樣本數據,設為(xi,yi)(i=1,2,…,n)(數據一般由題目給出);(2)作出散點圖,確定x,y具有線性相關關系;(3)計算,,,iyi;(4)代入公式計算相關系數,確定相關性的強弱;(5)代入公式計算,,寫出回歸直線方程=x+;(6)利用回歸直線方程進行預測.2.(1)點(,)在回歸直線上,點(,)的坐標滿足回歸直線方程.(2)回歸系數的幾何意義是回歸直線的斜率,>0時,x與y正相關;<0時,x與y負相關.(3)回歸系數的實際意義是x每增加一個單位時,增加的單位.跟蹤訓練2 (1)某企業的某種產品產量與單位成本數據如表:產量x(千件) 2 3 4 3 4 5單位成本Y(元/千件) 73 72 71 73 69 68①試確定回歸直線方程;②指出產量每增加1千件時,單位成本下降多少?③產量為6千件時,單位成本是多少?(2)隨著經濟水平的提高,智能家居已成為生活中的熱點,應用于尋常百姓家中的比例逐年上升.智能家居與傳統家居的最大區別在于用電器的開關控制,由過去的人工控制變成智能終端控制.某生活家居館新推出一套智能家居產品,為了占領市場,舉行為期六周的“感恩有你,鉅惠給你”低價風暴活動,到第五周末該生活家居館對前五周銷售情況進行統計,得到統計表格如表(y表示第x周確定訂購的數量),且通過散點圖發現y與x具有線性相關關系.x 1 2 3 4 5y 5 9 12 16 23①請用最小二乘法求出y關于x的回歸直線方程=x+;②預測第六周訂購智能家居產品的數量能否超過28.參考公式:=,=-.題型3 非線性回歸分析【思考探究】1.如何解答非線性回歸問題?[提示] 非線性回歸問題有時并不給出經驗公式.這時我們可以畫出已知數據的散點圖,把它與學過的各種函數(冪函數、指數函數、對數函數等)圖像作比較,挑選一種跟這些散點擬合得最好的函數,然后采用適當的變量變換,把問題化為線性回歸分析問題,使之得到解決.其一般步驟為:2.已知x和y之間的一組數據,則下列四個函數中,哪一個作為回歸模型最好?x 1 2 3y 3 5.99 12.01①y=3×2x-1;②y=log2x;③y=4x;④y=x2.[提示] 觀察散點圖中樣本點的分布規律可判斷樣本點分布在曲線y=3×2x-1附近.①作為回歸模型最好.例4 某地區不同身高的未成年男性的體重平均值如下表:身高x(cm) 60 70 80 90 100 110體重y(kg) 6.13 7.90 9.99 12.15 15.02 17.50身高x(cm) 120 130 140 150 160 170體重y(kg) 20.92 26.86 31.11 38.85 47.25 55.05(1)試建立y與x之間的回歸直線方程;(2)如果一名在校男生身高為168 cm,預測他的體重約為多少?參考數據:z=ln y,參考公式:=,=-.狀元隨筆 先由散點圖確定相應的函數模型,再通過對數變換將非線性相關轉化為線性相關的兩個變量來求解.方法歸納兩個變量不具有線性關系,不能直接利用回歸直線方程建立兩個變量的關系,可以通過變換的方法轉化為線性回歸模型,如y=c1,我們可以通過對數變換把指數關系變為線性關系,令z=ln y,則變換后樣本點應該分布在直線z=bx+a(a=ln c1,b=c2)的周圍.跟蹤訓練3 有一個測量水流量的實驗裝置,測得試驗數據如下表:i 1 2 3 4 5 6 7水深h(厘米) 0.7 1.1 2.5 4.9 8.1 10.2 13.5流量Q(升/分鐘) 0.082 0.25 1.8 11.2 37.5 66.5 134根據表中數據,建立Q與h之間的回歸方程.參考數據:z=lg y,參考公式:=,=-.教材反思4.3 統計模型4.3.1 一元線性回歸模型新知初探·自主學習[教材要點]知識點一1.確定性 隨機性 2.平面直角坐標系知識點二i i -[基礎自測]1.解析:回歸方程中x的系數為0.85>0,因此y與x具有正的線性相關關系,①正確;由回歸方程系數的意義可知回歸直線過樣本點的中心(,),②正確;依據回歸方程中的含義可知,x每變化1個單位,相應變化約0.85個單位,③正確;用回歸方程對總體進行估計不能得到肯定結論,故④不正確.答案:①②③2.解析:(1)正確,相關性檢驗是了解成對數據的變化規律的,所以求回歸方程前必須進行相關性檢驗.(2)錯誤,相關系數|r|越接近1,線性相關程度越強;|r|越接近0,線性相關程度越弱.(3)錯誤,若r=0是指x,y之間的相關關系弱,但并不能說沒有關系.答案:(1)3.解析:函數關系和相關關系的區別是前者是確定性關系,后者是非確定性關系,故①②正確;回歸分析是對具有相關關系的兩個變量進行統計分析的一種方法,故③錯誤,④正確.答案:C4.解析:回歸直線方程必過樣本點的中心(,),即(2.5,4),故選C.答案:C課堂探究·素養提升例1 解析:(1)在A中,正方形的邊長與面積之間的關系是函數關系;在B中,生活習慣與健康狀況不具有嚴格的函數關系,但具有相關關系;在C中,人的身高與年齡之間的關系既不是函數關系,也不是相關關系,因為人的年齡達到一定時期身高就不發生明顯變化了,因而它們不具有相關關系;在D中,降雪量與交通事故的發生率之間具有相關關系.(2)畫出散點圖如圖所示,由散點圖可知,各點分布在一條直線附近,故天然氣消耗量y(百萬立方米)與使用天然氣戶數x(萬戶)具有線性相關關系.答案:(1)BD (2)見解析跟蹤訓練1 解析:(1)函數關系與相關關系都是指兩個變量之間的關系,但是這兩種關系是不同的,函數關系是指當自變量一定時,函數值是確定的,是一種確定性的關系.因為A項C=2πr,B項y=tan α,C項y=ax(a>0,且a為常數),所以這三項均是函數關系;D項是相關關系.(2)函數關系和相關關系互不包含,所以A,B,C三項不正確;根據定義,相關關系有兩種,分別是線性相關關系和非線性相關關系.(3)在A中,點的分布毫無規律,橫軸、縱軸表示的兩個量之間的相關程度很小.在B中,所有的點嚴格地分布在一條直線上,橫軸、縱軸表示的兩個變量之間有確定的關系——函數關系.在C中,點的分布基本上集中在一個帶狀區域內,橫軸、縱軸表示的兩個變量之間有線性相關關系.在D中,點的分布基本上集中在由某條曲線兩側組成的帶狀區域內,因此橫軸、縱軸表示的兩個變量也有相關關系,只是它是非線性相關關系.答案:(1)D (2)D (3)C例2 解析:(1)散點圖如圖所示:(2)列出下表,并用科學計算器進行有關計算:i 1 2 3 4 5 合計xi 2 4 5 6 8 25yi 30 40 60 50 70 250xiyi 60 160 300 300 560 1 3804 16 25 36 64 145所以==5,==50,=145,iyi=1 380.于是可得===6.5,=-=50-6.5×5=17.5所以所求的回歸直線方程為=6.5x+17.5.(3)根據(2)求得的回歸直線方程,當廣告費用支出為10百萬元時,=6.5×10+17.5=82.5(百萬元),即廣告費用支出為10百萬元時,銷售額大約為82.5百萬元.例3 解析:散點圖如圖所示,由圖可知x,y有線性相關關系.=5,=47.5,=120,=9 900,iyi=1 080,r==≈0.982 7.故x與y之間具有很強的線性相關關系.由公式得回歸系數===6.5,=-=47.5-6.5×5=15.故y對x的回歸直線方程為=6.5x+15.跟蹤訓練2 解析:(1)①i=21,i=426,=79,=30 268,iyi=1 481,=3.5,=71,===≈-1.818,=-≈71+1.818×3.5=77.363,所以回歸直線方程為=77.363-1.818x.②產量每增加1千件時,單位成本下降1.818元.③當x=6千件時,=66.455元/千件,所以當產量為6千件時單位成本大約為66.455元/千件.(2)①依題意:=×(1+2+3+4+5)=3,= (5+9+12+16+23)=13,所以=====4.3,則=13-4.3×3=0.1,故所求回歸直線方程為=4.3x+0.1.②將x=6,代入=4.3x+0.1中,得=4.3×6+0.1=25.9≈26,故預測第六周訂購智能家居產品的數量為26,不會超過28.例4 解析:(1)根據表中的數據畫出散點圖,如下:由圖看出,這些點分布在某條指數型函數曲線y=c1ec2x的周圍,于是令z=ln y,列表如下:x 60 70 80 90 100 110z 1.81 2.07 2.30 2.50 2.71 2.86x 120 130 140 150 160 170z 3.04 3.29 3.44 3.66 3.86 4.01作出散點圖,如下:由表中數據可求得z與x之間的回歸直線方程為=0.693+0.020x,則有=e0.693+0.020x.(2)由(1)知,當x=168時,=e0.693+0.020×168≈57.57,所以在校男生身高為168 cm,預測他的體重約為57.57 kg.跟蹤訓練3 解析:由表中測得的數據可以作出散點圖,如圖.觀察散點圖中樣本點的分布規律,可以判斷樣本點分布在某一條曲線附近,表示該曲線的函數模型是Q=m·hn(m,n是正的常數).兩邊取常用對數,則lg Q=lg m+n·lg h,令y=lg Q,x=lg h,那么y=nx+lg m,即為線性函數模型=x+的形式(其中b=n,a=lg m).由下面的數據表,用最小二乘法可求得≈2.509 7,=-0.707 7,所以n≈2.51,m≈0.196.i hi Qi xi=lg hi yi=lg Qi xiyi1 0.7 0.082 -0.154 9 -1.086 2 0.024 0.168 32 1.1 0.25 0.041 4 -0.602 1 0.001 7 -0.024 93 2.5 1.8 0.397 9 0.255 3 0.158 3 0.101 64 4.9 11.2 0.690 2 1.049 2 0.476 4 0.724 25 8.1 37.5 0.908 5 1.574 0 0.825 4 1.430 06 10.2 66.5 1.008 6 1.822 8 1.017 3 1.838 57 13.5 134 1.130 3 2.127 1 1.277 6 2.404 3∑ 41 251.332 4.022 5.140 1 3.780 7 6.642于是所求得的回歸方程為Q=0.196·h2.51.4.3.2 獨立性檢驗[課標解讀] 1.①通過實例,理解2×2列聯表的統計意義.②通過實例,了解2×2列聯表獨立性檢驗及其應用.2.掌握運用2×2列聯表的方法,解決獨立性檢驗的簡單實際問題.【教材要點】知識點一 2×2列聯表及隨機事件的概率(1)2×2列聯表:如果隨機事件A與B的樣本數據如下表格形式A 總計B a b a+bc d c+d總計 a+c b+d a+b+c+d在這個表格中,核心的數據是中間的4個格子,所以這樣的表格通常稱為2×2列聯表.(2)2×2列聯表中隨機事件的概率:如上表,記n=a+b+c+d,則事件A發生的概率可估計為________;事件B發生的概率可估計為________;事件AB發生的概率可估計為________.事件,A發生的概率估計值分別是多少?提示:P()=,P(A)=.知識點二 獨立性檢驗(1)定義:在2×2列聯表中,定義隨機變量χ2=,任意給定一個α(稱為顯著性水平),可以找到滿足條件P(χ2≥k)=α的數k(稱為顯著性水平α對應的分位數),①若χ2≥k成立,就稱在犯錯誤的概率________的前提下,可以認為A與B不獨立(也稱A與B有關),或說有________的把握認為A與B有關;②若χ2這一過程通常稱為獨立性檢驗.(2)統計學中,常用的顯著性水平α以及對應的分位數k如表所示α=P(χ2≥k) 0.1 0.05 0.01 0.005 0.001k 2.706 3.841 6.635 7.879 10.828若χ2提示:不對,若χ2【基礎自測】1.下列選項中,哪一個χ2的值可以有95%以上的把握認為“A與B有關系”( )A.χ2=2.700 B.χ2=2.710C.χ2=3.765 D.χ2=5.0142.通過隨機詢問110名性別不同的大學生是否愛好某項運動,得到如下的列聯表:男 女 合計愛好 40 20 60不愛好 20 30 50合計 60 50 110經計算得χ2=≈7.8.則正確結論是( )A.在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別有關”B.在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別無關”C.有99%以上的把握認為“愛好該項運動與性別有關”D.有99%以上的把握認為“愛好該項運動與性別無關”3.考察棉花種子是否經過處理與是否生病之間的關系,得到下表中的數據:種子處理 種子未處理 合計得病 32 101 133不得病 61 213 274合計 93 314 407根據以上數據可得出( )A.種子是否經過處理與是否生病有關B.種子是否經過處理與是否生病無關C.種子是否經過處理決定是否生病D.有90%的把握認為種子經過處理與生病有關4.下面2×2列聯表的χ2的值為________.B 總計A 8 4 122 16 18總計 10 20 30題型1 用2×2列聯表分析兩事件之間的關系例1 在對人們飲食習慣的一次調查中,共調查了124人,其中六十歲以上的70人,六十歲以下的54人.六十歲以上的人中有43人的飲食以蔬菜為主,另外27人則以肉類為主;六十歲以下的人中有21人的飲食以蔬菜為主,另外33人則以肉類為主.請根據以上數據作出飲食習慣與年齡的列聯表,并利用與判斷二者是否有關系.方法歸納1.作2×2列聯表時,注意應該是4行4列,計算時要準確無誤.2.作2×2列聯表時,關鍵是對涉及的變量分清類別.跟蹤訓練1 上例中條件不變,嘗試用|ad-bc|的大小判斷飲食習慣與年齡是否有關.題型2 由χ2進行獨立性檢驗角度1 兩個變量的獨立性檢驗例2 在500人身上試驗某種血清預防感冒的作用,把他們一年中的感冒記錄與另外500名未用血清的人的感冒記錄作比較,結果如表所示.問:能否在犯錯誤的概率不超過1%的前提下認為該種血清能起到預防感冒的作用.未感冒 感冒 合計使用血清 258 242 500未使用血清 216 284 500合計 474 526 1 000附:χ2=α=P(χ2>k) 0.05 0.01 0.001k 3.841 6.635 10.828狀元隨筆 獨立性檢驗可以通過2×2列聯表計算χ2的值,然后和臨界值對照作出判斷.角度2 獨立性檢驗的實際應用例3 某商場為提高服務質量,隨機調查了50名男顧客和50名女顧客,每位顧客對該商場的服務給出滿意或不滿意的評價,得到下面列聯表:滿意 不滿意男顧客 40 10女顧客 30 20(1)分別估計男、女顧客對該商場服務滿意的概率;(2)能否有95%的把握認為男、女顧客對該商場服務的評價有差異?附:χ2=.α=P(χ2≥k) 0.05 0.01 0.001k 3.841 6.635 10.828狀元隨筆 (1)用頻率估計概率;(2)計算χ2的數值并說明.方法歸納1.獨立性檢驗的關注點在2×2列聯表中,如果兩個分類變量沒有關系,則應滿足ad-bc≈0,因此|ad-bc|越小,關系越弱;|ad-bc|越大,關系越強.2.獨立性檢驗的具體做法(1)根據實際問題的需要確定允許推斷“事件A與B有關系”犯錯誤的概率的上界α,然后查表確定臨界值k.(2)利用公式χ2=計算隨機變量χ2.(3)如果χ2≥k,推斷“X與Y有關系”這種推斷犯錯誤的概率不超過α;否則,就認為在犯錯誤的概率不超過α的前提下不能推斷“X與Y有關系”,或者在樣本數據中沒有發現足夠的證據支持結論“X與Y有關系”.跟蹤訓練2 為了調查胃病是否與生活規律有關,在某地對540名40歲以上的人的調查結果如下:患胃病 未患胃病 合計生活不規律 60 260 320生活有規律 20 200 220合計 80 460 540根據以上數據判斷40歲以上的人患胃病與生活規律有關嗎?附:χ2=.題型3 獨立性檢驗的綜合問題(數據分析、邏輯推理、數學運算)【思考探究】1.利用χ2進行獨立性檢驗,估計值的準確度與樣本容量有關嗎?[提示] 利用χ2進行獨立性檢驗,可以對推斷的正確性的概率作出估計,樣本容量n越大,這個估計值越準確,如果抽取的樣本容量很小,那么利用χ2進行獨立性檢驗的結果就不具有可靠性.2.在χ2運算后,得到χ2的值為29.78,在判斷變量相關時,P(χ2≥6.635)≈0.01和P(χ2≥7.879)≈0.005,哪種說法是正確的?[提示] 兩種說法均正確.P(χ2≥6.635)≈0.01的含義是在犯錯誤的概率不超過0.01的前提下認為兩個變量相關;而P(χ2≥7.879)≈0.005的含義是在犯錯誤的概率不超過0.005的前提下認為兩個變量相關.例4 為加強環境保護,治理空氣污染,環境監測部門對某市空氣質量進行調研,隨機抽查了100天空氣中的PM2.5和SO2濃度(單位:μg/m3),得下表: SO2 PM2.5 [0,50] (50,150] (150,475][0,35] 32 18 4(35,75] 6 8 12(75,115] 3 7 10(1)估計事件“該市一天空氣中PM2.5濃度不超過75,且SO2濃度不超過150”的概率;(2)根據所給數據,完成下面的2×2列聯表: SO2 PM2.5 [0,150] (150,475][0,75](75,115](3)根據(2)中的列聯表,判斷是否有99%的把握認為該市一天空氣中PM2.5濃度與SO2濃度有關?附:χ2=.α=P(χ2≥k) 0.05 0.01 0.001k 3.841 6.635 10.828方法歸納獨立性檢驗綜合應用的方法策略1.獨立性檢驗在實際中有著廣泛的應用,是對實際生活中數據進行分析的一種方法,通過這種分析得出的結論對實際生活或者生產都有一定的指導作用.2.近幾年高考中較少單獨考查獨立性檢驗,經常與統計、概率等知識綜合.頻率分布表、頻率分布直方圖與獨立性檢驗融合在一起是常見的考查形式,一般需要根據條件列出2×2列聯表,計算χ2值,從而解決問題.跟蹤訓練3 某學生興趣小組隨機調查了某市100天中每天的空氣質量等級和當天到某公園鍛煉的人次,整理數據得到下表(單位:天):鍛煉人次 空氣質量等級 [0,200] (200,400] (400,600]1(優) 2 16 252(良) 5 10 123(輕度污染) 6 7 84(中度污染) 7 2 0(1)分別估計該市一天的空氣質量等級為1,2,3,4的概率;(2)求一天中到該公園鍛煉的平均人次的估計值(同一組中的數據用該組區間的中點值為代表);(3)若某天的空氣質量等級為1或2,則稱這天“空氣質量好”;若某天的空氣質量等級為3或4,則稱這天“空氣質量不好”.根據所給數據,完成下面的2×2列聯表,并根據列聯表,判斷是否有95%的把握認為一天中到該公園鍛煉的人次與該市當天的空氣質量有關.人次≤400 人次>400空氣質量好空氣質量不好附:χ2=.α=P(χ2≥k) 0.05 0.01 0.001k 3.841 6.635 10.828教材反思4.3.2 獨立性檢驗新知初探·自主學習[教材要點]知識點一(2)P(A)= P(B)= P(AB)=知識點二(1)不超過α 1-α[基礎自測]1.解析:∵5.014>3.841,故D正確.答案:D2.解析:根據獨立性檢驗的思想方法,正確選項為C.答案:C3.解析:χ2=≈0.164<3.841,即沒有充足的理由認為種子是否經過處理跟生病有關.答案:B4.解析:χ2==10.答案:10課堂探究·素養提升例1 解析:飲食習慣與年齡2×2列聯表如下:年齡在六十歲以上 年齡在六十歲以下 合計飲食以蔬菜為主 43 21 64飲食以肉類為主 27 33 60合計 70 54 124將表中數據代入公式得=≈0.67,==0.45.顯然二者數據具有較為明顯的差距,據此可以在某種程度上認為飲食習慣與年齡有關系.跟蹤訓練1 解析:將本例2×2列聯表中的數據代入可得|ad-bc|=|43×33-21×27|=852.相差較大,可在某種程度上認為飲食習慣與年齡有關系.例2 解析:假設感冒與是否使用該種血清沒有關系.由列聯表中的數據,求得χ2=≈7.075.χ2=7.075>6.635,P(χ2≥6.635)=0.01,故我們在犯錯誤的概率不超過1%的前提下,即有99%的把握認為該種血清能起到預防感冒的作用.例3 解析:(1)由調查數據得,男顧客中對該商場服務滿意的比率為=0.8,因此男顧客對該商場服務滿意的概率的估計值為0.8.女顧客中對該商場服務滿意的比率為=0.6,因此女顧客對該商場服務滿意的概率的估計值為0.6.(2)χ2=≈4.762.由于4.762>3.841,故有95%的把握認為男、女顧客對該商場服務的評價有差異.跟蹤訓練2 解析:由公式得χ2=≈9.638.∵9.638>6.635,∴有99%的把握說40歲以上的人患胃病與生活是否有規律有關,即生活不規律的人易患胃病.例4 解析:(1)根據抽查數據,該市100天空氣中的PM2.5濃度不超過75,且SO2濃度不超過150的天數為32+18+6+8=64,因此,該市一天空氣中PM2.5濃度不超過75,且SO2濃度不超過150的概率的估計值為=0.64.(2)根據抽查數據,可得2×2列聯表: SO2 PM2.5 [0,150] (150,475][0,75] 64 16(75,115] 10 10(3)根據(2)的列聯表得χ2=≈7.484.由于7.484>6.635,故有99%的把握認為該市一天空氣中PM2.5濃度與SO2濃度有關.跟蹤訓練3 解析:(1)由頻數分布表可知,該市一天的空氣質量等級為1的概率為=0.43,等級為2的概率為=0.27,等級為3的概率為=0.21,等級為4的概率為=0.09.由所給數據,該市一天的空氣質量等級為1,2,3,4的概率的估計值如下表:空氣質量等級 1 2 3 4概率的估計值 0.43 0.27 0.21 0.09(2)一天中到該公園鍛煉的平均人次的估計值為×(100×20+300×35+500×45)=350.(3)根據所給數據,可得2×2列聯表:人次≤400 人次>400空氣質量好 33 37空氣質量不好 22 8根據列聯表得χ2=≈5.820.由于5.820>3.841,故有95%的把握認為一天中到該公園鍛煉的人次與該市當天的空氣質量有關. 展開更多...... 收起↑ 資源列表 新教材2023版高中數學第四章概率與統計4.3統計模型4.3.1一元線性回歸模型學生用書新人教B版選擇性必修第二冊.doc 新教材2023版高中數學第四章概率與統計4.3統計模型4.3.2獨立性檢驗學生用書新人教B版選擇性必修第二冊.doc 縮略圖、資源來源于二一教育資源庫