資源簡介 新教材 蘇教版2019版 數學選擇性必修第二冊第9章知識點清單目錄第9章 統計9. 1 線性回歸分析9. 2 獨立性檢驗第9章 統計9. 1 線性回歸分析一、變量間的相關關系1. 兩個變量的關系分類 函數關系 相關關系特征 兩變量具有確定性關系 兩變量沒有確定性關系2. 相關關系兩個變量之間具有一定的聯系,但又沒有確定性函數關系,這種關系稱為相關關系.3. 散點圖將樣本中的n個數據構成的點(xi,yi)(i=1,2,3,…,n)描在平面直角坐標系中得到的圖形稱為散點圖.4. 線性相關關系散點圖中的點散布在一條直線附近,將具有這種特性的相關關系稱為線性相關關系.5. 正相關與負相關具有相關關系的兩個變量的散點圖如果呈從左下向右上方向發展的趨勢,稱這兩個變量之間正相關,如果呈從左上向右下方向發展的趨勢,則稱這兩個變量之間負相關.二、相關系數1. 對于變量x與y的n對數據(xi,yi)(i=1,2,3,…,n),一般用r= 來衡量y與x的線性相關強弱,這里的r稱為相關系數.2. 相關系數r具有的性質(1)-1≤r≤1;(2)r>0時y與x呈正相關關系, r<0 時y與x呈負相關關系;(3) |r|越接近1 ,y與x相關的程度就越強, |r|越接近0 ,y與x相關的程度就越弱 .通常情況下,當|r|>0. 5時,認為線性相關關系顯著;當|r|<0. 3時,認為幾乎沒有線性相關關系.三、線性回歸方程1. 線性回歸模型散點圖上的一些點在一條直線附近,但并不都在這條直線上. 也就是說,這條直線并不能精確地反映x與y之間的關系,y的值不能由x確定,在此,我們將兩者之間的關系表示為y=a+bx+ε,其中a+bx是確定性函數,ε稱為隨機誤差. 我們將y=a+bx+ε稱為線性回歸模型.2. 線性回歸方程設有n對觀測數據(xi,yi)(i=1,2,3,…,n),根據線性回歸模型,對于每一個xi,對應的隨機誤差項εi=yi-(a+bxi). 當++…+取得最小值時得到的直線=+x稱為這n對數據的回歸直線,此直線方程稱為線性回歸方程,其中稱為回歸截距, 稱為回歸系數, 稱為回歸值. 把上述方法稱為“最小二乘法”.3. 線性回歸方程的計算及性質線性回歸方程: =+x中,回歸系數的計算公式: ==,的計算公式: =-. 其中a,b上方加“^”表示由觀察值按最小二乘法求得的估計值. 表示實際值y的估計值.性質(1)回歸直線一定過點(, ).(2)y與x正相關的充要條件是>0,y與x負相關的充要條件是<0.(3) 的實際意義:當x增大一個單位時, 增大個單位.四、非線性回歸方程1. 對于變量y與x的關系,不是線性相關關系,稱為非線性相關關系,其方程稱為非線性回歸方程. 一般地,非線性回歸方程的曲線類型可以通過作出散點圖進行猜測,而非線性回歸方程有時可以通過變量替換后,借助求線性回歸方程的過程確定.五、變量間相關關系的判斷1. 利用散點圖判斷兩個變量的相關性(1)如果變量x和y正相關,那么散點圖表現為點散布的位置是從左下到右上的區域;如果變量x和y負相關,那么散點圖表現為點散布的位置是從左上到右下的區域.(2)如果散點落在一條直線附近,則認為這兩個變量線性相關.2. 利用相關系數判斷兩個變量相關性強弱相關系數r是從數值上來判斷變量間的線性相關程度的量,是定量分析. |r|刻畫了樣本點集中于某條直線的程度.|r|越接近1,散點圖中的樣本點分布越接近一條直線,兩個變量的線性相關程度越強.六、求線性回歸方程1. 利用公式==, =-求線性回歸方程的一般步驟(1)列出xi,yi,xiyi;(2)計算, , , ;(3)代入公式計算, 的值;(4)寫出線性回歸方程.七、非線性回歸分析1. 研究兩個變量的關系時,依據樣本數據畫出散點圖,從整體上看,如果樣本點沒有分布在一條直線附近,就稱這兩個變量之間不具有線性相關關系. 當兩個變量不具有線性相關關系時,依據樣本點的分布選擇合適的曲線方程來擬合數據,可通過變量代換,利用線性回歸模型建立兩個變量間的非線性回歸方程. 常見的非線性回歸方程的轉換方式如下:曲線方程 曲線(曲線的一部分) 變換公式 變換后的線性函數y=axb c=ln a, v=ln x, u=ln y u=c+bvy=aebx c=ln a, u=ln y u=c+bxy=a c=ln a, v=, u=ln y u=c+bvy=a+bln x v=ln x y=a+bv2. 建立非線性回歸模型的基本步驟(1)確定研究對象,明確涉及的變量;(2)畫出確定好的變量間的散點圖,觀察它們之間的關系(是否存在非線性關系);(3)由經驗確定非線性回歸方程的類型(如我們觀察到數據呈非線性關系,一般選用反比例函數模型、指數函數模型、對數函數模型等);(4)通過換元,將非線性回歸方程模型轉化為線性回歸方程模型;(5)按照公式計算線性回歸方程中的參數,得到線性回歸方程;(6)消去新元,得到非線性回歸方程.9. 2 獨立性檢驗一、2×2列聯表假設兩個分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其2×2列聯表為Yy1 y2 合計X x1 a b a+bx2 c d c+d合計 a+c b+d a+b+c+d2×2列聯表給出了成對分類變量數據的交叉分類頻數.二、與獨立性檢驗相關的概念1. χ2公式一般地,對于兩個分類變量Ⅰ和Ⅱ,Ⅰ有兩類取值,即類A和類B(如吸煙與不吸煙);Ⅱ也有兩類取值,即類1和類2(如患呼吸道疾病和未患呼吸道疾病).我們得到2×2列聯表所示的抽樣數據:Ⅱ類1 類2 合計Ⅰ 類A a b a+b類B c d c+d合計 a+c b+d a+b+c+d記n=a+b+c+d,則χ2=.2. 獨立性檢驗用χ2統計量研究兩類變量是否有關的方法稱為獨立性檢驗.三、獨立性檢驗的思想1. 要推斷“Ⅰ與Ⅱ有關系”,可按下面的步驟進行(1)提出假設H0:Ⅰ與Ⅱ沒有關系;(2)根據2×2列聯表與χ2=計算χ2的值;(3)根據臨界值(如下表所示),做出判斷.P(χ2≥x0) 0. 50 0. 40 0. 25 0. 15 0. 10x0 0. 455 0. 708 1. 323 2. 072 2. 706P(χ2≥x0) 0. 05 0. 025 0. 010 0. 005 0. 001x0 3. 841 5. 024 6. 635 7. 879 10. 8282. 常用檢驗結論(1)若χ2>10. 828,則有99. 9%的把握認為“Ⅰ與Ⅱ有關系”;(2)若χ2>6. 635,則有99%的把握認為“Ⅰ與Ⅱ有關系”;(3)若χ2>2. 706,則有90%的把握認為“Ⅰ與Ⅱ有關系”;(4)若χ2≤2. 706,則認為沒有充分的證據顯示“Ⅰ與Ⅱ有關系”,但也不能得出結論“H0成立”,即Ⅰ與Ⅱ沒有關系.四、由χ2進行獨立性檢驗1. 獨立性檢驗的關注點在2×2列聯表中,如果兩個分類變量沒有關系,則應滿足ad-bc≈0,事實上,|ad-bc|越小,兩個分類變量的關系越弱;|ad-bc|越大,兩個分類變量的關系越強.五、獨立性檢驗與統計、概率的綜合應用解決與獨立性檢驗有關的統計、概率綜合問題,一般有以下幾個步驟(1)厘清題意,理解問題中的條件和所要得出的結論,尤其是直方圖中給定的信息,找關鍵量.(2)分析數據,列出2×2列聯表.(3)利用獨立性檢驗的步驟進行判斷.(4)利用概率公式求事件的概率.(5)反思回顧、檢查關鍵點、易錯點及答題規范. 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫