資源簡介 統計案例知識梳理 一、知識結構圖: 二、要點回顧: 1.2×2列聯表. 2.獨立性檢驗與相關性檢驗(見下表).含義所用統計量步驟相同點不同點獨立性檢驗都是統計學中的常21世紀教育網用方法,且步驟相似,思想一致[來源:21世紀教育網]所用的統計量不同,臨界值不同相關性檢驗21世紀教育網21世紀教育網[來源:21世紀教育網] 三、關鍵信息強化: 1.獨立性檢驗的兩個重要工具是:統計量和臨界值,只有準確計算(熟記計算公式),熟記各臨界值及統計決斷的原則,才能正確地處理獨立性檢驗的問題. 2.線性回歸方程中回歸系數和回歸截距的意義: 的意義:x每增加(或減少)一個單位,y平均改變個單位. 的意義:y不受x變化影響的部分. 3.由線性回歸方程中的計算公式知:回歸直線必過點. 4.做回歸分析要有實際意義,而如何才能知道有無實際意義呢?———相關性檢驗. 5.相關系數和臨界值是正確進行相關性檢驗的兩大重要因素. 要明確相關系數的大小與相關程度的關系(即的性質),并要會根據公式計算或利用計算器計算.另外的查法要熟練掌握. 6.相關性檢驗就是檢驗與的大小關系.四、特別警示: 1.分析兩個變量相關關系的常用方法: (1)利用散點圖進行判斷:把樣本數據表示的點在平面直角坐標系中作出,從而得到散點圖,如果這些點大致分布在通過散點圖中心的一條直線的附近,那么就說這兩個變量之間具有線性相關關系. (2)利用相關系數r進行判斷:而且越接近于1,相關程度越強;越接近于0,相關程度越弱. 2.對具有相關關系的兩個變量進行統計分析時,首先進行相關性檢驗,在確認具有線性相關關系后,再求線性回歸方程. 3.在實際問題中,經常會面臨需要推斷的問題,在作推斷時,我們不能僅憑主觀意愿作出結論,而是需要通過試驗來收集數據,并根據獨立性檢驗的原理做出合理的推斷. 4.統計方法是可能犯錯誤的,不管是回歸分析還是獨立性檢驗,得到的結論都可能犯錯誤.好的統計方法就是要盡量降低犯錯誤的概率,比如在推斷吸煙與患肺癌是否有關時,通過收集數據,整理分析數據得出的結論是“吸煙與患肺癌有關”,而且這個結論犯錯誤的概率在0.01以下,實際上,這是統計思維與確定性思維差異的反應,這是數學問題,不一定在實際中得到驗證. 五、應用舉例: 例1 考察人的高血壓是否與食鹽攝入量有關,對某地區人群進行跟蹤調查,得到以下數據:患高血壓未患高血壓合計喜歡較咸食物34220254喜歡清淡食物2613531379合計6015731633 有多大把握認為高血壓病與食鹽攝入量有關? 解:由公式得 , ∴有的把握說高血壓病與食鹽攝入量有關. 例2 對某種產品進行一項腐蝕加工試驗,得到腐蝕時間x(s)和腐蝕深度y()數據如下:51020304050606590120681316171925252946 (1)進行相關性檢驗; (2)如果x與y之間具有線性相關關系,求出線性回歸方程,并預測當腐蝕時間為75s時,腐蝕深度為多少? 解:(1)計算得, 則x與y具有線性相關關系. (2)求得,, ∴線性回歸方程為, 當腐蝕時間為75s時,將代入得, ∴腐蝕深度約為29.身邊的統計案例 統計與實際生活密切相關,涉及知識面廣,題目新穎,特別是能夠與工農業生產、生活、文化、體育等實際問題相結合,因而在高考中也會越來越受到重視. 一、統計知識在生產中的應用 例1 為了研究三月下旬的平均氣溫()與四月二十號前棉花害蟲化蛹高峰日()的關系,某地區觀察了2001年到2006年的情況,得到下面的數據:年份200120022003200420052006(℃)24.429.632.928.730.328.9(日)19611018 據氣象預測,該地區在2007年三月下旬的平均氣溫為27℃,試估計2007年四月份化蛹高峰日為哪天? 解:運用科學計算器,得,,,, 所以,,可知回歸方程為, 當時,,據此,可估計該地區2007年4月12日或13日為化蛹高峰日. 點評:求線性回歸方程,只需掌握計算公式,通常用計算器來完成.在有的專門的計算器中,可通過直接按鍵得到線性回歸方程的系數.而用一般的科學計算器進行計算,則需要列出表格,根據表格內的數據求出回歸直線方程. 二、統計知識在質量監測中的應用 例2 某奶制品廠生產袋裝奶粉,按標準每袋奶粉凈重應為454克,在生產的實際過程中,由于各種隨機因素的影響,裝袋機不可能保證每袋奶粉的凈重恰好等于454克,只可能限制它的誤差,即要求:①奶粉平均凈重為454克;②每袋奶粉凈重不能偏離454克太多,有一個限度即偏差不大于5克. 某日該廠進行抽樣檢查,從8∶00開始,每隔15分鐘抽檢一次,下表是部分抽檢結果:8:008:158:308:459:009:159:309:4510:00 (1)根據檢查情況,繪制質量控制圖; (2)請對檢查情況作一分析. 解:(1)根據抽查結果,繪制質量控制圖如右圖(其中橫坐標表示時間,縱坐標表示每袋奶粉的凈重,單位:克).對于給定的標準454克,在圖中畫一條直線,它過縱坐標軸上標有454的點且平行于橫軸,在上、下各畫一條與之平行的直線,它們與縱軸分別交于459、449處,這兩條線稱為上下控制線; (2)通過控制圖觀察,當圖中標出的點在兩條控制線之間時,該袋奶粉的凈重是符合要求的,可以認為生產是正常的;若該點在上、下控制線外,說明生產的產品出了問題,通常要調整設備甚至停產,尋找原因進行整頓. 根據控制圖上多個點的變動趨勢,可以了解到裝袋機的運行情況,發現,盡管9點45(t8)以前的點都在控制線內,但在上方的點比在下方的點多,從而會使平均凈重大于454克,另外從9點()開始,每袋奶粉越來越重,在10點()時,樣本的重量已超過459克,所以該設備應停止生產. 點評:新課標要求學生通過對統計案例的學習,學會使用一些常用的統計方法解決實際問題,了解實際的推斷原理、假設檢驗的基本思想、方法及初步應用,了解獨立性檢驗及回歸分析的基本思想、方法及初步應用.這部分內容比較開放,是新高考命題中較好的命題題型. 三、統計知識在人口預測中的應用 例3 某國從1790年至1950年人口數據統計資料:時間(年)179018001810182018301840185018601870人口(百萬)3.9295.3087.249.36812.86617.06923.18231.44338.558時間(年)18801890190019101920193019401950人口(百萬)50.15662.94875.99591.972105.711122.775131.669150.697 試利用上述資料預測該國1980年的人口數(假設該國政治、社會、經濟環境穩定,且人口數相對于時間是連續的). 分析:以軸代表時間,軸代表人口數,建立直角坐標系,畫出散點圖(略).觀察散點圖可以發現,從1890年以后散點近似分布在一條直線上,故可采用線性回歸模型擬合.(而從散點圖的整體趨勢來看,也可以認為散點近似分布在一條拋物線上,可采用二次函數模型擬合.請同學們自己試著做.) 解:由散點圖可以看出,1890年以后散點大致分布在一條直線上,設線性回歸直線方程為,由公式求得,,即. ∴當時,,即1980年該國人口預測為百萬人. 點評:本題主要考查對信息的提取,圖表的分析、加工和處理能力.線性回歸模型是在依據部分已知數據的基礎上作出的,因此精確度比較差.當然,同學們可以進一步利用回歸分析的方法,通過相關系數來判斷這個模型的擬合效果. 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫