中文字幕精品无码一区二区,成全视频在线播放观看方法,大伊人青草狠狠久久,亚洲一区影音先锋色资源

第八章 成對數(shù)據(jù)的統(tǒng)計分析 學(xué)案(原卷版+解析版)

資源下載
  1. 二一教育資源

第八章 成對數(shù)據(jù)的統(tǒng)計分析 學(xué)案(原卷版+解析版)

資源簡介

第八章 成對數(shù)據(jù)的統(tǒng)計分析(知識歸納+題型突破)
1.通過具體案例,引導(dǎo)學(xué)生理解兩個隨機(jī)變量的相關(guān)性可以通過成對樣本數(shù)據(jù)進(jìn)行分析,了解樣本相關(guān)系數(shù)的統(tǒng)計含義.
2.理解利用一元線性回歸模型可以研究變量之間的相關(guān)關(guān)系,并進(jìn)行預(yù)測.
3.了解 列聯(lián)表,理解利用列聯(lián)表可以檢驗(yàn)兩個隨機(jī)變量的獨(dú)立性.
4.運(yùn)用散點(diǎn)圖、相關(guān)系數(shù)、最小二乘思想、小概率原理、頻率估計概率、假設(shè)檢驗(yàn)基本原理等解決簡單的實(shí)際問題,會利用統(tǒng)計軟件進(jìn)行數(shù)據(jù)分析.
知識點(diǎn)1:相關(guān)關(guān)系的強(qiáng)弱
(1)樣本相關(guān)系數(shù)
現(xiàn)實(shí)生活中的數(shù)據(jù),由于度量對象和單位的不同等,數(shù)值會有大有小,為了去除這些因素的影響,統(tǒng)計學(xué)里一般用來衡量與的線性相關(guān)性強(qiáng)弱,我們稱為變量和變量的樣本相關(guān)系數(shù).
(2)相關(guān)系數(shù)的性質(zhì)
①當(dāng)時,稱成對樣本數(shù)據(jù)正相關(guān);當(dāng)時,成對樣本數(shù)據(jù)負(fù)相關(guān);當(dāng)時,成對樣本數(shù)據(jù)間沒有線性相關(guān)關(guān)系.
②樣本相關(guān)系數(shù)的取值范圍為
當(dāng)越接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng);
當(dāng)越接近0時,成對樣本數(shù)據(jù)的線性相關(guān)程度越弱.
知識點(diǎn)2:經(jīng)驗(yàn)回歸方程的求解法:最小二乘法
回歸直線方程過樣本點(diǎn)的中心,是回歸直線方程最常用的一個特征;
我們將稱為關(guān)于的線性回歸方程,也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱為經(jīng)驗(yàn)回歸直線。這種求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法,求得的,叫做,的最小二乘估計,其中稱為回歸系數(shù),它實(shí)際上也就是經(jīng)驗(yàn)回歸直線的斜率,為截距.
其中
知識點(diǎn)3:殘差
(1)殘差
對于響應(yīng)變量,通過觀測得到的數(shù)據(jù)稱為觀測值,通過經(jīng)驗(yàn)回歸方程得到的稱為預(yù)測值,觀測值減去預(yù)測值稱為殘差.
(2)殘差圖
作圖時縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號,或身高數(shù)據(jù),或體重估計值等,這樣作出的圖形稱為殘差圖.若殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域內(nèi),帶狀區(qū)域越窄,則說明擬合效果越好.
(3)殘差分析
殘差是隨機(jī)誤差的估計結(jié)果,通過殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.其步驟為:計算殘差化殘差圖在殘差圖中分析殘差特性.
知識點(diǎn)4:決定系數(shù)
(1)殘差平方和
殘差平方和,殘差平方和越小,模型擬合效果越好,殘差平方和越大,模型擬合效果越差.
(2)決定系數(shù)
決定系數(shù)是度量模型擬合效果的一種指標(biāo),在線性模型中,它代表解釋變量客戶預(yù)報變量的能力.
,越大,即擬合效果越好,越小,模型擬合效果越差.
(3)決定系數(shù)與相關(guān)系數(shù)的聯(lián)系與區(qū)別
①相關(guān)系數(shù)反映兩個變量的相關(guān)關(guān)系的強(qiáng)弱及正相關(guān)或負(fù)相關(guān),決定系數(shù)反映回歸模型的擬合效果.
②在含有一個解釋變量的線性模型中,決定系數(shù)的數(shù)值是相關(guān)系數(shù)的平方,其變化范圍為,而相關(guān)系數(shù)的變化范圍為.
③當(dāng)相關(guān)系數(shù)接近于1時,說明兩變量的相關(guān)性較強(qiáng),當(dāng)接近于0時,說明兩變量的相關(guān)性較弱;而當(dāng)接近于1時,說明經(jīng)驗(yàn)回歸方程的擬合效果較好.
知識點(diǎn)5:分類變量與列聯(lián)表
(1)分類變量
為了方便,會使用一種特殊的隨機(jī)變量,區(qū)別不同的現(xiàn)象或性質(zhì),這隨機(jī)變量稱為分類變量.
(2)列聯(lián)表
①2×2列聯(lián)表給出了兩個分類變量數(shù)據(jù)的交叉分類頻數(shù).
②定義一對分類變量和,我們整理數(shù)據(jù)如下表所示:
合計
合計
知識點(diǎn)6:獨(dú)立性檢驗(yàn)
(1)獨(dú)立性檢驗(yàn)定義:
利用的取值推斷分類變量和是否獨(dú)立的方法稱為獨(dú)立性檢驗(yàn),讀作“卡方獨(dú)立性檢驗(yàn)”.簡稱獨(dú)立性檢驗(yàn).
(2)獨(dú)立性檢驗(yàn)公式:
其中(注意使用公式時分子的平方不要忽略了)
題型一:相關(guān)系數(shù)的意義及辨析
【例1】.(2022下·河南南陽·高二校聯(lián)考專題練習(xí))在一組樣本數(shù)據(jù)為,,,(,,,,,不全相等)的散點(diǎn)圖中,若所有樣本點(diǎn)都在直線上,則這組樣本數(shù)據(jù)的相關(guān)系數(shù)為( )
A. B. C.1 D.-1
【例2】(2024上·江西吉安·高一江西省新干中學(xué)期末)對于樣本相關(guān)系數(shù),下列說法錯誤的是(  )
A.可以用來判斷成對樣本數(shù)據(jù)相關(guān)的正負(fù)性
B.可以是正的,也可以是負(fù)的
C.樣本相關(guān)系數(shù)越大,成對樣本數(shù)據(jù)的線性相關(guān)程度也越高
D.取值范圍是
鞏固訓(xùn)練
1.(2023·四川樂山·統(tǒng)考一模)對四組數(shù)據(jù)進(jìn)行統(tǒng)計,獲得如下散點(diǎn)圖,關(guān)于其相關(guān)系數(shù)的比較,說法正確的是( )

A. B.
C. D.
2.(2022下·遼寧大連·高二大連八中校考階段練習(xí))設(shè)兩個變量和之間具有線性相關(guān)關(guān)系,它們的相關(guān)系數(shù)為關(guān)于的回歸直線方程為,則( )
A.與的符號相反 B.與的符號相同
C.與的符號相同 D.與的符號相反
題型二:相關(guān)系數(shù)計算
【例1】(2024上·天津·高三校聯(lián)考期末)學(xué)習(xí)于才干信仰,猶如運(yùn)動于健康體魄,持之已久、行之愈遠(yuǎn)愈受益.為實(shí)現(xiàn)中華民族偉大復(fù)興,全國各行各業(yè)掀起了“學(xué)習(xí)強(qiáng)國”的高潮.某老師很喜歡“學(xué)習(xí)強(qiáng)國”中“挑戰(zhàn)答題”模塊,他記錄了自己連續(xù)七天每天一次最多答對的題數(shù)如下表:
天數(shù)x 1 2 3 4 5 6 7
一次最多答對題數(shù)y 12 15 16 18 21 24 27
參考數(shù)據(jù):,,,,,
相關(guān)系數(shù)
由表中數(shù)據(jù)可知該老師每天一次最多答對題數(shù)y與天數(shù)x之間是 相關(guān)(填“正”或“負(fù)”),其相關(guān)系數(shù) (結(jié)果保留兩位小數(shù))
【例2】(2023·河南·統(tǒng)考模擬預(yù)測)黨的二十大以來,國家不斷加大對科技創(chuàng)新的支持力度,極大鼓舞了企業(yè)持續(xù)投入研發(fā)的信心.某科技企業(yè)在國家一系列優(yōu)惠政策的大力扶持下,通過不斷的研發(fā)和技術(shù)革新,提升了企業(yè)收益水平.下表是對2023 年1 ~5月份該企業(yè)的利潤y(單位:百萬)的統(tǒng)計.
月份 1 月 2 月 3 月 4 月 5 月
月份編號x 1 2 3 4 5
利潤y(百萬) 7 12 13 19 24
(1)根據(jù)統(tǒng)計表,求該企業(yè)的利潤y與月份編號x的樣本相關(guān)系數(shù)(精確到0.01),并判斷它們是否具有線性相關(guān)關(guān)系(,則認(rèn)為y與x的線性相關(guān)性較強(qiáng),,則認(rèn)為y與x的線性相關(guān)性較弱.);
(2)該企業(yè)現(xiàn)有甲、乙兩條流水線生產(chǎn)同一種產(chǎn)品.為對產(chǎn)品質(zhì)量進(jìn)行監(jiān)控,質(zhì)檢人員先用簡單隨機(jī)抽樣的方法從甲、乙兩條流水線上分別抽取了5件、3件產(chǎn)品進(jìn)行初檢,再從中隨機(jī)選取3件做進(jìn)一步的質(zhì)檢,記抽到“甲流水線產(chǎn)品”的件數(shù)為,試求的分布列與期望.
附:相關(guān)系數(shù)
【例3】(2023·全國·高二課堂例題)某研究者搜集了某種花的一些數(shù)據(jù)(見下表),試分別計算花瓣長與花枝長之間、花瓣長與花萼長之間的相關(guān)關(guān)系(結(jié)果保留三位小數(shù)).
花瓣長x 49 44 32 42 32 53 36 39 37 45 41 48 45 39 40 34 37 35
花枝長y 27 24 12 22 13 29 14 20 16 21 22 25 23 18 20 15 20 13
花萼長z 19 16 12 17 10 19 15 14 15 21 14 22 22 15 14 15 15 16
相關(guān)系數(shù),
鞏固訓(xùn)練
1.(2023上·高二課時練習(xí))據(jù)說職工遲到的頻率與其居住地離上班地點(diǎn)的遠(yuǎn)近有關(guān).為驗(yàn)證這個說法,一位社會學(xué)家隨機(jī)抽取10名職工進(jìn)行了調(diào)查,其調(diào)查數(shù)據(jù)如下表所示.
職工編號 年遲到次數(shù)/次 住地遠(yuǎn)近/km 職工編號 年遲到次數(shù)/次 住地遠(yuǎn)近/km
1 8 1.1 6 3 10.1
2 5 2.9 7 5 12.0
3 8 4.0 8 2 14.3
4 7 5.9 9 4 14.1
5 6 8.2 10 2 7.8
試計算職工年遲到次數(shù)與住地遠(yuǎn)近之間的相關(guān)系數(shù).
2.(2023下·河南鄭州·高三鄭州外國語學(xué)校校考階段練習(xí))某公司進(jìn)行工資改革,將工作效率作為工資定檔的一個重要標(biāo)準(zhǔn),大大提高了員工的工作積極性,但也引起了一些老員工的不滿.為了調(diào)查員工的工資與工齡的情況,人力資源部隨機(jī)從公司的技術(shù)研發(fā)部門中抽取了16名員工了解情況,結(jié)果如下:
工齡(年) 1 2 3 4 5 6 7 8
年薪(萬) 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
工齡(年) 9 10 11 12 13 14 15 16
年薪(萬) 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
經(jīng)計算得,,,,其中表示工齡為i年的年薪,.
(1)求年薪與工齡i()的相關(guān)系數(shù)r,并回答是否可以認(rèn)為年薪與工齡具有線性相關(guān)關(guān)系(若,則可以認(rèn)為年薪與工齡不具有線性相關(guān)關(guān)系).
(2)在抽取的16名員工中,如果年薪都在之內(nèi),則繼續(xù)推進(jìn)工資改革,同時給每位老員工相應(yīng)的補(bǔ)貼,如果有員工年薪在之外,該員工會被人力資源部約談并進(jìn)行崗位調(diào)整,且需要重新計算原抽取的16名員工中留下的員工年薪的均值和標(biāo)準(zhǔn)差,由于人力資源部需要安撫老員工的情緒,工作繁重,現(xiàn)請你幫忙計算留下的員工年薪的均值和標(biāo)準(zhǔn)差.(精確到0.01)
附:樣本的相關(guān)系數(shù),,,, .
3.(2023下·高二單元測試)暑期社會實(shí)踐中,某數(shù)學(xué)興趣小組調(diào)查了某地家庭人口數(shù)x與每天對生活必需品的消費(fèi)y的情況,得到的數(shù)據(jù)如下表:
x/人 2 4 5 6 8
y/元 20 30 50 50 70
(1)利用相關(guān)系數(shù)r判斷y與x是否線性相關(guān);
(2)根據(jù)上表提供的數(shù)據(jù),求出y關(guān)于x的線性回歸方程.
題型三:殘差
【例1】(2022下·北京通州·高二統(tǒng)考期末)已知變量x和變量y的一組隨機(jī)觀測數(shù)據(jù).如果關(guān)于的經(jīng)驗(yàn)回歸方程是,那么當(dāng)時,殘差等于( )
A. B.0 C.10 D.110
【例2】(2022下·河南洛陽·高二統(tǒng)考期中)某種產(chǎn)品的廣告支出費(fèi)用x(單位:萬元)與銷售額y(單位:萬元)之間有如下關(guān)系:
x 2 4 5 6 8
y 30 40 70 50 60
已知y與x的線性回歸方程為,則當(dāng)廣告支出費(fèi)用為5萬元時,殘差為( )
A.40 B.30 C.20 D.10
【例3】(2023下·河北張家口·高二河北省尚義縣第一中學(xué)校考階段練習(xí))已知回歸方程,而試驗(yàn)中的一組數(shù)據(jù)是,,,則其殘差平方和是 .
鞏固訓(xùn)練
1.(2022下·四川成都·高二統(tǒng)考期中)某種產(chǎn)品的廣告費(fèi)支出x與銷售額y(單位:萬元)之間有下表關(guān)系
1 3 4 5 7
30 40 60 50 70
y與x的線性回歸方程為,當(dāng)廣告支出5萬元時,隨機(jī)誤差的效應(yīng)(殘差)為( )
A.20 B.-10 C.10 D.-6.5
2.(2024·云南楚雄·云南省楚雄彝族自治州民族中學(xué)校考一模)對具有線性相關(guān)關(guān)系的變量有一組觀測數(shù)據(jù)(),其經(jīng)驗(yàn)回歸方程為,且,,則相應(yīng)于點(diǎn)的殘差為 .
3.(2023下·山西太原·高二統(tǒng)考期中)已知回歸方程,而試驗(yàn)中的一組數(shù)據(jù)是,,,則其殘差平方和是 .
題型四:一元線性回歸模型
【例1】(2023·全國·高三校聯(lián)考專題練習(xí))某市政府為調(diào)查集貿(mào)蔬菜市場個體承包攤戶年收入情況,隨機(jī)抽取了6個攤戶進(jìn)行分析,得到樣本數(shù)據(jù),),其中和分別表示第個攤戶和該攤戶年收入(單位:萬元),如下
1 2 3 4 5 6
5 6 7 7 9 8
(1)請用相關(guān)系數(shù)判斷該組數(shù)據(jù)中與之間線性相關(guān)關(guān)系的強(qiáng)弱(若,相關(guān)性較強(qiáng);若,相關(guān)性一般;若,相關(guān)性較弱);
(2)求關(guān)于的線性回歸方程;
(3)若該集貿(mào)蔬菜市場個體承包攤戶有300個,根據(jù)題設(shè)估計該集貿(mào)蔬菜市場個體承包攤戶年收入總值.
參考公式:相關(guān)系數(shù),對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù),其回歸直線的斜率和截距的最小二乘估計分別為,,.
【例2】(2024·陜西咸陽·統(tǒng)考模擬預(yù)測)能源和環(huán)境問題是目前全球性急需解決的問題,雖然近百年人類文明有了前所未有的發(fā)展,但對于能源的使用和環(huán)境的破壞也造成了嚴(yán)重的后果,發(fā)展新能源是時代的要求,是未來生存的要求.新能源汽車不僅對環(huán)境保護(hù)具有重大的意義而且還能夠減少對不可再生資源的開發(fā),是全球汽車發(fā)展的重要方向.“保護(hù)環(huán)境,人人有責(zé)”,在政府和有關(guān)企業(yè)的努力下,某市近幾年新能源汽車的購買情況如下表所示:
年份x 2019 2020 2021 2022 2023
汽車購買y(萬輛) 0.30 0.60 1.00 1.40 1.70
(1)根據(jù)上表數(shù)據(jù),計算與的相關(guān)系數(shù),并說明與的線性相關(guān)性強(qiáng)弱(若,則認(rèn)為與線性相關(guān)性很強(qiáng);若,則認(rèn)為與線性相關(guān)性一般;若,則認(rèn)為與線性相關(guān)性較弱);
(2)求關(guān)于的線性回歸方程,并預(yù)測該市2024年新能源汽車購買輛數(shù)(精確到個位).
參考公式:,,
參考數(shù)值:.
【例3】(2024上·江西九江·高二統(tǒng)考期末)2023年9月23日—10月8日,亞運(yùn)會在杭州舉行,“碳中和”是本屆亞運(yùn)會一大亮點(diǎn).為了打造碳中和亞運(yùn)會,杭州亞運(yùn)會上線了“亞運(yùn)碳中和-減污降碳協(xié)同”數(shù)字化管理平臺.該平臺將數(shù)字化技術(shù)運(yùn)用到碳排放采集 核算 減排 注銷 評價管理全流程,探索建立了一套科學(xué)完整的碳排放管理體系.值此機(jī)會,某家公司重點(diǎn)推出新型品牌新能源汽車,以下是其中五個月的銷售單:
2023月份 5 6 7 8 9
月份代碼 1 2 3 4 5
新能源車銷售(萬輛) 1.6 2.1 2.7 3.7 4.6
(1)根據(jù)表中數(shù)據(jù),求出關(guān)于的線性回歸方程;
(2)隨著亞運(yùn)會的火熱,新能源汽車也會一直持續(xù)下去,試估計2023年12月份該公司出售多少輛新能源汽車?
參考公式:對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù),其回歸直線的斜率和截距的最小二乘估計公式分別為.
鞏固訓(xùn)練
1.(2024·陜西咸陽·統(tǒng)考模擬預(yù)測)為慶祝元旦,某商場回饋消費(fèi)者,準(zhǔn)備舉辦一次有獎促銷活動,如果顧客一次消費(fèi)達(dá)到500元,可參加抽獎活動,規(guī)則如下;抽獎盒子中初始裝有白球和紅球各一個,每次有放回的任取一個,連續(xù)取兩次,將以上過程記為一輪.如果每一輪取到的兩個球都是白球,則記該輪為成功,活動結(jié)束.否則記為失敗,隨即獲得紀(jì)念品1份,當(dāng)然,如果顧客愿意可在盒子中再放入一個紅球,然后接著進(jìn)行下一輪抽獎,如此不斷繼續(xù)下去,直至成功.
(1)某顧客進(jìn)行該抽獎試驗(yàn)時,最多進(jìn)行三輪,即使第三輪不成功,也停止抽獎,記其進(jìn)行抽獎試驗(yàn)的輪次數(shù)為隨機(jī)變量X,求X的分布列和數(shù)學(xué)期望;
(2)為驗(yàn)證抽獎試驗(yàn)成功的概率不超過,有1000名數(shù)學(xué)愛好者獨(dú)立的進(jìn)行該抽球試驗(yàn),記t表示成功時抽獎試驗(yàn)的輪次數(shù),y表示對應(yīng)的人數(shù),部分統(tǒng)計數(shù)據(jù)如下表:
t 1 2 3 4 5
y 232 98 60 40 20
求y關(guān)于t的回歸方程:,并預(yù)測成功的總?cè)藬?shù)(四舍五入精確到1).
附:經(jīng)驗(yàn)回歸方程系數(shù):,.
參考數(shù)據(jù):,,(其中).
2.(2023下·陜西咸陽·高二咸陽市實(shí)驗(yàn)中學(xué)校考階段練習(xí))如圖是某機(jī)構(gòu)統(tǒng)計的某地區(qū)2016年至2022年生活垃圾無害化處理量y(單位:萬噸)的折線圖.

注:年份代碼1-7分別對應(yīng)年份2016-2022.
(1)由折線圖看出,可用線性回歸模型擬合y與t的關(guān)系,請用相關(guān)系數(shù)加以說明;
(2)建立y關(guān)于t的回歸方程(系數(shù)精確到0.01),預(yù)測2024年該地區(qū)生活垃圾無害化處理量.
參考數(shù)據(jù):,,,,.
參考公式:相關(guān)系數(shù),當(dāng)時認(rèn)為兩個變量有很強(qiáng)的線性相關(guān)關(guān)系;回歸方程中斜率和截距的最小乘估計公式分別為,.
3.(2024上·山東日照·高二統(tǒng)考期末)發(fā)展新能源汽車是我國從汽車大國邁向汽車強(qiáng)國的必由之路,是應(yīng)對氣候變化推動綠色發(fā)展的戰(zhàn)略舉措.隨著國務(wù)院《新能源汽車產(chǎn)業(yè)發(fā)展規(guī)劃(2021—2035)》的發(fā)布,我國自主品牌汽車越來越具備競爭力.國產(chǎn)某品牌汽車對市場進(jìn)行調(diào)研,統(tǒng)計了該品牌新能源汽車在某城市年前幾個月的銷售量(單位:輛),用表示第月份該市汽車的銷售量,得到如下統(tǒng)計表格:
1 2 3 4 5 6 7
28 32 37 45 47 52 60
(1)經(jīng)研究,、滿足線性相關(guān)關(guān)系,求關(guān)于的線性回歸方程,并根據(jù)此方程預(yù)測該店月份的成交量(、按四舍五入精確到整數(shù));
(2)該市某店為感謝客戶,決定針對該品牌的汽車成交客戶開展抽獎活動,設(shè)“一等獎”、“二等獎”和“祝您平安”三種獎項(xiàng),“一等獎”獎勵千元;“二等獎”獎勵千元;“祝您平安”獎勵紀(jì)念品一份.在一次抽獎活動中獲得“二等獎”的概率為,獲得一份紀(jì)念品的概率為,現(xiàn)有甲、乙兩個客戶參與抽獎活動,假設(shè)他們是否中獎相互獨(dú)立,求此二人所獲獎金總額(千元)的分布列及數(shù)學(xué)期望.
參考數(shù)據(jù)及公式:,,.
題型五:相關(guān)指數(shù)
【例1】(2022上·貴州貴陽·高二統(tǒng)考期末)【閱讀材料1】
我們在研究兩個變量之間的相關(guān)關(guān)系時,往往先選取若干個樣本點(diǎn)(),(),……,(),將樣本點(diǎn)畫在平面直角坐標(biāo)系內(nèi),就得到樣本的散點(diǎn)圖.觀察散點(diǎn)圖,如果所有樣本點(diǎn)都落在某一條直線附近,變量之間就具有線性相關(guān)關(guān)系,如果所有的樣本點(diǎn)都落在某一非線性函數(shù)圖象附近,變量之間就有非線性相關(guān)關(guān)系.在統(tǒng)計學(xué)中經(jīng)常選擇線性或非線性(函數(shù))回歸模型來刻畫相關(guān)關(guān)系,并且可以用適當(dāng)?shù)姆椒ㄇ蟪龌貧w模型的方程,還常用相關(guān)指數(shù)R2來刻畫回歸的效果,相關(guān)指數(shù)R2的計算公式為:
當(dāng)R2越大時,回歸方程的擬合效果越好;當(dāng)R2越小時,回歸方程的擬合效果越差,R2是常用的選擇模型的指標(biāo)之一,在實(shí)際應(yīng)用中應(yīng)該盡量選擇R2較大的回歸模型.
【閱讀材料2】
2021年6月17日9時22分,我國酒泉衛(wèi)星發(fā)射中心用長征二號F遙十二運(yùn)載火箭,成功將神舟十二號載人飛船送入預(yù)定軌道,順利將聶海勝、劉伯明、湯洪胺3名航天員送入太空,發(fā)射取得圓滿成功,這標(biāo)志著中國人首次進(jìn)入自己的空間站.某公司負(fù)責(zé)生產(chǎn)的A型材料是神舟十二號的重要零件,該材料應(yīng)用前景十分廣泛,該公司為了將A型材料更好地投入商用,擬對A型材料進(jìn)行應(yīng)用改造,根據(jù)市場調(diào)研與模擬,得到應(yīng)用改造投入x(億元)與產(chǎn)品的直接收益y(億元)的數(shù)據(jù)統(tǒng)計如下:
序號 1 2 3 4 5 6 7 8 9 10 11 12
x 2 3 4 6 8 10 13 21 22 23 24 25
y 15 22 27 40 48 54 60 68.5 68 67.5 66 65
當(dāng)0模型①:;模型②:;
當(dāng)x>13時,確定y與x滿足的線性回歸直線方程為.
根據(jù)以上閱讀材料,解答以下問題:
(1)根據(jù)下列表格中的數(shù)據(jù),比較當(dāng)0回歸模型 模型① 模型②
回歸方程
79.13 20.2
(2)當(dāng)應(yīng)用改造的投入為20億元時,以回歸直線方程為預(yù)測依據(jù),計算公司的收益約為多少.
附:①若最小二乘法求得回歸直線方程為,則;

③,當(dāng)時,.
【例2】(2021下·黑龍江哈爾濱·高二哈九中校考期末)全球化時代,中國企業(yè)靠什么在激烈的競爭中成為世界一流企業(yè)呢?由人民日報社指導(dǎo),《中國經(jīng)濟(jì)周刊》主辦的第十八屆中國經(jīng)濟(jì)論壇在人民日報社舉行,就中國企業(yè)如何提升全球行業(yè)競爭力進(jìn)行了研討.?dāng)?shù)據(jù)顯示,某企業(yè)近年加大了科技研發(fā)資金的投入,其科技投入(百萬元)與收益(百萬元)的數(shù)據(jù)統(tǒng)計如下:
科技投入 1 2 3 4 5 6 7
收益 19 20 22 31 40 50 70
根據(jù)數(shù)據(jù)特點(diǎn),甲認(rèn)為樣本點(diǎn)分布在指數(shù)型曲線的周圍,據(jù)此他對數(shù)據(jù)進(jìn)行了一些初步處理.如下表:
5 140 1239 149 2134 130
其中,.
(1)請根據(jù)表中數(shù)據(jù),建立關(guān)于的回歸方程(系數(shù)精確到0.1,用的近似值算);
(2)①乙認(rèn)為樣本點(diǎn)分布在直線的周圍,并計算得回歸方程為,以及該回歸模型的決定系數(shù)(即相關(guān)指數(shù)),試計算,比較甲乙兩人所建立的模型,誰的擬合效果更好?(精確到0.001)
②由①所得的結(jié)論,計算該企業(yè)欲使收益達(dá)到1億元,科技投入的費(fèi)用至少要多少百萬元?(精確到0.1)
附:對于一組數(shù)據(jù),,…,,其回歸直線方程的斜率和截距的最小二乘法估計分別為,,決定系數(shù):.參考數(shù)據(jù):.
鞏固訓(xùn)練
1.(2020·黑龍江哈爾濱·哈爾濱市第六中學(xué)校校考三模)“海水稻”就是耐鹽堿水稻,是一種介于野生稻和栽培稻之間的普遍生長在海邊灘涂地區(qū),具有耐鹽堿的水稻,它比其它普通的水稻均有更強(qiáng)的生存競爭能力,具有抗?jié)常共∠x害,抗倒伏等特點(diǎn),還具有預(yù)防和治療多種疾病的功效,防癌效果尤為顯著.海水稻的灌溉是將海水稀釋后進(jìn)行灌溉.某試驗(yàn)基地為了研究海水濃度(‰)對畝產(chǎn)量(噸)的影響,通過在試驗(yàn)田的種植實(shí)驗(yàn),測得了某種海水稻的畝產(chǎn)量與海水濃度的數(shù)據(jù)如表.繪制散點(diǎn)圖發(fā)現(xiàn),可用線性回歸模型擬合畝產(chǎn)量與海水濃度之間的相關(guān)關(guān)系,用最小二乘法計算得與之間的線性回歸方程為.
海水濃度(‰) 3 4 5 6 7
畝產(chǎn)量(噸) 0.62 0.58 0.49 0.4 0.31
殘差
(1)請你估計:當(dāng)澆灌海水濃度為8‰時,該品種的畝產(chǎn)量.
(2)①完成上述殘差表:
②統(tǒng)計學(xué)中,常用相關(guān)指數(shù)來刻畫回歸效果,越大,模型擬合效果越好,并用它來說明預(yù)報變量與解釋變量的相關(guān)性.你能否利用以上表格中的數(shù)據(jù),利用統(tǒng)計學(xué)的相關(guān)知識,說明澆灌海水濃度對畝產(chǎn)量的貢獻(xiàn)率?(計算中數(shù)據(jù)精確到)
(附:殘差公式,相關(guān)指數(shù))
2.(2018·廣東茂名·統(tǒng)考一模)一只藥用昆蟲的產(chǎn)卵數(shù)y與一定范圍內(nèi)的溫度x有關(guān),現(xiàn)收集了該種藥用昆蟲的6組觀測數(shù)據(jù)如下表:
溫度x/℃ 21 23 24 27 29 32
產(chǎn)卵數(shù)y/個 6 11 20 27 57 77
經(jīng)計算得:
,,線性回歸模型的殘差平方和,,
其中分別為觀測數(shù)據(jù)中的溫度和產(chǎn)卵數(shù),
(1)若用線性回歸模型,求y關(guān)于x的回歸方程(精確到0.1);
(2)若用非線性回歸模型求得y關(guān)于x的回歸方程為,且相關(guān)指數(shù).
①試與1中的回歸模型相比,用說明哪種模型的擬合效果更好.
②用擬合效果好的模型預(yù)測溫度為35℃時該用哪種藥用昆蟲的產(chǎn)卵數(shù)(結(jié)果取整數(shù))
附:一組數(shù)據(jù)其回歸直線的斜率和截距的最小二乘估計為,;相關(guān)指數(shù).
題型六:非線性擬合
【例1】(2023下·山西·高二統(tǒng)考期中)某生產(chǎn)制造企業(yè)統(tǒng)計了近10年的年利潤(千萬元)與每年投入的某種材料費(fèi)用(十萬元)的相關(guān)數(shù)據(jù),作出如下散點(diǎn)圖:
選取函數(shù)作為每年該材料費(fèi)用和年利潤的回歸模型.若令,則,得到相關(guān)數(shù)據(jù)如表所示:
31.5 15 15 49.5
(1)求出與的回歸方程;
(2)計劃明年年利潤額突破1億,則該種材料應(yīng)至少投入多少費(fèi)用?(結(jié)果保留到萬元)參考數(shù)據(jù):.
【例2】(2023·貴州貴陽·校聯(lián)考模擬預(yù)測)為了研究某種細(xì)菌隨天數(shù)x變化的繁殖個數(shù)y,收集數(shù)據(jù)如下:
天數(shù)x 1 2 3 4 5 6
繁殖個數(shù)y 6 12 25 49 95 190
(1)在圖中作出繁殖個數(shù)y關(guān)于天數(shù)x變化的散點(diǎn)圖,并由散點(diǎn)圖判斷(a,b為常數(shù))與(,為常數(shù),且,)哪一個適宜作為繁殖個數(shù)y關(guān)于天數(shù)x變化的回歸方程類型?(給出判斷即可,不必說明理由)
(2)對于非線性回歸方程(,為常數(shù),且,),令,可以得到繁殖個數(shù)的對數(shù)z關(guān)于天數(shù)x具有線性關(guān)系及一些統(tǒng)計量的值.
3.50 62.83 3.53 17.50 596.57 12.09
①證明:“對于非線性回歸方程,令,可以得到繁殖個數(shù)的對數(shù)z關(guān)于天數(shù)x具有線性關(guān)系(即,β,α為常數(shù))”;
②根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程(系數(shù)保留2位小數(shù)).
附:對于一組數(shù)據(jù),,…,,其回歸直線方程的斜率和截距的最小二乘估計分別為,.
【例3】(2022上·重慶沙坪壩·高三重慶八中校考階段練習(xí))多年來,清華大學(xué)電子工程系黃翔東教授團(tuán)隊致力于光譜成像芯片的研究,2022年6月研制出國際首款實(shí)時超光譜成像芯片,相比已有光譜檢測技術(shù),實(shí)現(xiàn)了從單點(diǎn)光譜儀到超光譜成像芯片的跨越,為制定下一年的研發(fā)投入計劃,該研發(fā)團(tuán)隊為需要了解年研發(fā)資金投入量x(單位:億元)對年銷售額(單位:億元)的影響,結(jié)合近12年的年研發(fā)資金投入量x,和年銷售額,的數(shù)據(jù)(,2,,12),該團(tuán)隊建立了兩個函數(shù)模型:①②,其中均為常數(shù),e為自然對數(shù)的底數(shù),經(jīng)對歷史數(shù)據(jù)的初步處理,得到散點(diǎn)圖如圖,令,計算得如下數(shù)據(jù):
20 66 770 200 14
460 3125000 21500
(1)設(shè)和的相關(guān)系數(shù)為和的相關(guān)系數(shù)為,請從相關(guān)系數(shù)的角度,選擇一個擬合程度更好的模型;
(2)(i)根據(jù)(1)的選擇及表中數(shù)據(jù),建立關(guān)于的回歸方程(系數(shù)精確到0.01);
(ii)若下一年銷售額需達(dá)到80億元,預(yù)測下一年的研發(fā)資金投入量是多少億元?
附:①相關(guān)系數(shù),回歸直線中斜率和截距的最小二乘估計公式分別為:,;
②參考數(shù)據(jù):.
鞏固訓(xùn)練
1.(2022下·福建三明·高二統(tǒng)考期末)在國家大力發(fā)展新能源汽車產(chǎn)業(yè)的政策下,我國新能源汽車的產(chǎn)銷量高速增長. 已知某地區(qū)2014年底到2021年底新能源汽車保有量的數(shù)據(jù)統(tǒng)計表如下:
年份(年) 2014 2015 2016 2017 2018 2019 2020 2021
年份代碼x 1 2 3 4 5 6 7 8
保有量y/千輛 1.95 2.92 4.38 6.58 9.87 15.00 22.50 33.70
參考數(shù)據(jù):,,其中
(1)根據(jù)統(tǒng)計表中的數(shù)據(jù)畫出散點(diǎn)圖(如圖),請判斷與哪一個更適合作為y關(guān)于x的經(jīng)驗(yàn)回歸方程(給出判斷即可,不必說明理由),并根據(jù)你的判斷結(jié)果建立y關(guān)于x的經(jīng)驗(yàn)回歸方程:
(2)假設(shè)每年新能源汽車保有量按(1)中求得的函數(shù)模型增長,且傳統(tǒng)能源汽車保有量每年下降的百分比相同.若2021年底該地區(qū)傳統(tǒng)能源汽車保有量為500千輛,預(yù)計到2026年底傳統(tǒng)能源汽車保有量將下降10%.試估計到哪一年底新能源汽車保有量將超過傳統(tǒng)能源汽車保有量.
參考公式:對于一組數(shù)據(jù),v1),),…,,其經(jīng)驗(yàn)回歸直線的斜率和截距的最小二乘估計公式分別為,;
2.(2022·山東聊城·統(tǒng)考三模)為迎接年北京冬奧會,踐行“更快更高更強(qiáng)”的奧林匹克格言,落實(shí)全民健身國家戰(zhàn)略.某校高二年級發(fā)起了“發(fā)揚(yáng)奧林匹克精神,鍛煉健康體魄”的年度主題活動,經(jīng)過一段時間后,學(xué)生的身體素質(zhì)明顯提高.
(1)為了解活動效果,該年級對開展活動以來近個月體重超重的人數(shù)進(jìn)行了調(diào)查,調(diào)查結(jié)果統(tǒng)計如上圖,根據(jù)上面的散點(diǎn)圖可以認(rèn)為散點(diǎn)集中在曲線的附近,請根據(jù)下表中的數(shù)據(jù)求出該年級體重超重人數(shù)與月份之間的經(jīng)驗(yàn)回歸方程(系數(shù)和的最終結(jié)果精確到),并預(yù)測從開展活動以來第幾個月份開始該年級體重超標(biāo)的人數(shù)降至人以下?
月份
體重超標(biāo)人數(shù)
(2)在某次足球訓(xùn)練課上,球首先由隊員控制,此后足球僅在、、三名隊員之間傳遞,假設(shè)每名隊員控球時傳給其他隊員的概率如下表所示:
控球隊員
接球隊員
概率
若傳球次,記隊員控球次數(shù)為,求的分布列及均值.
附:經(jīng)驗(yàn)回歸方程:中,,;
參考數(shù)據(jù):,,,.
3.(2022下·山西太原·高二校考期中)某公司對某產(chǎn)品作市場調(diào)查,獲得了該產(chǎn)品的定價(單位:萬元/噸)和一天的銷量(噸)的一組數(shù)據(jù),根據(jù)這組數(shù)據(jù)制作了如下統(tǒng)計表和散點(diǎn)圖.
0.33 10 3 0.164 100 68 350
表中.
(1)根據(jù)散點(diǎn)圖判斷,與哪一個更適合作為關(guān)于的經(jīng)驗(yàn)回歸方程;(給出判斷即可,不必說明理由)
(2)根據(jù)(1)的判斷結(jié)果,建立關(guān)于的經(jīng)驗(yàn)回歸方程;
題型七:獨(dú)立性檢驗(yàn)(選填)
【例1】(2023上·全國·高三專題練習(xí))千百年來,我國勞動人民在生產(chǎn)實(shí)踐中根據(jù)云的形狀、走向、速度、厚度、顏色等的變化,總結(jié)了豐富的“看云識天氣”的經(jīng)驗(yàn),并將這些經(jīng)驗(yàn)編成諺語,如“天上鉤鉤云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同學(xué)為了驗(yàn)證“日落云里走,雨在半夜后”,觀察了地區(qū)A的100天日落和夜晚天氣,得到如下2×2列聯(lián)表(單位:天),并計算得到,下列小波對地區(qū)A天氣的判斷不正確的是( )
日落云里走 夜晚天氣 下雨 未下雨
出現(xiàn) 25 5
未出現(xiàn) 25 45
參考公式:
臨界值參照表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.夜晚下雨的概率約為
B.未出現(xiàn)“日落云里走”,夜晚下雨的概率約為
C.據(jù)小概率值的獨(dú)立性檢驗(yàn),認(rèn)為“日落云里走”是否出現(xiàn)與夜晚天氣有關(guān)
D.出現(xiàn)“日落云里走”, 據(jù)小概率值的獨(dú)立性檢驗(yàn),可以認(rèn)為夜晚會下雨
【例2】(2023上·高二課時練習(xí))手機(jī)給人們的生活帶來便捷,但同時也對中學(xué)生的生活和學(xué)習(xí)造成了一定的影響.某校幾個學(xué)生成立研究性學(xué)習(xí)小組,就使用手機(jī)對學(xué)習(xí)成績的影響隨機(jī)抽取了該校100名學(xué)生的期末考試成績并制成如下的表,則下列說法正確的是( )
手機(jī)使 用情況 成績
成績優(yōu)秀 成績不優(yōu)秀 總計
不用手機(jī) 40 10 50
使用手機(jī) 5 45 50
總計 45 55 100
(參考公式:,其中)
A.在犯錯誤的概率不超過0.01的前提下認(rèn)為使用手機(jī)與學(xué)習(xí)成績無關(guān)
B.在犯錯誤的概率不超過0.1的前提下認(rèn)為使用手機(jī)與學(xué)習(xí)成績無關(guān)
C.有99%的把握認(rèn)為使用手機(jī)對學(xué)習(xí)成績有影響
D.無99%的把握認(rèn)為使用手機(jī)對學(xué)習(xí)成績有影響
【例3】(2023上·高二單元測試)某部門通過隨機(jī)調(diào)查89名工作人員的休閑方式是讀書還是健身,得到的數(shù)據(jù)如下表:
性別 休閑方式
讀書 健身 總計
女 24 31 55
男 8 26 34
總計 32 57 89
在犯錯誤的概率不超過 的前提下性別與休閑方式有關(guān)系.
參考公式:.
【例4】(2023下·高二單元測試)若兩個分類變量與的列聯(lián)表為:
y1 y2 合計
x1 10 15 25
x2 40 16 56
合計 50 31 81
則有 的把握認(rèn)為“與之間有關(guān)系”.
附:,其中
0.050 0.010 0.001
k 3.841 6.635 10.828
鞏固訓(xùn)練
1.(2023上·高二單元測試)某校團(tuán)委對“喜歡吃水果和學(xué)生性別是否有關(guān)”進(jìn)行了一次調(diào)查,其中被調(diào)查的女生人數(shù)是男生人數(shù)的,男生喜歡吃水果的人數(shù)占被調(diào)查的男生人數(shù)的,女生喜歡吃水果的人數(shù)占被調(diào)查的女生人數(shù)的,若有99%的把握認(rèn)為喜歡吃水果和學(xué)生性別有關(guān),則被調(diào)查的男生至少有( )
0.10 0.05 0.010 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
A.12人 B.18人
C.24人 D.30人
2.(2023上·高二單元測試)冶煉某種金屬可以用舊設(shè)備和改造后的新設(shè)備,為了檢驗(yàn)用這兩種設(shè)備生產(chǎn)的產(chǎn)品中所含雜質(zhì)的關(guān)系,調(diào)查結(jié)果如表所示:
設(shè)備 雜質(zhì)情況
雜質(zhì)高 雜質(zhì)低
舊設(shè)備 37 121
新設(shè)備 22 202
參考公式:,
根據(jù)以上數(shù)據(jù),則下列說法正確的是( )
A.含雜質(zhì)的高低與設(shè)備改造有關(guān)
B.含雜質(zhì)的高低與設(shè)備改造無關(guān)
C.設(shè)備是否改造決定含雜質(zhì)的高低
D.以上答案都不對
3.(2022下·福建福州·高二福州三中校考期末)為了考察某種藥物預(yù)防疾病的效果,進(jìn)行動物試驗(yàn),得到如下列聯(lián)表:
藥物 疾病 合計
未患病 患病
服用 a 50
未服用 50
合計 80 20 100
若在本次考察中得出“在犯錯誤的概率不超過0.01的前提下認(rèn)為藥物有效”的結(jié)論,則a的最小值為 .(其中且)(參考數(shù)據(jù):,)
附:,
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
4.(2023上·高二課時練習(xí))為了考查某流感疫苗的效果,某實(shí)驗(yàn)室隨機(jī)抽取100只健康小鼠進(jìn)行試驗(yàn),得到如下列聯(lián)表:
疫苗使 用情況 感染情況
感染 未感染 總計
注射 10 40 50
未注射 20 30 50
總計 30 70 100
參照附表,在犯錯誤的概率最多不超過 的前提下,可認(rèn)為“注射疫苗”與“感染某流感”有關(guān)系.
參考公式:.
題型八:獨(dú)立性檢驗(yàn)(解答)
【例1】(2024·江蘇南京·金陵中學(xué)校考模擬預(yù)測)某高中為了了解高中學(xué)生暑假期間閱讀古典名著的時間(小時/每周)和他們的語文成績(分)的關(guān)系,某實(shí)驗(yàn)小組做了調(diào)查,得到一些數(shù)據(jù)(表一).
表一
編號 1 2 3 4 5
學(xué)習(xí)時間 2 4 7 7 10
語文成績 82 93 95 108 122
(1)請根據(jù)所給數(shù)據(jù)求出語文成績的平均數(shù)和方差;
(2)基于上述調(diào)查,學(xué)校為了確認(rèn)學(xué)生喜歡閱讀古典名著與語文成績的關(guān)系,抽樣調(diào)查了200位學(xué)生.按照是否喜歡閱讀古典名著與語文成績是否優(yōu)秀統(tǒng)計,得到下列數(shù)據(jù),請依據(jù)表中數(shù)據(jù)及小概率值的獨(dú)立性檢驗(yàn),分析“喜歡閱讀古典名著與語文成績優(yōu)秀”是否有關(guān).
表二
語文成績優(yōu)秀 語文成績不優(yōu)秀 合計
喜歡閱讀 75 25 100
不喜歡閱讀 55 45 100
合計 130 70 200
0.10 0.05 0.010
2.706 3.841 6.635
【例2】(2024·陜西·校聯(lián)考一模)我國老齡化時代已經(jīng)到來,老齡人口比例越來越大,出現(xiàn)很多社會問題.2015年10月,中國共產(chǎn)黨第十八屆中央委員會第五次全體會議公報指出:堅持計劃生育基本國策,積極開展應(yīng)對人口老齡化行動,實(shí)施全面二孩政策.隨著國家二孩政策的全面放開,為了調(diào)查一線城市和非一線城市的二孩生育意愿,某機(jī)構(gòu)用簡單隨機(jī)抽樣方法從不同地區(qū)調(diào)查了100位育齡婦女,結(jié)果如下表.
非一線 一線 總計
愿生 40 y 60
不愿生 x 22 40
總計 58 42 100
(1)求x和y的值.
(2)分析調(diào)查數(shù)據(jù),是否有以上的把握認(rèn)為“生育意愿與城市級別有關(guān)”?
(3)在以上二孩生育意愿中按分層抽樣的方法,抽取6名育齡婦女,再選取兩名參加育兒知識講座,求至少有一名來自一線城市的概率.
參考公式:,
0.050 0.010 0.001
k 3.841 6.635 10.828
【例3】(2024下·全國·高三開學(xué)考試)2023年11月,世界首屆人工智能峰會在英國舉行,我國因?yàn)樵谠擃I(lǐng)域取得的巨大成就受邀進(jìn)行大會發(fā)言.為了研究不同性別的學(xué)生對人工智能的了解情況,我市某著名高中進(jìn)行了一次抽樣調(diào)查,分別抽取男 女生各50人作為樣本.設(shè)事件“了解人工智能”,“學(xué)生為男生”,據(jù)統(tǒng)計.
(1)根據(jù)已知條件,填寫下列列聯(lián)表,是否有把握推斷該校學(xué)生對人工智能的了解情況與性別有關(guān)?
了解人工智能 不了解人工智能 合計
男生
女生
合計
(2)①現(xiàn)從所抽取的女生中利用分層抽樣的方法抽取20人,再從這20人中隨機(jī)選取3人贈送科普材料,求選取的3人中至少有2人了解人工智能的概率;
②將頻率視為概率,從我市所有參與調(diào)查的學(xué)生中隨機(jī)抽取20人科普材料,記其中了解人工智能的人數(shù)為X,求隨機(jī)變量的數(shù)學(xué)期望和方差.
參考公式:.常用的小概率值和對應(yīng)的臨界值如下表:
0.150 0.100 0.050 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
鞏固訓(xùn)練
1.(2024上·河北張家口·高三統(tǒng)考期末)某公司男女職工人數(shù)相等,該公司為了解職工是否接受去外地長時間出差,進(jìn)行了如下調(diào)查:在男女職工中各隨機(jī)抽取了100人,經(jīng)調(diào)查,男職工和女職工接受去外地長時間出差的人數(shù)分別為40和20.
(1)根據(jù)所給數(shù)據(jù),完成下面列聯(lián)表,并依據(jù)小概率值的獨(dú)立性檢驗(yàn),能否認(rèn)為是否接受去外地長時間出差與性別有關(guān)聯(lián)?
單位:人
性別 接受 不接受 合計


合計
(2)若將頻率視為概率,用樣本估計總體,從該公司中隨機(jī)抽取5人,記其中接受去外地長時間出差的人數(shù)為X,求X的數(shù)學(xué)期望,
附表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
附:,其中.
2.(2024上·山東德州·高二統(tǒng)考期末)為了解某一地區(qū)電動汽車銷售情況,某部門根據(jù)統(tǒng)計數(shù)據(jù),用最小二乘法得到電動汽車銷量y(單位:萬臺)關(guān)于x(年份)的線性回歸方程為,且銷量y的方差,年份x的方差.
(1)求y與x的相關(guān)系數(shù)r,并據(jù)此判斷電動汽車銷量y與年份x的相關(guān)性強(qiáng)弱;
(2)該部門還調(diào)查了該地區(qū)90位購車車主的性別與購車種類情況,得到的數(shù)據(jù)如下表:
性別 購買非電動汽車 購買電動汽車 總計
男性 39 45
女性 15
總計
根據(jù)調(diào)查數(shù)據(jù)回答:是否有的把握認(rèn)為購買電動汽車與車主性別有關(guān)?
參考公式:(i)線性回歸方程:,其中;
(ii)相關(guān)系數(shù):,若,則可判斷y與x線性相關(guān)較強(qiáng).
(iii),其中.附表:
0.10 0.05 0.010 0.001
2.706 3.841 6.635 10.828
3.(2024下·甘肅·高三武威第六中學(xué)校聯(lián)考開學(xué)考試)2022年日本17歲男性的平均身高為,同樣的數(shù)據(jù)1994年是,近30年日本的平均身高不僅沒有增長,反而降低了.反觀中國近30年,男性平均身高增長了約.某課題組從中國隨機(jī)抽取了400名成年男性,記錄他們的身高,將數(shù)據(jù)分成八組:,;同時從日本隨機(jī)抽取了200名成年男性,記錄他們的身高,將數(shù)據(jù)分成五組:,整理得到如下頻率分布直方圖:

(1)由頻率分布直方圖估計樣本中日本成年男性身高的分位數(shù);
(2)為了了解身高與蛋白質(zhì)攝入量之間是否有關(guān)聯(lián),課題組調(diào)查樣本中的600人得到如下列聯(lián)表:
身高 蛋白質(zhì)攝入量 合計
豐富 不豐富
低于 108
不低于 100
合計 600
結(jié)合頻率分布直方圖補(bǔ)充上面的列聯(lián)表,并依據(jù)小概率值的獨(dú)立性檢驗(yàn),推斷成年男性身高與蛋白質(zhì)攝入量之間是否有關(guān)聯(lián)?
附:.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828第八章 成對數(shù)據(jù)的統(tǒng)計分析(知識歸納+題型突破)
1.通過具體案例,引導(dǎo)學(xué)生理解兩個隨機(jī)變量的相關(guān)性可以通過成對樣本數(shù)據(jù)進(jìn)行分析,了解樣本相關(guān)系數(shù)的統(tǒng)計含義.
2.理解利用一元線性回歸模型可以研究變量之間的相關(guān)關(guān)系,并進(jìn)行預(yù)測.
3.了解 列聯(lián)表,理解利用列聯(lián)表可以檢驗(yàn)兩個隨機(jī)變量的獨(dú)立性.
4.運(yùn)用散點(diǎn)圖、相關(guān)系數(shù)、最小二乘思想、小概率原理、頻率估計概率、假設(shè)檢驗(yàn)基本原理等解決簡單的實(shí)際問題,會利用統(tǒng)計軟件進(jìn)行數(shù)據(jù)分析.
知識點(diǎn)1:相關(guān)關(guān)系的強(qiáng)弱
(1)樣本相關(guān)系數(shù)
現(xiàn)實(shí)生活中的數(shù)據(jù),由于度量對象和單位的不同等,數(shù)值會有大有小,為了去除這些因素的影響,統(tǒng)計學(xué)里一般用來衡量與的線性相關(guān)性強(qiáng)弱,我們稱為變量和變量的樣本相關(guān)系數(shù).
(2)相關(guān)系數(shù)的性質(zhì)
①當(dāng)時,稱成對樣本數(shù)據(jù)正相關(guān);當(dāng)時,成對樣本數(shù)據(jù)負(fù)相關(guān);當(dāng)時,成對樣本數(shù)據(jù)間沒有線性相關(guān)關(guān)系.
②樣本相關(guān)系數(shù)的取值范圍為
當(dāng)越接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng);
當(dāng)越接近0時,成對樣本數(shù)據(jù)的線性相關(guān)程度越弱.
知識點(diǎn)2:經(jīng)驗(yàn)回歸方程的求解法:最小二乘法
回歸直線方程過樣本點(diǎn)的中心,是回歸直線方程最常用的一個特征;
我們將稱為關(guān)于的線性回歸方程,也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱為經(jīng)驗(yàn)回歸直線。這種求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法,求得的,叫做,的最小二乘估計,其中稱為回歸系數(shù),它實(shí)際上也就是經(jīng)驗(yàn)回歸直線的斜率,為截距.
其中
知識點(diǎn)3:殘差
(1)殘差
對于響應(yīng)變量,通過觀測得到的數(shù)據(jù)稱為觀測值,通過經(jīng)驗(yàn)回歸方程得到的稱為預(yù)測值,觀測值減去預(yù)測值稱為殘差.
(2)殘差圖
作圖時縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號,或身高數(shù)據(jù),或體重估計值等,這樣作出的圖形稱為殘差圖.若殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域內(nèi),帶狀區(qū)域越窄,則說明擬合效果越好.
(3)殘差分析
殘差是隨機(jī)誤差的估計結(jié)果,通過殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.其步驟為:計算殘差化殘差圖在殘差圖中分析殘差特性.
知識點(diǎn)4:決定系數(shù)
(1)殘差平方和
殘差平方和,殘差平方和越小,模型擬合效果越好,殘差平方和越大,模型擬合效果越差.
(2)決定系數(shù)
決定系數(shù)是度量模型擬合效果的一種指標(biāo),在線性模型中,它代表解釋變量客戶預(yù)報變量的能力.
,越大,即擬合效果越好,越小,模型擬合效果越差.
(3)決定系數(shù)與相關(guān)系數(shù)的聯(lián)系與區(qū)別
①相關(guān)系數(shù)反映兩個變量的相關(guān)關(guān)系的強(qiáng)弱及正相關(guān)或負(fù)相關(guān),決定系數(shù)反映回歸模型的擬合效果.
②在含有一個解釋變量的線性模型中,決定系數(shù)的數(shù)值是相關(guān)系數(shù)的平方,其變化范圍為,而相關(guān)系數(shù)的變化范圍為.
③當(dāng)相關(guān)系數(shù)接近于1時,說明兩變量的相關(guān)性較強(qiáng),當(dāng)接近于0時,說明兩變量的相關(guān)性較弱;而當(dāng)接近于1時,說明經(jīng)驗(yàn)回歸方程的擬合效果較好.
知識點(diǎn)5:分類變量與列聯(lián)表
(1)分類變量
為了方便,會使用一種特殊的隨機(jī)變量,區(qū)別不同的現(xiàn)象或性質(zhì),這隨機(jī)變量稱為分類變量.
(2)列聯(lián)表
①2×2列聯(lián)表給出了兩個分類變量數(shù)據(jù)的交叉分類頻數(shù).
②定義一對分類變量和,我們整理數(shù)據(jù)如下表所示:
合計
合計
知識點(diǎn)6:獨(dú)立性檢驗(yàn)
(1)獨(dú)立性檢驗(yàn)定義:
利用的取值推斷分類變量和是否獨(dú)立的方法稱為獨(dú)立性檢驗(yàn),讀作“卡方獨(dú)立性檢驗(yàn)”.簡稱獨(dú)立性檢驗(yàn).
(2)獨(dú)立性檢驗(yàn)公式:
其中(注意使用公式時分子的平方不要忽略了)
題型一:相關(guān)系數(shù)的意義及辨析
【例1】.(2022下·河南南陽·高二校聯(lián)考專題練習(xí))在一組樣本數(shù)據(jù)為,,,(,,,,,不全相等)的散點(diǎn)圖中,若所有樣本點(diǎn)都在直線上,則這組樣本數(shù)據(jù)的相關(guān)系數(shù)為( )
A. B. C.1 D.-1
【答案】C
【分析】根據(jù)回歸直線方程為,可知相關(guān)系數(shù)為正數(shù),又所有樣本點(diǎn)都在直線上,即可求出答案.
【詳解】所有樣本點(diǎn)都在直線上,所以這組樣本數(shù)據(jù)的相關(guān)系數(shù)為1.
故選:C.
【例2】(2024上·江西吉安·高一江西省新干中學(xué)期末)對于樣本相關(guān)系數(shù),下列說法錯誤的是(  )
A.可以用來判斷成對樣本數(shù)據(jù)相關(guān)的正負(fù)性
B.可以是正的,也可以是負(fù)的
C.樣本相關(guān)系數(shù)越大,成對樣本數(shù)據(jù)的線性相關(guān)程度也越高
D.取值范圍是
【答案】C
【分析】利用相關(guān)系數(shù)的概念,結(jié)合選項(xiàng)可以判斷.
【詳解】對于相關(guān)系數(shù)的定義:
當(dāng)相關(guān)性越強(qiáng),相關(guān)系數(shù)就越接近于;
當(dāng)相關(guān)系數(shù)的絕對值越小,相關(guān)性越弱;
當(dāng)系數(shù)為正數(shù)時,為正相關(guān),系數(shù)為負(fù)數(shù)時,為負(fù)相關(guān).
故選:C.
鞏固訓(xùn)練
1.(2023·四川樂山·統(tǒng)考一模)對四組數(shù)據(jù)進(jìn)行統(tǒng)計,獲得如下散點(diǎn)圖,關(guān)于其相關(guān)系數(shù)的比較,說法正確的是( )

A. B.
C. D.
【答案】B
【分析】根據(jù)散點(diǎn)圖的分布判斷相關(guān)系數(shù)的符號和絕對值大小,即可得結(jié)果.
【詳解】由圖中散點(diǎn)的分布趨勢知:,,
由圖散點(diǎn)的分布狀態(tài)知:,,
所以.
故選:B
2.(2022下·遼寧大連·高二大連八中校考階段練習(xí))設(shè)兩個變量和之間具有線性相關(guān)關(guān)系,它們的相關(guān)系數(shù)為關(guān)于的回歸直線方程為,則( )
A.與的符號相反 B.與的符號相同
C.與的符號相同 D.與的符號相反
【答案】C
【分析】根據(jù)相關(guān)系數(shù)的性質(zhì)分析判斷.
【詳解】由線性相關(guān)關(guān)系可知:若,等價于兩個變量正相關(guān),等價于;
若,等價于兩個變量負(fù)相關(guān),等價于;
所以與的符號相同,故A錯誤,C正確;
又因?yàn)榕c的符號沒有關(guān)系,故B、D錯誤;
故選:C.
題型二:相關(guān)系數(shù)計算
【例1】(2024上·天津·高三校聯(lián)考期末)學(xué)習(xí)于才干信仰,猶如運(yùn)動于健康體魄,持之已久、行之愈遠(yuǎn)愈受益.為實(shí)現(xiàn)中華民族偉大復(fù)興,全國各行各業(yè)掀起了“學(xué)習(xí)強(qiáng)國”的高潮.某老師很喜歡“學(xué)習(xí)強(qiáng)國”中“挑戰(zhàn)答題”模塊,他記錄了自己連續(xù)七天每天一次最多答對的題數(shù)如下表:
天數(shù)x 1 2 3 4 5 6 7
一次最多答對題數(shù)y 12 15 16 18 21 24 27
參考數(shù)據(jù):,,,,,
相關(guān)系數(shù)
由表中數(shù)據(jù)可知該老師每天一次最多答對題數(shù)y與天數(shù)x之間是 相關(guān)(填“正”或“負(fù)”),其相關(guān)系數(shù) (結(jié)果保留兩位小數(shù))
【答案】 正 0.99
【分析】根據(jù)正相關(guān)和負(fù)相關(guān)的定義即可得出結(jié)論;根據(jù)相關(guān)系數(shù)公式求相關(guān)系數(shù)即可.
【詳解】由表中數(shù)據(jù)得隨的增大而增大,
所以該老師每天一次最多答對題數(shù)y與天數(shù)x之間是正相關(guān),
.
故答案為:正;.
【例2】(2023·河南·統(tǒng)考模擬預(yù)測)黨的二十大以來,國家不斷加大對科技創(chuàng)新的支持力度,極大鼓舞了企業(yè)持續(xù)投入研發(fā)的信心.某科技企業(yè)在國家一系列優(yōu)惠政策的大力扶持下,通過不斷的研發(fā)和技術(shù)革新,提升了企業(yè)收益水平.下表是對2023 年1 ~5月份該企業(yè)的利潤y(單位:百萬)的統(tǒng)計.
月份 1 月 2 月 3 月 4 月 5 月
月份編號x 1 2 3 4 5
利潤y(百萬) 7 12 13 19 24
(1)根據(jù)統(tǒng)計表,求該企業(yè)的利潤y與月份編號x的樣本相關(guān)系數(shù)(精確到0.01),并判斷它們是否具有線性相關(guān)關(guān)系(,則認(rèn)為y與x的線性相關(guān)性較強(qiáng),,則認(rèn)為y與x的線性相關(guān)性較弱.);
(2)該企業(yè)現(xiàn)有甲、乙兩條流水線生產(chǎn)同一種產(chǎn)品.為對產(chǎn)品質(zhì)量進(jìn)行監(jiān)控,質(zhì)檢人員先用簡單隨機(jī)抽樣的方法從甲、乙兩條流水線上分別抽取了5件、3件產(chǎn)品進(jìn)行初檢,再從中隨機(jī)選取3件做進(jìn)一步的質(zhì)檢,記抽到“甲流水線產(chǎn)品”的件數(shù)為,試求的分布列與期望.
附:相關(guān)系數(shù)
【答案】(1);具有很強(qiáng)的線性相關(guān)性
(2)分布列見解析;
【分析】(1)根據(jù)公式求出相關(guān)系數(shù)的值,即可判斷;
(2)根據(jù)題意可知可取的為,然后計算列出分布列,求出期望即可求解.
【詳解】(1)由統(tǒng)計表數(shù)據(jù)可得:
所以

所以相關(guān)系數(shù) ,
因此,兩個變量具有很強(qiáng)的線性相關(guān)性.
(2)由題意知,的可能取值為
因?yàn)?,

所以 的分布列為:
所以
【例3】(2023·全國·高二課堂例題)某研究者搜集了某種花的一些數(shù)據(jù)(見下表),試分別計算花瓣長與花枝長之間、花瓣長與花萼長之間的相關(guān)關(guān)系(結(jié)果保留三位小數(shù)).
花瓣長x 49 44 32 42 32 53 36 39 37 45 41 48 45 39 40 34 37 35
花枝長y 27 24 12 22 13 29 14 20 16 21 22 25 23 18 20 15 20 13
花萼長z 19 16 12 17 10 19 15 14 15 21 14 22 22 15 14 15 15 16
相關(guān)系數(shù),
【答案】答案見解析
【分析】利用方差、相關(guān)系數(shù)公式求、,進(jìn)而說明因素間的相關(guān)性.
【詳解】由題意,,,





所以,

上述結(jié)果表明花瓣長與花枝長之間正相關(guān)程度高,花瓣長與花萼長之間呈正相關(guān)關(guān)系.
鞏固訓(xùn)練
1.(2023上·高二課時練習(xí))據(jù)說職工遲到的頻率與其居住地離上班地點(diǎn)的遠(yuǎn)近有關(guān).為驗(yàn)證這個說法,一位社會學(xué)家隨機(jī)抽取10名職工進(jìn)行了調(diào)查,其調(diào)查數(shù)據(jù)如下表所示.
職工編號 年遲到次數(shù)/次 住地遠(yuǎn)近/km 職工編號 年遲到次數(shù)/次 住地遠(yuǎn)近/km
1 8 1.1 6 3 10.1
2 5 2.9 7 5 12.0
3 8 4.0 8 2 14.3
4 7 5.9 9 4 14.1
5 6 8.2 10 2 7.8
試計算職工年遲到次數(shù)與住地遠(yuǎn)近之間的相關(guān)系數(shù).
【答案】
【分析】由相關(guān)系數(shù)的計算公式計算即可.
【詳解】由表格可知職工遲到次數(shù)與住地遠(yuǎn)近對應(yīng)數(shù)據(jù),
分別為 ,
則,,



則,,
故.
2.(2023下·河南鄭州·高三鄭州外國語學(xué)校校考階段練習(xí))某公司進(jìn)行工資改革,將工作效率作為工資定檔的一個重要標(biāo)準(zhǔn),大大提高了員工的工作積極性,但也引起了一些老員工的不滿.為了調(diào)查員工的工資與工齡的情況,人力資源部隨機(jī)從公司的技術(shù)研發(fā)部門中抽取了16名員工了解情況,結(jié)果如下:
工齡(年) 1 2 3 4 5 6 7 8
年薪(萬) 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
工齡(年) 9 10 11 12 13 14 15 16
年薪(萬) 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
經(jīng)計算得,,,,其中表示工齡為i年的年薪,.
(1)求年薪與工齡i()的相關(guān)系數(shù)r,并回答是否可以認(rèn)為年薪與工齡具有線性相關(guān)關(guān)系(若,則可以認(rèn)為年薪與工齡不具有線性相關(guān)關(guān)系).
(2)在抽取的16名員工中,如果年薪都在之內(nèi),則繼續(xù)推進(jìn)工資改革,同時給每位老員工相應(yīng)的補(bǔ)貼,如果有員工年薪在之外,該員工會被人力資源部約談并進(jìn)行崗位調(diào)整,且需要重新計算原抽取的16名員工中留下的員工年薪的均值和標(biāo)準(zhǔn)差,由于人力資源部需要安撫老員工的情緒,工作繁重,現(xiàn)請你幫忙計算留下的員工年薪的均值和標(biāo)準(zhǔn)差.(精確到0.01)
附:樣本的相關(guān)系數(shù),,,, .
【答案】(1),可認(rèn)為年薪與工齡不具有線性相關(guān)關(guān)系
(2)均值為,標(biāo)準(zhǔn)差為
【分析】(1)計算出相關(guān)系數(shù),進(jìn)而與0.25比較后得到結(jié)論;
(2)計算出的范圍,得到第13號員工不在此范圍之內(nèi),計算出剔除離群值后,剩下的數(shù)據(jù)平均值和樣本方差,進(jìn)而計算出剔除離群值后樣本標(biāo)準(zhǔn)差.
【詳解】(1)計算相關(guān)系數(shù),
因?yàn)椋钥烧J(rèn)為年薪與工齡不具有線性相關(guān)關(guān)系.
(2)因?yàn)椋?br/>所以在之內(nèi)的范圍是,
顯然第13號員工不在此范圍之內(nèi),所以需要對余下的員工進(jìn)行計算,
剔除離群值后,剩下的數(shù)據(jù)平均值為,
因?yàn)椋裕?br/>所以剔除離群值后樣本方差為,
故剔除離群值后樣本標(biāo)準(zhǔn)差為.
3.(2023下·高二單元測試)暑期社會實(shí)踐中,某數(shù)學(xué)興趣小組調(diào)查了某地家庭人口數(shù)x與每天對生活必需品的消費(fèi)y的情況,得到的數(shù)據(jù)如下表:
x/人 2 4 5 6 8
y/元 20 30 50 50 70
(1)利用相關(guān)系數(shù)r判斷y與x是否線性相關(guān);
(2)根據(jù)上表提供的數(shù)據(jù),求出y關(guān)于x的線性回歸方程.
【答案】(1),y與x之間具有較強(qiáng)的線性相關(guān)關(guān)系
(2)
【分析】(1)根據(jù)相關(guān)系數(shù)公式進(jìn)行求解判斷即可;
(2)根據(jù)表中數(shù)據(jù),運(yùn)用代入法進(jìn)行求解即可.
【詳解】(1)由表中數(shù)據(jù),得:,,
,,

則相關(guān)系數(shù),
因?yàn)椋詙與x之間具有較強(qiáng)的線性相關(guān)關(guān)系;
(2)由表中數(shù)據(jù),得:,
所以,所以線性回歸方程為.
題型三:殘差
【例1】(2022下·北京通州·高二統(tǒng)考期末)已知變量x和變量y的一組隨機(jī)觀測數(shù)據(jù).如果關(guān)于的經(jīng)驗(yàn)回歸方程是,那么當(dāng)時,殘差等于( )
A. B.0 C.10 D.110
【答案】C
【分析】將代入回歸方程得到預(yù)測值,再根據(jù)殘差公式計算可得;
【詳解】解:因?yàn)殛P(guān)于的經(jīng)驗(yàn)回歸方程是,
所以時,此時殘差為;
故選:C
【例2】(2022下·河南洛陽·高二統(tǒng)考期中)某種產(chǎn)品的廣告支出費(fèi)用x(單位:萬元)與銷售額y(單位:萬元)之間有如下關(guān)系:
x 2 4 5 6 8
y 30 40 70 50 60
已知y與x的線性回歸方程為,則當(dāng)廣告支出費(fèi)用為5萬元時,殘差為( )
A.40 B.30 C.20 D.10
【答案】C
【分析】根據(jù)回歸方程求出時的值,即可求出殘差.
【詳解】當(dāng)時,,所以殘差為.
故選:C.
【例3】(2023下·河北張家口·高二河北省尚義縣第一中學(xué)校考階段練習(xí))已知回歸方程,而試驗(yàn)中的一組數(shù)據(jù)是,,,則其殘差平方和是 .
【答案】/0.38
【分析】根據(jù)數(shù)據(jù)計算殘差,即可求解平方和.
【詳解】∵殘差,當(dāng)時,,當(dāng)時,,當(dāng)時,,
∴殘差平方和為.
故答案為:0.38
鞏固訓(xùn)練
1.(2022下·四川成都·高二統(tǒng)考期中)某種產(chǎn)品的廣告費(fèi)支出x與銷售額y(單位:萬元)之間有下表關(guān)系
1 3 4 5 7
30 40 60 50 70
y與x的線性回歸方程為,當(dāng)廣告支出5萬元時,隨機(jī)誤差的效應(yīng)(殘差)為( )
A.20 B.-10 C.10 D.-6.5
【答案】D
【分析】利用線性回歸方程,令,求得,再求殘差即可.
【詳解】解:因?yàn)閥與x的線性回歸方程為,
當(dāng)時,,
則,
所以當(dāng)廣告支出5萬元時,隨機(jī)誤差的效應(yīng)(殘差)為-6.5,
故選:D
2.(2024·云南楚雄·云南省楚雄彝族自治州民族中學(xué)校考一模)對具有線性相關(guān)關(guān)系的變量有一組觀測數(shù)據(jù)(),其經(jīng)驗(yàn)回歸方程為,且,,則相應(yīng)于點(diǎn)的殘差為 .
【答案】/
【分析】利用樣本中心在其經(jīng)驗(yàn)回歸方程為上,求出,再計算當(dāng)時的殘差即可.
【詳解】經(jīng)驗(yàn)回歸直線過樣本點(diǎn)的中心,,,
經(jīng)驗(yàn)回歸方程為.當(dāng)時,,殘差為.
故答案為:.
3.(2023下·山西太原·高二統(tǒng)考期中)已知回歸方程,而試驗(yàn)中的一組數(shù)據(jù)是,,,則其殘差平方和是 .
【答案】0.03
【分析】利用殘差的定義求解,求得的殘差平方后求和即可.
【詳解】殘差,當(dāng)時,,當(dāng)時,,當(dāng)時,,
殘差平方和為
故答案為:0.03.
題型四:一元線性回歸模型
【例1】(2023·全國·高三校聯(lián)考專題練習(xí))某市政府為調(diào)查集貿(mào)蔬菜市場個體承包攤戶年收入情況,隨機(jī)抽取了6個攤戶進(jìn)行分析,得到樣本數(shù)據(jù),),其中和分別表示第個攤戶和該攤戶年收入(單位:萬元),如下
1 2 3 4 5 6
5 6 7 7 9 8
(1)請用相關(guān)系數(shù)判斷該組數(shù)據(jù)中與之間線性相關(guān)關(guān)系的強(qiáng)弱(若,相關(guān)性較強(qiáng);若,相關(guān)性一般;若,相關(guān)性較弱);
(2)求關(guān)于的線性回歸方程;
(3)若該集貿(mào)蔬菜市場個體承包攤戶有300個,根據(jù)題設(shè)估計該集貿(mào)蔬菜市場個體承包攤戶年收入總值.
參考公式:相關(guān)系數(shù),對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù),其回歸直線的斜率和截距的最小二乘估計分別為,,.
【答案】(1)與之間具有較強(qiáng)的線性相關(guān)關(guān)系
(2)
(3)210萬元
【分析】(1)根據(jù)所給數(shù)據(jù)求出、、、、,從而求出相關(guān)系數(shù),即可判斷;
(2)求出、,即可求出回歸直線方程;
(3)由計算可得.
【詳解】(1)題意計算得,則,
,則,
所以,,,
所以相關(guān)系數(shù),
因?yàn)榕c的相關(guān)系數(shù)滿足,所以與之間具有較強(qiáng)的線性相關(guān)關(guān)系.
(2)由(1)可得,,所以
(3)由題設(shè)得,可估計該集貿(mào)蔬菜市場個體承包攤戶年收入總值約為(萬元).
【例2】(2024·陜西咸陽·統(tǒng)考模擬預(yù)測)能源和環(huán)境問題是目前全球性急需解決的問題,雖然近百年人類文明有了前所未有的發(fā)展,但對于能源的使用和環(huán)境的破壞也造成了嚴(yán)重的后果,發(fā)展新能源是時代的要求,是未來生存的要求.新能源汽車不僅對環(huán)境保護(hù)具有重大的意義而且還能夠減少對不可再生資源的開發(fā),是全球汽車發(fā)展的重要方向.“保護(hù)環(huán)境,人人有責(zé)”,在政府和有關(guān)企業(yè)的努力下,某市近幾年新能源汽車的購買情況如下表所示:
年份x 2019 2020 2021 2022 2023
汽車購買y(萬輛) 0.30 0.60 1.00 1.40 1.70
(1)根據(jù)上表數(shù)據(jù),計算與的相關(guān)系數(shù),并說明與的線性相關(guān)性強(qiáng)弱(若,則認(rèn)為與線性相關(guān)性很強(qiáng);若,則認(rèn)為與線性相關(guān)性一般;若,則認(rèn)為與線性相關(guān)性較弱);
(2)求關(guān)于的線性回歸方程,并預(yù)測該市2024年新能源汽車購買輛數(shù)(精確到個位).
參考公式:,,
參考數(shù)值:.
【答案】(1),與線性相關(guān)性很強(qiáng);
(2),約為2.08萬輛.
【分析】(1)根據(jù)給定的數(shù)表求出,及相關(guān)系數(shù)公式中的量,代入公式計算并比較得解.
(2)利用最小二乘法公式求出線性回歸方程,再作出預(yù)測即可.
【詳解】(1),




所以與線性相關(guān)性很強(qiáng).
(2)由(1)知,
,,
所以關(guān)于的線性回歸方程是,
當(dāng)時,(萬輛)
該市2024年新能源汽車購買輛數(shù)約為2.08萬輛.
【例3】(2024上·江西九江·高二統(tǒng)考期末)2023年9月23日—10月8日,亞運(yùn)會在杭州舉行,“碳中和”是本屆亞運(yùn)會一大亮點(diǎn).為了打造碳中和亞運(yùn)會,杭州亞運(yùn)會上線了“亞運(yùn)碳中和-減污降碳協(xié)同”數(shù)字化管理平臺.該平臺將數(shù)字化技術(shù)運(yùn)用到碳排放采集 核算 減排 注銷 評價管理全流程,探索建立了一套科學(xué)完整的碳排放管理體系.值此機(jī)會,某家公司重點(diǎn)推出新型品牌新能源汽車,以下是其中五個月的銷售單:
2023月份 5 6 7 8 9
月份代碼 1 2 3 4 5
新能源車銷售(萬輛) 1.6 2.1 2.7 3.7 4.6
(1)根據(jù)表中數(shù)據(jù),求出關(guān)于的線性回歸方程;
(2)隨著亞運(yùn)會的火熱,新能源汽車也會一直持續(xù)下去,試估計2023年12月份該公司出售多少輛新能源汽車?
參考公式:對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù),其回歸直線的斜率和截距的最小二乘估計公式分別為.
【答案】(1)
(2)6.74萬輛
【分析】(1)先分別計算,,,再利用公式求即可求解.
(2)先求2023年12月份月份代碼,再利用回歸方程即可求解.
【詳解】(1)
,,
關(guān)于的線性回歸方程為.
(2)根據(jù)表中數(shù)據(jù)可知,12月份月份代碼為8
(萬輛),
估計2023年12月份該公司出售6.74萬輛新能源汽車.
鞏固訓(xùn)練
1.(2024·陜西咸陽·統(tǒng)考模擬預(yù)測)為慶祝元旦,某商場回饋消費(fèi)者,準(zhǔn)備舉辦一次有獎促銷活動,如果顧客一次消費(fèi)達(dá)到500元,可參加抽獎活動,規(guī)則如下;抽獎盒子中初始裝有白球和紅球各一個,每次有放回的任取一個,連續(xù)取兩次,將以上過程記為一輪.如果每一輪取到的兩個球都是白球,則記該輪為成功,活動結(jié)束.否則記為失敗,隨即獲得紀(jì)念品1份,當(dāng)然,如果顧客愿意可在盒子中再放入一個紅球,然后接著進(jìn)行下一輪抽獎,如此不斷繼續(xù)下去,直至成功.
(1)某顧客進(jìn)行該抽獎試驗(yàn)時,最多進(jìn)行三輪,即使第三輪不成功,也停止抽獎,記其進(jìn)行抽獎試驗(yàn)的輪次數(shù)為隨機(jī)變量X,求X的分布列和數(shù)學(xué)期望;
(2)為驗(yàn)證抽獎試驗(yàn)成功的概率不超過,有1000名數(shù)學(xué)愛好者獨(dú)立的進(jìn)行該抽球試驗(yàn),記t表示成功時抽獎試驗(yàn)的輪次數(shù),y表示對應(yīng)的人數(shù),部分統(tǒng)計數(shù)據(jù)如下表:
t 1 2 3 4 5
y 232 98 60 40 20
求y關(guān)于t的回歸方程:,并預(yù)測成功的總?cè)藬?shù)(四舍五入精確到1).
附:經(jīng)驗(yàn)回歸方程系數(shù):,.
參考數(shù)據(jù):,,(其中).
【答案】(1)分布列見解析,
(2),465
【分析】(1) 的取值可能為,分別求得隨機(jī)變量取每一值的概率,得出分布列,由此可得數(shù)學(xué)期望;
(2) 令,則,由公式求得和回歸方程并可得預(yù)測成功的人的總?cè)藬?shù).
【詳解】(1)的取值可能為1,2,3,



所以的分布列為:
1 2 3
所以數(shù)學(xué)期望為:.
(2)令,則,由題意可知,,
所以.
所以,.
故所求的回歸方程為
所以估計時,;估計時,;
估計時,;
預(yù)測成功的人的總數(shù)為.
2.(2023下·陜西咸陽·高二咸陽市實(shí)驗(yàn)中學(xué)校考階段練習(xí))如圖是某機(jī)構(gòu)統(tǒng)計的某地區(qū)2016年至2022年生活垃圾無害化處理量y(單位:萬噸)的折線圖.

注:年份代碼1-7分別對應(yīng)年份2016-2022.
(1)由折線圖看出,可用線性回歸模型擬合y與t的關(guān)系,請用相關(guān)系數(shù)加以說明;
(2)建立y關(guān)于t的回歸方程(系數(shù)精確到0.01),預(yù)測2024年該地區(qū)生活垃圾無害化處理量.
參考數(shù)據(jù):,,,,.
參考公式:相關(guān)系數(shù),當(dāng)時認(rèn)為兩個變量有很強(qiáng)的線性相關(guān)關(guān)系;回歸方程中斜率和截距的最小乘估計公式分別為,.
【答案】(1)答案見解析
(2),1.82萬噸.
【分析】(1)將數(shù)據(jù)代入公式,計算出,得到結(jié)論;
(2)計算出,求出線性回歸方程,代入計算預(yù)測2024年該地區(qū)生活垃圾無害化處理量.
【詳解】(1),,,,,

又,,
y與t有很強(qiáng)的線性相關(guān)關(guān)系,可以用線性回歸模型擬合y與t的關(guān)系.
(2)由(1)得,
又,,
y關(guān)于t的回歸方程為.
,將2024對應(yīng)的代入回歸方程得:,
預(yù)測2024年該地區(qū)生活垃圾無害化處理量將約萬噸.
3.(2024上·山東日照·高二統(tǒng)考期末)發(fā)展新能源汽車是我國從汽車大國邁向汽車強(qiáng)國的必由之路,是應(yīng)對氣候變化推動綠色發(fā)展的戰(zhàn)略舉措.隨著國務(wù)院《新能源汽車產(chǎn)業(yè)發(fā)展規(guī)劃(2021—2035)》的發(fā)布,我國自主品牌汽車越來越具備競爭力.國產(chǎn)某品牌汽車對市場進(jìn)行調(diào)研,統(tǒng)計了該品牌新能源汽車在某城市年前幾個月的銷售量(單位:輛),用表示第月份該市汽車的銷售量,得到如下統(tǒng)計表格:
1 2 3 4 5 6 7
28 32 37 45 47 52 60
(1)經(jīng)研究,、滿足線性相關(guān)關(guān)系,求關(guān)于的線性回歸方程,并根據(jù)此方程預(yù)測該店月份的成交量(、按四舍五入精確到整數(shù));
(2)該市某店為感謝客戶,決定針對該品牌的汽車成交客戶開展抽獎活動,設(shè)“一等獎”、“二等獎”和“祝您平安”三種獎項(xiàng),“一等獎”獎勵千元;“二等獎”獎勵千元;“祝您平安”獎勵紀(jì)念品一份.在一次抽獎活動中獲得“二等獎”的概率為,獲得一份紀(jì)念品的概率為,現(xiàn)有甲、乙兩個客戶參與抽獎活動,假設(shè)他們是否中獎相互獨(dú)立,求此二人所獲獎金總額(千元)的分布列及數(shù)學(xué)期望.
參考數(shù)據(jù)及公式:,,.
【答案】(1),預(yù)測該店月份的成交量為輛
(2)分布列見解析,
【分析】(1)計算出、的值,可求出,利用最小二乘法求出、的值,可得出回歸直線方程,再將代入回歸方程即可得出店月份的成交量的預(yù)測值;
(2)由題意可知,隨機(jī)變量的可能取值有、、、、、,計算出隨機(jī)變量在不同取值下的概率,可得出隨機(jī)變量的分布列,進(jìn)而可求得的值.
【詳解】(1)解:由題意可得,,

,,
故線性回歸方程為,
當(dāng)時,,故預(yù)計月份的成交量為輛.
(2)解:由題意可得,獲得“一等獎”的概率為,
的所有可能取值為、、、、、,
,,
,,
,,
故的分布列為:
故.
題型五:相關(guān)指數(shù)
【例1】(2022上·貴州貴陽·高二統(tǒng)考期末)【閱讀材料1】
我們在研究兩個變量之間的相關(guān)關(guān)系時,往往先選取若干個樣本點(diǎn)(),(),……,(),將樣本點(diǎn)畫在平面直角坐標(biāo)系內(nèi),就得到樣本的散點(diǎn)圖.觀察散點(diǎn)圖,如果所有樣本點(diǎn)都落在某一條直線附近,變量之間就具有線性相關(guān)關(guān)系,如果所有的樣本點(diǎn)都落在某一非線性函數(shù)圖象附近,變量之間就有非線性相關(guān)關(guān)系.在統(tǒng)計學(xué)中經(jīng)常選擇線性或非線性(函數(shù))回歸模型來刻畫相關(guān)關(guān)系,并且可以用適當(dāng)?shù)姆椒ㄇ蟪龌貧w模型的方程,還常用相關(guān)指數(shù)R2來刻畫回歸的效果,相關(guān)指數(shù)R2的計算公式為:
當(dāng)R2越大時,回歸方程的擬合效果越好;當(dāng)R2越小時,回歸方程的擬合效果越差,R2是常用的選擇模型的指標(biāo)之一,在實(shí)際應(yīng)用中應(yīng)該盡量選擇R2較大的回歸模型.
【閱讀材料2】
2021年6月17日9時22分,我國酒泉衛(wèi)星發(fā)射中心用長征二號F遙十二運(yùn)載火箭,成功將神舟十二號載人飛船送入預(yù)定軌道,順利將聶海勝、劉伯明、湯洪胺3名航天員送入太空,發(fā)射取得圓滿成功,這標(biāo)志著中國人首次進(jìn)入自己的空間站.某公司負(fù)責(zé)生產(chǎn)的A型材料是神舟十二號的重要零件,該材料應(yīng)用前景十分廣泛,該公司為了將A型材料更好地投入商用,擬對A型材料進(jìn)行應(yīng)用改造,根據(jù)市場調(diào)研與模擬,得到應(yīng)用改造投入x(億元)與產(chǎn)品的直接收益y(億元)的數(shù)據(jù)統(tǒng)計如下:
序號 1 2 3 4 5 6 7 8 9 10 11 12
x 2 3 4 6 8 10 13 21 22 23 24 25
y 15 22 27 40 48 54 60 68.5 68 67.5 66 65
當(dāng)0模型①:;模型②:;
當(dāng)x>13時,確定y與x滿足的線性回歸直線方程為.
根據(jù)以上閱讀材料,解答以下問題:
(1)根據(jù)下列表格中的數(shù)據(jù),比較當(dāng)0回歸模型 模型① 模型②
回歸方程
79.13 20.2
(2)當(dāng)應(yīng)用改造的投入為20億元時,以回歸直線方程為預(yù)測依據(jù),計算公司的收益約為多少.
附:①若最小二乘法求得回歸直線方程為,則;

③,當(dāng)時,.
【答案】(1)模型②擬合效果更好
(2)69.1(億元)
【分析】(1)分別求出兩個模型的相關(guān)指數(shù),在進(jìn)行比較即可,
(2)利用最小二乘法求出回歸方程,再求收益即可.
【詳解】(1)對于模型①,
因?yàn)椋蕦?yīng)的,
故對應(yīng)的相關(guān)指數(shù),
對于模型②,同理對應(yīng)的相關(guān)指數(shù),
故模型②擬合效果更好.
(2)當(dāng)時,
后五組的,
由最小二乘法可得,
所以當(dāng)時,確定y與x滿足的線性回歸直線方程為
故當(dāng)投入20億元時,預(yù)測公司的收益約為:(億元).
【例2】(2021下·黑龍江哈爾濱·高二哈九中校考期末)全球化時代,中國企業(yè)靠什么在激烈的競爭中成為世界一流企業(yè)呢?由人民日報社指導(dǎo),《中國經(jīng)濟(jì)周刊》主辦的第十八屆中國經(jīng)濟(jì)論壇在人民日報社舉行,就中國企業(yè)如何提升全球行業(yè)競爭力進(jìn)行了研討.?dāng)?shù)據(jù)顯示,某企業(yè)近年加大了科技研發(fā)資金的投入,其科技投入(百萬元)與收益(百萬元)的數(shù)據(jù)統(tǒng)計如下:
科技投入 1 2 3 4 5 6 7
收益 19 20 22 31 40 50 70
根據(jù)數(shù)據(jù)特點(diǎn),甲認(rèn)為樣本點(diǎn)分布在指數(shù)型曲線的周圍,據(jù)此他對數(shù)據(jù)進(jìn)行了一些初步處理.如下表:
5 140 1239 149 2134 130
其中,.
(1)請根據(jù)表中數(shù)據(jù),建立關(guān)于的回歸方程(系數(shù)精確到0.1,用的近似值算);
(2)①乙認(rèn)為樣本點(diǎn)分布在直線的周圍,并計算得回歸方程為,以及該回歸模型的決定系數(shù)(即相關(guān)指數(shù)),試計算,比較甲乙兩人所建立的模型,誰的擬合效果更好?(精確到0.001)
②由①所得的結(jié)論,計算該企業(yè)欲使收益達(dá)到1億元,科技投入的費(fèi)用至少要多少百萬元?(精確到0.1)
附:對于一組數(shù)據(jù),,…,,其回歸直線方程的斜率和截距的最小二乘法估計分別為,,決定系數(shù):.參考數(shù)據(jù):.
【答案】(1);(2)①;甲建立的回歸模型擬合效果更好;②科技投入的費(fèi)用至少要9.3百萬元.
【分析】(1)兩邊取對數(shù)得,令,利用最小二乘法可求得,由此可得回歸方程;
(2)①根據(jù)公式計算可得相關(guān)指數(shù),由此可得結(jié)論;
②由,解不等式可求得范圍,由此可得結(jié)果.
【詳解】(1)將兩邊取對數(shù)得:,令,則,
∵,∴根據(jù)最小二乘估計可知:,
∴,
∴回歸方程為,即.
(2)①甲建立的回歸模型的.
∴甲建立的回歸模型擬合效果更好.
②由①知,甲建立的回歸模型擬合效果更好.
設(shè),解得:,解得:.
∴科技投入的費(fèi)用至少要9.3百萬元,下一年的收益才能達(dá)到1億.
鞏固訓(xùn)練
1.(2020·黑龍江哈爾濱·哈爾濱市第六中學(xué)校校考三模)“海水稻”就是耐鹽堿水稻,是一種介于野生稻和栽培稻之間的普遍生長在海邊灘涂地區(qū),具有耐鹽堿的水稻,它比其它普通的水稻均有更強(qiáng)的生存競爭能力,具有抗?jié)常共∠x害,抗倒伏等特點(diǎn),還具有預(yù)防和治療多種疾病的功效,防癌效果尤為顯著.海水稻的灌溉是將海水稀釋后進(jìn)行灌溉.某試驗(yàn)基地為了研究海水濃度(‰)對畝產(chǎn)量(噸)的影響,通過在試驗(yàn)田的種植實(shí)驗(yàn),測得了某種海水稻的畝產(chǎn)量與海水濃度的數(shù)據(jù)如表.繪制散點(diǎn)圖發(fā)現(xiàn),可用線性回歸模型擬合畝產(chǎn)量與海水濃度之間的相關(guān)關(guān)系,用最小二乘法計算得與之間的線性回歸方程為.
海水濃度(‰) 3 4 5 6 7
畝產(chǎn)量(噸) 0.62 0.58 0.49 0.4 0.31
殘差
(1)請你估計:當(dāng)澆灌海水濃度為8‰時,該品種的畝產(chǎn)量.
(2)①完成上述殘差表:
②統(tǒng)計學(xué)中,常用相關(guān)指數(shù)來刻畫回歸效果,越大,模型擬合效果越好,并用它來說明預(yù)報變量與解釋變量的相關(guān)性.你能否利用以上表格中的數(shù)據(jù),利用統(tǒng)計學(xué)的相關(guān)知識,說明澆灌海水濃度對畝產(chǎn)量的貢獻(xiàn)率?(計算中數(shù)據(jù)精確到)
(附:殘差公式,相關(guān)指數(shù))
【答案】(1)當(dāng)海水濃度為8‰時,該品種的畝產(chǎn)量為0.24噸(2)①填表見解析;②所以澆灌海水濃度對畝產(chǎn)量的貢獻(xiàn)率是,詳解見解析.
【分析】(1)根據(jù)題意,算出,將樣本中心點(diǎn)代入線性回歸方程為,求出,從而可估計當(dāng)澆灌海水濃度為8‰時,該品種的畝產(chǎn)量.
(2)根據(jù)線性回歸方程和殘差公式,即可求出個海水濃度時對應(yīng)的殘差,即可完成殘差表;根據(jù)相關(guān)指數(shù)的公式,求出,根據(jù)的意義,即可得出澆灌海水濃度對畝產(chǎn)量的貢獻(xiàn)率.
【詳解】(1)根據(jù)題意,可得,

而與之間的線性回歸方程為,
則,解得:,
當(dāng)時,,
所以當(dāng)海水濃度為8‰時,該品種的畝產(chǎn)量為0.24噸.
(2)①由(1)知,
根據(jù)殘差公式,得殘差表如下:
海水濃度(‰) 3 4 5 6 7
畝產(chǎn)量(噸) 0.62 0.58 0.49 0.4 0.31
殘差 -0.02 0.02 0.01 0 -0.01
②根據(jù)題意,可得:

所以澆灌海水濃度對畝產(chǎn)量的貢獻(xiàn)率是.
【點(diǎn)睛】本題考查線性回歸方程和殘差的計算,以及相關(guān)指數(shù)的求法和根據(jù)的意義對實(shí)際問題進(jìn)行分析,考查運(yùn)算能力.
2.(2018·廣東茂名·統(tǒng)考一模)一只藥用昆蟲的產(chǎn)卵數(shù)y與一定范圍內(nèi)的溫度x有關(guān),現(xiàn)收集了該種藥用昆蟲的6組觀測數(shù)據(jù)如下表:
溫度x/℃ 21 23 24 27 29 32
產(chǎn)卵數(shù)y/個 6 11 20 27 57 77
經(jīng)計算得:
,,線性回歸模型的殘差平方和,,
其中分別為觀測數(shù)據(jù)中的溫度和產(chǎn)卵數(shù),
(1)若用線性回歸模型,求y關(guān)于x的回歸方程(精確到0.1);
(2)若用非線性回歸模型求得y關(guān)于x的回歸方程為,且相關(guān)指數(shù).
①試與1中的回歸模型相比,用說明哪種模型的擬合效果更好.
②用擬合效果好的模型預(yù)測溫度為35℃時該用哪種藥用昆蟲的產(chǎn)卵數(shù)(結(jié)果取整數(shù))
附:一組數(shù)據(jù)其回歸直線的斜率和截距的最小二乘估計為,;相關(guān)指數(shù).
【答案】(1) (2)①用非線性回歸模型擬合效果更好;②190個
【分析】(1)求出、后代入公式直接計算得、,即可得解;
(2)求出線性回歸模型的相關(guān)指數(shù),與比較即可得解;
(3)直接把代入,計算即可得解.
【詳解】(1)由題意,則,,
,,
y關(guān)于x的線性回歸方程為.
(2)①對于線性回歸模型,,,
相關(guān)指數(shù)為
因?yàn)椋杂梅蔷€性回歸模型擬合效果更好.
②當(dāng),時(個)
所以溫度為時,該種藥用昆蟲的產(chǎn)卵數(shù)估計為190個.
【點(diǎn)睛】本題考查了線性回歸方程的求解、相關(guān)指數(shù)的應(yīng)用以及非線性回歸方程的應(yīng)用,考查了計算能力,屬于中檔題.
題型六:非線性擬合
【例1】(2023下·山西·高二統(tǒng)考期中)某生產(chǎn)制造企業(yè)統(tǒng)計了近10年的年利潤(千萬元)與每年投入的某種材料費(fèi)用(十萬元)的相關(guān)數(shù)據(jù),作出如下散點(diǎn)圖:
選取函數(shù)作為每年該材料費(fèi)用和年利潤的回歸模型.若令,則,得到相關(guān)數(shù)據(jù)如表所示:
31.5 15 15 49.5
(1)求出與的回歸方程;
(2)計劃明年年利潤額突破1億,則該種材料應(yīng)至少投入多少費(fèi)用?(結(jié)果保留到萬元)參考數(shù)據(jù):.
【答案】(1)
(2)498萬元
【分析】(1)由表中數(shù)據(jù)代入最小二乘法公式計算即可;
(2)按照(1)中所求回歸方程,結(jié)合參考數(shù)據(jù),代入計算即可.
【詳解】(1)因?yàn)?br/>由表中數(shù)據(jù)得,
所以,所以,
所以年該材料費(fèi)用和年利潤額的回歸方程為;
(2)令,得,
所以(十萬),
故下一年應(yīng)至少投入498萬元該材料費(fèi)用.
【例2】(2023·貴州貴陽·校聯(lián)考模擬預(yù)測)為了研究某種細(xì)菌隨天數(shù)x變化的繁殖個數(shù)y,收集數(shù)據(jù)如下:
天數(shù)x 1 2 3 4 5 6
繁殖個數(shù)y 6 12 25 49 95 190
(1)在圖中作出繁殖個數(shù)y關(guān)于天數(shù)x變化的散點(diǎn)圖,并由散點(diǎn)圖判斷(a,b為常數(shù))與(,為常數(shù),且,)哪一個適宜作為繁殖個數(shù)y關(guān)于天數(shù)x變化的回歸方程類型?(給出判斷即可,不必說明理由)
(2)對于非線性回歸方程(,為常數(shù),且,),令,可以得到繁殖個數(shù)的對數(shù)z關(guān)于天數(shù)x具有線性關(guān)系及一些統(tǒng)計量的值.
3.50 62.83 3.53 17.50 596.57 12.09
①證明:“對于非線性回歸方程,令,可以得到繁殖個數(shù)的對數(shù)z關(guān)于天數(shù)x具有線性關(guān)系(即,β,α為常數(shù))”;
②根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程(系數(shù)保留2位小數(shù)).
附:對于一組數(shù)據(jù),,…,,其回歸直線方程的斜率和截距的最小二乘估計分別為,.
【答案】(1)作圖見解析,選擇為回歸方程較適宜
(2)① 證明見解析;②
【分析】(1)根據(jù)散點(diǎn)圖,結(jié)合一次函數(shù)和指數(shù)型函數(shù)圖象的特征進(jìn)行判斷即可;
(2)①根據(jù)對數(shù)與指數(shù)的互化公式進(jìn)行求解即可;
②利用題中所給的數(shù)據(jù)和公式進(jìn)行求解即可.
【詳解】(1)作出散點(diǎn)圖如圖所示.
由散點(diǎn)圖看出樣本點(diǎn)分布在一條指數(shù)型曲線的周圍,
故選擇為回歸方程較適宜;
(2)①由已知,,則,
則,,即.所以繁殖個數(shù)的對數(shù)z關(guān)于天數(shù)x具有線性關(guān)系.
②由①知繁殖個數(shù)的對數(shù)z關(guān)于天數(shù)x可以用線性回歸方程來擬合.
由表中數(shù)據(jù)可得,

則z關(guān)于x的線性回歸方程為.
又,
因此細(xì)菌的繁殖個數(shù)y關(guān)于天數(shù)x的非線性回歸方程為.
【例3】(2022上·重慶沙坪壩·高三重慶八中校考階段練習(xí))多年來,清華大學(xué)電子工程系黃翔東教授團(tuán)隊致力于光譜成像芯片的研究,2022年6月研制出國際首款實(shí)時超光譜成像芯片,相比已有光譜檢測技術(shù),實(shí)現(xiàn)了從單點(diǎn)光譜儀到超光譜成像芯片的跨越,為制定下一年的研發(fā)投入計劃,該研發(fā)團(tuán)隊為需要了解年研發(fā)資金投入量x(單位:億元)對年銷售額(單位:億元)的影響,結(jié)合近12年的年研發(fā)資金投入量x,和年銷售額,的數(shù)據(jù)(,2,,12),該團(tuán)隊建立了兩個函數(shù)模型:①②,其中均為常數(shù),e為自然對數(shù)的底數(shù),經(jīng)對歷史數(shù)據(jù)的初步處理,得到散點(diǎn)圖如圖,令,計算得如下數(shù)據(jù):
20 66 770 200 14
460 3125000 21500
(1)設(shè)和的相關(guān)系數(shù)為和的相關(guān)系數(shù)為,請從相關(guān)系數(shù)的角度,選擇一個擬合程度更好的模型;
(2)(i)根據(jù)(1)的選擇及表中數(shù)據(jù),建立關(guān)于的回歸方程(系數(shù)精確到0.01);
(ii)若下一年銷售額需達(dá)到80億元,預(yù)測下一年的研發(fā)資金投入量是多少億元?
附:①相關(guān)系數(shù),回歸直線中斜率和截距的最小二乘估計公式分別為:,;
②參考數(shù)據(jù):.
【答案】(1)模型的擬合程度更好
(2)(i)(ii)預(yù)測下一年的研發(fā)資金投入量是億元
【分析】(1)由題意計算相關(guān)系數(shù),比較它們的大小即可判斷;(2)(i)先建立關(guān)于的的線性回歸方程,再轉(zhuǎn)化為y關(guān)于的回歸方程;(2)利用回歸方程計算時x的值即可.
【詳解】(1)由題意進(jìn)行數(shù)據(jù)分析:
則,因此從相關(guān)系數(shù)的角度,模型的擬合程度更好
(2)(i)先建立關(guān)于的線性回歸方程.
由,得,即.
由于
所以關(guān)于的線性回歸方程為,
所以,則.
(ii)下一年銷售額需達(dá)到80億元,即,代入得,,

所以,解得,
所以預(yù)測下一年的研發(fā)資金投入量是億元
鞏固訓(xùn)練
1.(2022下·福建三明·高二統(tǒng)考期末)在國家大力發(fā)展新能源汽車產(chǎn)業(yè)的政策下,我國新能源汽車的產(chǎn)銷量高速增長. 已知某地區(qū)2014年底到2021年底新能源汽車保有量的數(shù)據(jù)統(tǒng)計表如下:
年份(年) 2014 2015 2016 2017 2018 2019 2020 2021
年份代碼x 1 2 3 4 5 6 7 8
保有量y/千輛 1.95 2.92 4.38 6.58 9.87 15.00 22.50 33.70
參考數(shù)據(jù):,,其中
(1)根據(jù)統(tǒng)計表中的數(shù)據(jù)畫出散點(diǎn)圖(如圖),請判斷與哪一個更適合作為y關(guān)于x的經(jīng)驗(yàn)回歸方程(給出判斷即可,不必說明理由),并根據(jù)你的判斷結(jié)果建立y關(guān)于x的經(jīng)驗(yàn)回歸方程:
(2)假設(shè)每年新能源汽車保有量按(1)中求得的函數(shù)模型增長,且傳統(tǒng)能源汽車保有量每年下降的百分比相同.若2021年底該地區(qū)傳統(tǒng)能源汽車保有量為500千輛,預(yù)計到2026年底傳統(tǒng)能源汽車保有量將下降10%.試估計到哪一年底新能源汽車保有量將超過傳統(tǒng)能源汽車保有量.
參考公式:對于一組數(shù)據(jù),v1),),…,,其經(jīng)驗(yàn)回歸直線的斜率和截距的最小二乘估計公式分別為,;
【答案】(1)作圖見解析,選擇的函數(shù)模型是,;
(2)2028年.
【分析】(1)根據(jù)題中所給公式,結(jié)合對數(shù)函數(shù)的性質(zhì)進(jìn)行求解即可;
(2)根據(jù)指數(shù)函數(shù)的性質(zhì),結(jié)合對數(shù)運(yùn)算性質(zhì)進(jìn)行求解即可.
【詳解】(1)根據(jù)該地區(qū)新能源汽車保有量的增長趨勢知,應(yīng)選擇的函數(shù)模型是,令,則
因?yàn)椋?br/>所以,,
,所以;
(2)設(shè)傳統(tǒng)能源汽車保有量每年下降的百分比為r,依題意得,),解得,設(shè)從2021年底起經(jīng)過x年后的傳統(tǒng)能源汽車保有量為y千輛,則有x,設(shè)從2021年底起經(jīng)過x年后新能源汽車的數(shù)量將超過傳統(tǒng)能源汽車,則有
,所以,
解得,故從2021年底起經(jīng)過7年后,即2028年底新能源汽車的數(shù)量將超過傳統(tǒng)能源汽車.
2.(2022·山東聊城·統(tǒng)考三模)為迎接年北京冬奧會,踐行“更快更高更強(qiáng)”的奧林匹克格言,落實(shí)全民健身國家戰(zhàn)略.某校高二年級發(fā)起了“發(fā)揚(yáng)奧林匹克精神,鍛煉健康體魄”的年度主題活動,經(jīng)過一段時間后,學(xué)生的身體素質(zhì)明顯提高.
(1)為了解活動效果,該年級對開展活動以來近個月體重超重的人數(shù)進(jìn)行了調(diào)查,調(diào)查結(jié)果統(tǒng)計如上圖,根據(jù)上面的散點(diǎn)圖可以認(rèn)為散點(diǎn)集中在曲線的附近,請根據(jù)下表中的數(shù)據(jù)求出該年級體重超重人數(shù)與月份之間的經(jīng)驗(yàn)回歸方程(系數(shù)和的最終結(jié)果精確到),并預(yù)測從開展活動以來第幾個月份開始該年級體重超標(biāo)的人數(shù)降至人以下?
月份
體重超標(biāo)人數(shù)
(2)在某次足球訓(xùn)練課上,球首先由隊員控制,此后足球僅在、、三名隊員之間傳遞,假設(shè)每名隊員控球時傳給其他隊員的概率如下表所示:
控球隊員
接球隊員
概率
若傳球次,記隊員控球次數(shù)為,求的分布列及均值.
附:經(jīng)驗(yàn)回歸方程:中,,;
參考數(shù)據(jù):,,,.
【答案】(1),第十個月
(2)分布列見解析,
【分析】(1)令,求出、的值,將參考數(shù)據(jù)代入最小二乘法公式,求出、的值,即可得出關(guān)于的經(jīng)驗(yàn)回歸方程,然后解不等式,即可得解;
(2)分析可知隨機(jī)變量的可能取值有、、,可得出隨機(jī)變量的分布列,進(jìn)而可求得.
【詳解】(1)解:由得.
由題意得,,
所以,
.
所以,即關(guān)于的經(jīng)驗(yàn)回歸方程為.
令,所以,解得.
由于,所以,
所以從第十個月開始,該年級體重超標(biāo)的人數(shù)降至人以下.
(2)解:由題意得的可能取值為、、,
,,

所以的分布列為
所以,.
3.(2022下·山西太原·高二校考期中)某公司對某產(chǎn)品作市場調(diào)查,獲得了該產(chǎn)品的定價(單位:萬元/噸)和一天的銷量(噸)的一組數(shù)據(jù),根據(jù)這組數(shù)據(jù)制作了如下統(tǒng)計表和散點(diǎn)圖.
0.33 10 3 0.164 100 68 350
表中.
(1)根據(jù)散點(diǎn)圖判斷,與哪一個更適合作為關(guān)于的經(jīng)驗(yàn)回歸方程;(給出判斷即可,不必說明理由)
(2)根據(jù)(1)的判斷結(jié)果,建立關(guān)于的經(jīng)驗(yàn)回歸方程;
【答案】(1)
(2)
【分析】(1)由散點(diǎn)圖可知這些點(diǎn)分布在一條曲線附近,從而可作出判斷,
(2)令,則,然后根據(jù)表中的數(shù)據(jù)和線性回歸方程公式求解即可
【詳解】(1)根據(jù)散點(diǎn)圖可知,更適合作為關(guān)于的經(jīng)驗(yàn)回歸方程;
(2)令,則,
所以,
所以,
所以,
故關(guān)于的經(jīng)驗(yàn)回歸方程為,
題型七:獨(dú)立性檢驗(yàn)(選填)
【例1】(2023上·全國·高三專題練習(xí))千百年來,我國勞動人民在生產(chǎn)實(shí)踐中根據(jù)云的形狀、走向、速度、厚度、顏色等的變化,總結(jié)了豐富的“看云識天氣”的經(jīng)驗(yàn),并將這些經(jīng)驗(yàn)編成諺語,如“天上鉤鉤云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同學(xué)為了驗(yàn)證“日落云里走,雨在半夜后”,觀察了地區(qū)A的100天日落和夜晚天氣,得到如下2×2列聯(lián)表(單位:天),并計算得到,下列小波對地區(qū)A天氣的判斷不正確的是( )
日落云里走 夜晚天氣 下雨 未下雨
出現(xiàn) 25 5
未出現(xiàn) 25 45
參考公式:
臨界值參照表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.夜晚下雨的概率約為
B.未出現(xiàn)“日落云里走”,夜晚下雨的概率約為
C.據(jù)小概率值的獨(dú)立性檢驗(yàn),認(rèn)為“日落云里走”是否出現(xiàn)與夜晚天氣有關(guān)
D.出現(xiàn)“日落云里走”, 據(jù)小概率值的獨(dú)立性檢驗(yàn),可以認(rèn)為夜晚會下雨
【答案】D
【分析】應(yīng)用古典概型的概率求法求概率判斷A、B,應(yīng)用卡方計算公式求卡方值,與臨界值比較,應(yīng)用獨(dú)立檢驗(yàn)的基本思想得到結(jié)論,判斷C、D.
【詳解】由列聯(lián)表知:100天中有50天下雨,50天未下雨,因此夜晚下雨的概率約為,A正確;
未出現(xiàn)“日落云里走”,夜晚下雨的概率約為,B正確;
,因此據(jù)小概率值的獨(dú)立性檢驗(yàn),認(rèn)為“日落云里走”是否出現(xiàn)與夜晚天氣有關(guān),C正確,D錯誤.
故選:D
【例2】(2023上·高二課時練習(xí))手機(jī)給人們的生活帶來便捷,但同時也對中學(xué)生的生活和學(xué)習(xí)造成了一定的影響.某校幾個學(xué)生成立研究性學(xué)習(xí)小組,就使用手機(jī)對學(xué)習(xí)成績的影響隨機(jī)抽取了該校100名學(xué)生的期末考試成績并制成如下的表,則下列說法正確的是( )
手機(jī)使 用情況 成績
成績優(yōu)秀 成績不優(yōu)秀 總計
不用手機(jī) 40 10 50
使用手機(jī) 5 45 50
總計 45 55 100
(參考公式:,其中)
A.在犯錯誤的概率不超過0.01的前提下認(rèn)為使用手機(jī)與學(xué)習(xí)成績無關(guān)
B.在犯錯誤的概率不超過0.1的前提下認(rèn)為使用手機(jī)與學(xué)習(xí)成績無關(guān)
C.有99%的把握認(rèn)為使用手機(jī)對學(xué)習(xí)成績有影響
D.無99%的把握認(rèn)為使用手機(jī)對學(xué)習(xí)成績有影響
【答案】C
【分析】根據(jù)給定的數(shù)表,求出的觀測值,再與臨界值表比對判斷作答.
【詳解】由列聯(lián)表中的數(shù)據(jù),計算,
所以在犯錯誤的概率不超過0.01的前提下認(rèn)為使用手機(jī)與學(xué)習(xí)成績有關(guān),AB錯誤;
有99%的把握認(rèn)為使用手機(jī)對學(xué)習(xí)成績有影響,C正確,D錯誤.
故選:C
【例3】(2023上·高二單元測試)某部門通過隨機(jī)調(diào)查89名工作人員的休閑方式是讀書還是健身,得到的數(shù)據(jù)如下表:
性別 休閑方式
讀書 健身 總計
女 24 31 55
男 8 26 34
總計 32 57 89
在犯錯誤的概率不超過 的前提下性別與休閑方式有關(guān)系.
參考公式:.
【答案】0.1/
【分析】直接利用分式計算,再用臨界值表判斷即可.
【詳解】由列聯(lián)表中的數(shù)據(jù)算得
因此,在犯錯誤的概率不超過0.10的前提下認(rèn)為性別與休閑方式有關(guān)聯(lián).
故答案為:0.1
【例4】(2023下·高二單元測試)若兩個分類變量與的列聯(lián)表為:
y1 y2 合計
x1 10 15 25
x2 40 16 56
合計 50 31 81
則有 的把握認(rèn)為“與之間有關(guān)系”.
附:,其中
0.050 0.010 0.001
k 3.841 6.635 10.828
【答案】
【分析】先求,然后與臨界值比較即可得出答案.
【詳解】由列聯(lián)表數(shù)據(jù),可求得,
所以有的把握認(rèn)為“X與Y之間有關(guān)系”.
故答案為:.
鞏固訓(xùn)練
1.(2023上·高二單元測試)某校團(tuán)委對“喜歡吃水果和學(xué)生性別是否有關(guān)”進(jìn)行了一次調(diào)查,其中被調(diào)查的女生人數(shù)是男生人數(shù)的,男生喜歡吃水果的人數(shù)占被調(diào)查的男生人數(shù)的,女生喜歡吃水果的人數(shù)占被調(diào)查的女生人數(shù)的,若有99%的把握認(rèn)為喜歡吃水果和學(xué)生性別有關(guān),則被調(diào)查的男生至少有( )
0.10 0.05 0.010 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
A.12人 B.18人
C.24人 D.30人
【答案】B
【分析】設(shè)被調(diào)查的男生人數(shù)為x,根據(jù)題意可得列聯(lián)表,進(jìn)而可得,運(yùn)算求解即可.
【詳解】設(shè)被調(diào)查的男生人數(shù)為x,被調(diào)查的女生人數(shù)為,則得到2×2列聯(lián)表如下:
喜歡吃水果情況 總計
喜歡 不喜歡
學(xué)生 性別 男生
女生
總計
則,解得,
又因?yàn)槟小⑴藬?shù)為整數(shù),所以被調(diào)查的男生至少有18人.
故選:B.
2.(2023上·高二單元測試)冶煉某種金屬可以用舊設(shè)備和改造后的新設(shè)備,為了檢驗(yàn)用這兩種設(shè)備生產(chǎn)的產(chǎn)品中所含雜質(zhì)的關(guān)系,調(diào)查結(jié)果如表所示:
設(shè)備 雜質(zhì)情況
雜質(zhì)高 雜質(zhì)低
舊設(shè)備 37 121
新設(shè)備 22 202
參考公式:,
根據(jù)以上數(shù)據(jù),則下列說法正確的是( )
A.含雜質(zhì)的高低與設(shè)備改造有關(guān)
B.含雜質(zhì)的高低與設(shè)備改造無關(guān)
C.設(shè)備是否改造決定含雜質(zhì)的高低
D.以上答案都不對
【答案】A
【分析】先完成列聯(lián)表,然后計算卡方,再根據(jù)臨界值表判斷即可
【詳解】由已知數(shù)據(jù)得到如下2×2列聯(lián)表:
雜質(zhì)高 雜質(zhì)低 總計
舊設(shè)備 37 121 158
新設(shè)備 22 202 224
總計 59 323 382

由于13.11>6.635,
故在犯錯誤的概率不超過0.01的前提下認(rèn)為含雜質(zhì)的高低與設(shè)備改造是有關(guān)的.
故選:A
3.(2022下·福建福州·高二福州三中校考期末)為了考察某種藥物預(yù)防疾病的效果,進(jìn)行動物試驗(yàn),得到如下列聯(lián)表:
藥物 疾病 合計
未患病 患病
服用 a 50
未服用 50
合計 80 20 100
若在本次考察中得出“在犯錯誤的概率不超過0.01的前提下認(rèn)為藥物有效”的結(jié)論,則a的最小值為 .(其中且)(參考數(shù)據(jù):,)
附:,
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
【答案】46
【分析】根據(jù)公式列不等式求解.
【詳解】由題意可得,
整理得,
所以或,
解得或,
又因?yàn)榍遥?br/>所以,
所以a的最小值為46.
故答案為:46.
4.(2023上·高二課時練習(xí))為了考查某流感疫苗的效果,某實(shí)驗(yàn)室隨機(jī)抽取100只健康小鼠進(jìn)行試驗(yàn),得到如下列聯(lián)表:
疫苗使 用情況 感染情況
感染 未感染 總計
注射 10 40 50
未注射 20 30 50
總計 30 70 100
參照附表,在犯錯誤的概率最多不超過 的前提下,可認(rèn)為“注射疫苗”與“感染某流感”有關(guān)系.
參考公式:.
【答案】0.05
【分析】根據(jù)給定的數(shù)表,求出的觀測值,再與臨界值表比對作答.
【詳解】由列聯(lián)表中數(shù)據(jù),計算得,
所以在犯錯誤的概率最多不超過0.05的前提下,認(rèn)為“注射疫苗”與“感染某流感”有關(guān)系.
故答案為:0.05
題型八:獨(dú)立性檢驗(yàn)(解答)
【例1】(2024·江蘇南京·金陵中學(xué)校考模擬預(yù)測)某高中為了了解高中學(xué)生暑假期間閱讀古典名著的時間(小時/每周)和他們的語文成績(分)的關(guān)系,某實(shí)驗(yàn)小組做了調(diào)查,得到一些數(shù)據(jù)(表一).
表一
編號 1 2 3 4 5
學(xué)習(xí)時間 2 4 7 7 10
語文成績 82 93 95 108 122
(1)請根據(jù)所給數(shù)據(jù)求出語文成績的平均數(shù)和方差;
(2)基于上述調(diào)查,學(xué)校為了確認(rèn)學(xué)生喜歡閱讀古典名著與語文成績的關(guān)系,抽樣調(diào)查了200位學(xué)生.按照是否喜歡閱讀古典名著與語文成績是否優(yōu)秀統(tǒng)計,得到下列數(shù)據(jù),請依據(jù)表中數(shù)據(jù)及小概率值的獨(dú)立性檢驗(yàn),分析“喜歡閱讀古典名著與語文成績優(yōu)秀”是否有關(guān).
表二
語文成績優(yōu)秀 語文成績不優(yōu)秀 合計
喜歡閱讀 75 25 100
不喜歡閱讀 55 45 100
合計 130 70 200
0.10 0.05 0.010
2.706 3.841 6.635
【答案】(1)平均數(shù)為100,方差為189.2
(2)可以認(rèn)為“喜歡閱讀古典名著與語文成績優(yōu)秀”有關(guān)
【分析】(1)由平均數(shù)以及方差的計算公式,即可求得答案;
(2)根據(jù)已知數(shù)據(jù)計算的值,與臨界值表比較,根據(jù)獨(dú)立性檢驗(yàn)的原則,即可得結(jié)論.
【詳解】(1)由題意得,

所以語文成績的平均數(shù)為100,方差為189.2.
(2)零假設(shè)為:喜歡閱讀古典名著與語文成績優(yōu)秀無關(guān).
根據(jù)表中數(shù)據(jù),可得,
所以依據(jù)的獨(dú)立性檢驗(yàn),不成立,
故可以認(rèn)為“喜歡閱讀古典名著與語文成績優(yōu)秀”有關(guān).
【例2】(2024·陜西·校聯(lián)考一模)我國老齡化時代已經(jīng)到來,老齡人口比例越來越大,出現(xiàn)很多社會問題.2015年10月,中國共產(chǎn)黨第十八屆中央委員會第五次全體會議公報指出:堅持計劃生育基本國策,積極開展應(yīng)對人口老齡化行動,實(shí)施全面二孩政策.隨著國家二孩政策的全面放開,為了調(diào)查一線城市和非一線城市的二孩生育意愿,某機(jī)構(gòu)用簡單隨機(jī)抽樣方法從不同地區(qū)調(diào)查了100位育齡婦女,結(jié)果如下表.
非一線 一線 總計
愿生 40 y 60
不愿生 x 22 40
總計 58 42 100
(1)求x和y的值.
(2)分析調(diào)查數(shù)據(jù),是否有以上的把握認(rèn)為“生育意愿與城市級別有關(guān)”?
(3)在以上二孩生育意愿中按分層抽樣的方法,抽取6名育齡婦女,再選取兩名參加育兒知識講座,求至少有一名來自一線城市的概率.
參考公式:,
0.050 0.010 0.001
k 3.841 6.635 10.828
【答案】(1)
(2)有以上的把握認(rèn)為“生育意愿與城市級別有關(guān)”
(3)
【分析】(1)根據(jù)列聯(lián)表中數(shù)據(jù)分析得到答案;
(2)計算出卡方,與比較后得到結(jié)論;
(3)利用列舉法求出古典概型的概率.
【詳解】(1)由題意得,;
(2)由,得,
∴有以上的把握認(rèn)為“生育意愿與城市級別有關(guān)”.
(3)抽取6名育齡婦女,來自一線城市的人數(shù)為,記為1,2,
來自非一線城市的人數(shù)為,記為a,b,c,d,
選設(shè)事件A為“取兩名參加育兒知識講座,求至少有一名來自一線城市”,
基本事件為:,

事件共有9個,

【例3】(2024下·全國·高三開學(xué)考試)2023年11月,世界首屆人工智能峰會在英國舉行,我國因?yàn)樵谠擃I(lǐng)域取得的巨大成就受邀進(jìn)行大會發(fā)言.為了研究不同性別的學(xué)生對人工智能的了解情況,我市某著名高中進(jìn)行了一次抽樣調(diào)查,分別抽取男 女生各50人作為樣本.設(shè)事件“了解人工智能”,“學(xué)生為男生”,據(jù)統(tǒng)計.
(1)根據(jù)已知條件,填寫下列列聯(lián)表,是否有把握推斷該校學(xué)生對人工智能的了解情況與性別有關(guān)?
了解人工智能 不了解人工智能 合計
男生
女生
合計
(2)①現(xiàn)從所抽取的女生中利用分層抽樣的方法抽取20人,再從這20人中隨機(jī)選取3人贈送科普材料,求選取的3人中至少有2人了解人工智能的概率;
②將頻率視為概率,從我市所有參與調(diào)查的學(xué)生中隨機(jī)抽取20人科普材料,記其中了解人工智能的人數(shù)為X,求隨機(jī)變量的數(shù)學(xué)期望和方差.
參考公式:.常用的小概率值和對應(yīng)的臨界值如下表:
0.150 0.100 0.050 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
【答案】(1)列聯(lián)表見解析;沒有
(2)①;②,.
【分析】(1)根據(jù)兩個條件概率值求出列聯(lián)表中的數(shù)據(jù),利用卡方公式計算的值,再與對應(yīng)的小概率值比較即得結(jié)論;
(2)①先利用分層抽樣確定所抽取的名女市民中了解和不了解人工智能的人數(shù),再利用古典概率模型概率公式計算即得;
②根據(jù)列聯(lián)表推理得到從我市高中生中任意抽取一人,恰好抽到了解人工智能學(xué)生的概率為,每次抽的結(jié)果僅有“了解”與“不了解”兩種,隨機(jī)抽取20人,相當(dāng)于完成20次伯努利試驗(yàn),故利用二項(xiàng)分布期望與方差公式即可求得.
【詳解】(1)因?yàn)椋?br/>所以了解人工智能的女生為,了解人工智能的總?cè)藬?shù)為,
則了解人工智能的男生有人,
結(jié)合男生和女生各有人,填寫列聯(lián)表為:
了解人工智能 不了解人工智能 合計
男生 40 10 50
女生 30 20 50
合計 70 30 100
因,
故沒有把握推斷該校學(xué)生對人工智能的了解情況與性別有關(guān).
(2)①由題意可知,所抽取的名女市民中,了解人工智能的有人,
不了解人工智能的有人,
所以,選取的人中至少有人了解人工智能的概率為;
②由列聯(lián)表可知,抽到了解人工智能的學(xué)生的頻率為,
將頻率視為概率,所以,從我市高中生中任意抽取一人,恰好抽到了解人工智能學(xué)生的概率為,
由題意可知,,所以,,.
鞏固訓(xùn)練
1.(2024上·河北張家口·高三統(tǒng)考期末)某公司男女職工人數(shù)相等,該公司為了解職工是否接受去外地長時間出差,進(jìn)行了如下調(diào)查:在男女職工中各隨機(jī)抽取了100人,經(jīng)調(diào)查,男職工和女職工接受去外地長時間出差的人數(shù)分別為40和20.
(1)根據(jù)所給數(shù)據(jù),完成下面列聯(lián)表,并依據(jù)小概率值的獨(dú)立性檢驗(yàn),能否認(rèn)為是否接受去外地長時間出差與性別有關(guān)聯(lián)?
單位:人
性別 接受 不接受 合計


合計
(2)若將頻率視為概率,用樣本估計總體,從該公司中隨機(jī)抽取5人,記其中接受去外地長時間出差的人數(shù)為X,求X的數(shù)學(xué)期望,
附表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
附:,其中.
【答案】(1)填表見解析;認(rèn)為是否接受去外地長時間出差與性別有關(guān)聯(lián)
(2)
【分析】(1)數(shù)據(jù)分析填寫列聯(lián)表,計算出卡方,與比較后得到答案;
(2)得到,利用期望公式求出答案.
【詳解】(1)依題意,列出列聯(lián)表如下:
單位:人
性別 接受 不接受 合計
男 40 60 100
女 20 80 100
合計 60 140 200
零假設(shè)為:是否接受去外地長時間出差與性別相互獨(dú)立,即是否接受去外地長時間出差與性別無關(guān),
所以.
根據(jù)小概率值的獨(dú)立性檢驗(yàn),我們推斷不成立,
即認(rèn)為是否接受去外地長時間出差與性別有關(guān)聯(lián),此推斷犯錯誤的概率不大于0.005.
(2)由題意,接受去外地長時間出差的頻率為,
所以接受去外地長時間出差的概率為.
隨機(jī)變量的可能取值為0,1,2,3,4,5,
由題意,得,
所以的數(shù)學(xué)期望.
2.(2024上·山東德州·高二統(tǒng)考期末)為了解某一地區(qū)電動汽車銷售情況,某部門根據(jù)統(tǒng)計數(shù)據(jù),用最小二乘法得到電動汽車銷量y(單位:萬臺)關(guān)于x(年份)的線性回歸方程為,且銷量y的方差,年份x的方差.
(1)求y與x的相關(guān)系數(shù)r,并據(jù)此判斷電動汽車銷量y與年份x的相關(guān)性強(qiáng)弱;
(2)該部門還調(diào)查了該地區(qū)90位購車車主的性別與購車種類情況,得到的數(shù)據(jù)如下表:
性別 購買非電動汽車 購買電動汽車 總計
男性 39 45
女性 15
總計
根據(jù)調(diào)查數(shù)據(jù)回答:是否有的把握認(rèn)為購買電動汽車與車主性別有關(guān)?
參考公式:(i)線性回歸方程:,其中;
(ii)相關(guān)系數(shù):,若,則可判斷y與x線性相關(guān)較強(qiáng).
(iii),其中.附表:
0.10 0.05 0.010 0.001
2.706 3.841 6.635 10.828
【答案】(1)0.9375,y與x線性相關(guān)較強(qiáng)
(2)有的把握認(rèn)為購買電動汽車與車主性別有關(guān)
【分析】(1)將相關(guān)系數(shù)公式適當(dāng)變形成,代入相關(guān)值計算即可判斷;
(2)根據(jù)題意完成列聯(lián)表,計算的值,并與對應(yīng)的小概率值比較即得.
【詳解】(1)相關(guān)系數(shù)為

(由y關(guān)于x的線性回歸方程為可知:,且,)
故y與x線性相關(guān)較強(qiáng).
(2)由題意:
性別 購買非電動汽車 購買電動汽車 總計
男性 39 6 45
女性 30 15 45
總計 69 21 90

由表可得,所以有的把握認(rèn)為購買電動汽車與車主性別有關(guān).
3.(2024下·甘肅·高三武威第六中學(xué)校聯(lián)考開學(xué)考試)2022年日本17歲男性的平均身高為,同樣的數(shù)據(jù)1994年是,近30年日本的平均身高不僅沒有增長,反而降低了.反觀中國近30年,男性平均身高增長了約.某課題組從中國隨機(jī)抽取了400名成年男性,記錄他們的身高,將數(shù)據(jù)分成八組:,;同時從日本隨機(jī)抽取了200名成年男性,記錄他們的身高,將數(shù)據(jù)分成五組:,整理得到如下頻率分布直方圖:

(1)由頻率分布直方圖估計樣本中日本成年男性身高的分位數(shù);
(2)為了了解身高與蛋白質(zhì)攝入量之間是否有關(guān)聯(lián),課題組調(diào)查樣本中的600人得到如下列聯(lián)表:
身高 蛋白質(zhì)攝入量 合計
豐富 不豐富
低于 108
不低于 100
合計 600
結(jié)合頻率分布直方圖補(bǔ)充上面的列聯(lián)表,并依據(jù)小概率值的獨(dú)立性檢驗(yàn),推斷成年男性身高與蛋白質(zhì)攝入量之間是否有關(guān)聯(lián)?
附:.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【答案】(1)
(2)列聯(lián)表見解析,有關(guān)聯(lián)
【分析】(1)由頻率和為1解得,利用分位數(shù)位定義可得答案;
(2)由頻率分布直方圖計算出樣本中身高低于的中國成年男性人數(shù)、日本成年男性人數(shù)可完成表格,零假設(shè):成年男性身高與蛋白質(zhì)攝入量之間無關(guān)聯(lián),則由列聯(lián)表數(shù)據(jù)可得,依據(jù)的獨(dú)立性檢驗(yàn),可得答案.
【詳解】(1)由頻率分布直方圖可知,解得.
因?yàn)椋?br/>所以分位數(shù)位于,設(shè)為,
則有,解得,
故日本成年男性身高的分位數(shù)為;
(2)由頻率分布直方圖知,樣本中身高低于的中國成年男性人數(shù)是(人),
樣本中身高低于的日本成年男性人數(shù)是(人),
故樣本中身高低于的共有348人,可得下表:
身高 蛋白質(zhì)攝入量 合計
豐富 不豐富
低于 108 240 348
不低于 152 100 252
合計 260 340 600
零假設(shè):成年男性身高與蛋白質(zhì)攝入量之間無關(guān)聯(lián),則由列聯(lián)表數(shù)據(jù)可得:

依據(jù)的獨(dú)立性檢驗(yàn),我們推斷不成立,
即認(rèn)為成年男性身高與蛋白質(zhì)攝入量之間有關(guān)聯(lián).

展開更多......

收起↑

資源列表

    <track id="r4fhd"></track>

    <pre id="r4fhd"><abbr id="r4fhd"><code id="r4fhd"></code></abbr></pre>
      <ul id="r4fhd"></ul>

        <menu id="r4fhd"></menu>
        1. 主站蜘蛛池模板: 崇信县| 扶沟县| 海伦市| 三明市| 新乡市| 枣阳市| 凤台县| 出国| 澎湖县| 德阳市| 珲春市| 五大连池市| 东莞市| 光山县| 镇沅| 瑞昌市| 永善县| 靖江市| 新余市| 西平县| 阳山县| 南溪县| 城口县| 奉节县| 平武县| 天全县| 固始县| 台州市| 乃东县| 达州市| 东辽县| 比如县| 崇明县| 丹棱县| 富阳市| 靖西县| 尉犁县| 苍南县| 都昌县| 沾化县| 江安县|