資源簡介 第五單元 數(shù)據(jù)分析與人工智能 單元測試一、選擇題1.下列選項(xiàng)中,不屬于數(shù)據(jù)分析的作用的是( )A.了解事物的現(xiàn)狀 B.剖析事物的發(fā)展歷程C.預(yù)測事物的未來方向 D.獲取事物的數(shù)據(jù)信息2.下面是幾個(gè)信息技術(shù)應(yīng)用的描述①入戶門鎖提供指紋識(shí)別功能②將圖像中的漢字識(shí)別出來③計(jì)算機(jī)以字形碼顯示漢字④進(jìn)入辦公樓時(shí)需要通過人臉識(shí)別開啟門禁。下面關(guān)于體現(xiàn)了人工智能技術(shù)應(yīng)用的項(xiàng)目組合中,正確的是( )A.①②③④ B.①②③ C.①②④ D.②③④3.字節(jié)跳動(dòng)公司下的抖音APP、今日頭條APP利用強(qiáng)大的算法對用戶觀看內(nèi)容、時(shí)長、操作行為等大數(shù)據(jù)進(jìn)行處理,及時(shí)洞察用戶需求提供精準(zhǔn)服務(wù)以保持用戶黏性,對用戶行為數(shù)據(jù)處理的過程屬于( )A.?dāng)?shù)據(jù)分析 B.?dāng)?shù)據(jù)可視化表達(dá) C.?dāng)?shù)據(jù)采集 D.?dāng)?shù)據(jù)存儲(chǔ)4.閱讀下列材料,回答問題:某餐廳點(diǎn)餐系統(tǒng)的部分功能是:顧客掃描二維碼進(jìn)入菜單界面,選擇菜品后提交訂單信息到系統(tǒng)服務(wù)器,服務(wù)器根據(jù)提交的訂單信息進(jìn)行智能統(tǒng)籌處理,并將備菜流程實(shí)時(shí)提供給廚房,廚房對流程進(jìn)行語音確認(rèn),便于顧客知道能否對訂單進(jìn)行修改;顧客餐后可以通過在線支付或者現(xiàn)金支付方式進(jìn)行結(jié)算,系統(tǒng)對訂單信息進(jìn)行統(tǒng)計(jì)分析,自動(dòng)生成餐廳年月日的報(bào)表。下列關(guān)于該系統(tǒng)功能和應(yīng)用的說法不正確的是( )A.對外部環(huán)境的依賴是該系統(tǒng)最大的局限性B.該系統(tǒng)的使用可以提升餐廳的管理效率C.該系統(tǒng)只具有數(shù)據(jù)輸入和處理功能,不具有輸出等功能D.服務(wù)器基于數(shù)據(jù)分析的智能統(tǒng)籌處理,為廚房的備菜流程提供了科學(xué)的決策5.關(guān)于對比分析法中錯(cuò)誤的是( )A.是將兩個(gè)或兩個(gè)以上的數(shù)據(jù)進(jìn)行比較,分析差異,揭示出這些數(shù)據(jù)所反映的事物規(guī)律的方法B.通常用于從數(shù)量上展示和說明研究對象規(guī)模大小、水平高低、速度快慢及各種關(guān)系是否協(xié)調(diào)等C.是將各個(gè)部分與整體進(jìn)行對比,是分析事物內(nèi)部的結(jié)構(gòu)和部分與整體之間關(guān)系的方法D.分為橫向和縱向?qū)Ρ葍纱箢?br/>6.對兩個(gè)或多個(gè)數(shù)據(jù)進(jìn)行比較,常用對比分析法,通過分析其間的差異,揭示變化情況和規(guī)律。以下關(guān)于對比分析法的敘述中,不正確的是( )A.只有對同—時(shí)間的數(shù)據(jù)才能對比 B.對比的對象要有可比性C.對比數(shù)據(jù)的計(jì)算單位必須一致 D.對比的指標(biāo)必須統(tǒng)一7.下列關(guān)于數(shù)據(jù)處理描述錯(cuò)誤的是( )A.根據(jù)需求分析的目標(biāo)不同,數(shù)據(jù)處理的流程也不同B.?dāng)?shù)據(jù)必須經(jīng)過某種方式處理后,才具體實(shí)際意義C.?dāng)?shù)據(jù)整理是對數(shù)據(jù)進(jìn)行校驗(yàn)和標(biāo)準(zhǔn)化的過程D.?dāng)?shù)據(jù)分析可以讓我們了解事物的現(xiàn)狀、剖析其發(fā)展歷程和預(yù)測未來走向8.某同學(xué)將上學(xué)期期末考試成績和這學(xué)期期末考試成績進(jìn)行各學(xué)科的比較分析得出語文學(xué)科和英語學(xué)科有進(jìn)步,數(shù)學(xué)和物理等學(xué)科有所退步的結(jié)論,這樣的分析方法屬于( )A.縱向?qū)Ρ确治龇?B.橫向?qū)Ρ确治龇?C.平均分析法 D.結(jié)構(gòu)分析法9.如圖,對平均工資進(jìn)行分析,以反映2020年廣西城鎮(zhèn)單位從業(yè)人員平均工資水平。這種數(shù)據(jù)分析方法是( )A.平均分析法 B.對比分析法 C.交叉分析法 D.結(jié)構(gòu)分析法10.圖表中數(shù)據(jù)存在的問題是( )A.?dāng)?shù)據(jù)重復(fù) B.?dāng)?shù)據(jù)缺失C.?dāng)?shù)據(jù)邏輯錯(cuò)誤 D.?dāng)?shù)據(jù)格式不一致11.南水北調(diào)是一項(xiàng)跨世紀(jì)的重大工程。實(shí)施前,有關(guān)部門進(jìn)行了廣泛深入的研究,做了大量的數(shù)據(jù)處理工作。要想了解我國部分地區(qū)水庫蓄水情況,需要經(jīng)歷的數(shù)據(jù)處理過程主要有以下若干環(huán)節(jié),具體實(shí)施時(shí)這些環(huán)節(jié)的正確排序是( )① 利用柱形圖直觀地呈現(xiàn)分析結(jié)果② 分析黃河流域和長江流域近年來降水量、水位情況等數(shù)據(jù)③ 通過國家統(tǒng)計(jì)和水利等部門的官方網(wǎng)站獲取關(guān)于水庫蓄水的權(quán)威數(shù)據(jù)④ 對水文資料數(shù)據(jù)進(jìn)行整理、糾錯(cuò),并將有效數(shù)據(jù)設(shè)置為兩位小數(shù)的數(shù)據(jù)格式A.①②③④ B.③④①② C.③④②① D.④③②①12.我國政府部門開發(fā)的精準(zhǔn)扶貧大數(shù)據(jù)云平臺(tái)能夠匯集各地相關(guān)數(shù)據(jù),通過對數(shù)據(jù)的提取分析獲得了貧困人口的致貧原因等有價(jià)值的信息,為扶貧工作提供了真實(shí)可靠、及時(shí)全面的決策數(shù)據(jù)。這種從規(guī)模巨大的、不完全的數(shù)據(jù)中,分析并提取有潛在價(jià)值信息的技術(shù)稱為( )A.大數(shù)據(jù)存儲(chǔ)與管理技術(shù) B.大數(shù)據(jù)分析與挖掘技術(shù)C.大數(shù)據(jù)可視化與應(yīng)用技術(shù) D.大數(shù)據(jù)預(yù)處理技術(shù)13.運(yùn)用計(jì)算平均值的方法反映總體在一定時(shí)間、地點(diǎn)條件下某一數(shù)量特征的一般水平,這種數(shù)據(jù)分析方法稱為( )A.計(jì)算分析 B.總體分析 C.平均分析 D.?dāng)?shù)量分析二、簡答題14.自新型冠狀病毒變?yōu)橐翌愐夜芤詠恚珖幕吐糜涡袠I(yè)在強(qiáng)勁復(fù)蘇的基礎(chǔ)上,乘勢而上,跑出發(fā)展“加速度”。全國各地持續(xù)出臺(tái)利好政策,積極推動(dòng)文化和旅游加速復(fù)蘇和深度融合發(fā)展。隨著旅游業(yè)的復(fù)蘇,全國鐵路、航空運(yùn)輸客運(yùn)量如表所示。其中,人公里是運(yùn)輸計(jì)算客運(yùn)量的單位,表示運(yùn)送旅客人數(shù)與運(yùn)送距離的乘積。(數(shù)據(jù)來源于國家數(shù)據(jù)統(tǒng)計(jì)局 http://www.stats./)(億人公里) 2022年10月 2022年11月 2022年12月 2023年1月 2023年2月鐵路旅客周轉(zhuǎn)量 436.36 277.25 400.31 1031.29 1107.39民航旅客周轉(zhuǎn)量 240.9 200.66 307.85 641.19 697.16(1)你認(rèn)為表格中的數(shù)據(jù)可靠嗎?為什么?(2)為呈現(xiàn)數(shù)據(jù)分析的結(jié)果,某同學(xué)編寫了如下所示代碼。請問此程序繪制出了什么類型的圖表?此類圖表的優(yōu)勢是什么?import matplotlib.pyplot as plt x=["22-10","22-11","22-12","23-1","23-2"] y=[240.9,200.66,307.85,641.19,697.16] plt.plot(x,y) plt.show()(3)常用的數(shù)據(jù)分析方法有對比分析法、平均分析法和結(jié)構(gòu)分析法。問題(2)中同學(xué)的分析使用了何種數(shù)據(jù)分析方法并闡述選擇該分析方法理由。三、操作題15.張三同學(xué)收集了一個(gè)地區(qū)8月各類共享單車的騎行數(shù)據(jù)記錄,每天的用戶數(shù)據(jù)存儲(chǔ)于“sharedbikes.xlsx”文件中,不考慮跨天數(shù)據(jù)。數(shù)據(jù)格式如圖a所示,請回答下列問題: 圖a(1)cal函數(shù)功能為:讀取騎行時(shí)間的小時(shí)和分鐘部分,轉(zhuǎn)換為分鐘格式并返回,如“2022/8/206:57”獲取“6:57”轉(zhuǎn)換為417(6*60+57=417),代碼如下。請?jiān)趧澗€處填入合適的代碼。defcal(s):n=len(s)for i in range(n)ifs[i]=="":#如果為空格字符p=iifs[i]==":":q=it= +int(s[q+1:])returnt(2)統(tǒng)計(jì)本月各類型單車的每天平均騎行時(shí)長,并繪制柱形圖,代碼如下,繪制的圖表如圖b所示,請?jiān)趧澗€處填入合適的代碼。 圖bImportpandasaspdImportmatplotlib.pyplotaspltdf=pd.read_excel("sharedbikes.Xlsx")bike=["哈羅單車","摩拜單車""美團(tuán)單車","青桔單車"]sm=[0]*4avg=[0]*4days=31foriin ①:t=cal(df.At[i,"結(jié)束時(shí)間"])—cal(df.At[i,"開始時(shí)間"])for j in range(4)ifdf.a(chǎn)t[i,"App類型"]==bike[j]:②breakfor i in range(4):avg[i]=sm[i]/daysplt.figure(figsize=(12,4))x=bikey= ③plt.bar(x,y)plt.show()(3)統(tǒng)計(jì)本月各類型單車的騎行次數(shù),下列加框處代碼有錯(cuò),可以改正為 (選填字母)A.max()/B.min()/C.mean()/D.count())/n=dr.groupby("App類型",asindex=True),用戶編號(hào).16.某校高三年級(jí)開展體質(zhì)健康測試,數(shù)據(jù)存儲(chǔ)在Excel文件中,部分?jǐn)?shù)據(jù)如圖a所示。圖a請回答下列問題:(1)定義finenum函數(shù),功能為:讀取各班級(jí)的總分等級(jí),返回等級(jí)為“優(yōu)秀”的個(gè)數(shù)。函數(shù)代碼如下,劃線處應(yīng)填入的代碼為 (單選,填字母)。A.df.總分等級(jí)="優(yōu)秀"B.df[df.總分等級(jí)=="優(yōu)秀"]C.df[df[總分等級(jí)]="優(yōu)秀"]D.pd[pd.總分等級(jí)=="優(yōu)秀"]import pandas as pddef finenum(df): df1= return dfl.groupby("班級(jí)編號(hào)").count()(2)將數(shù)據(jù)整理后存儲(chǔ)在“health.xls”文件中,編寫Python程序,統(tǒng)計(jì)各班體測優(yōu)秀率,并繪制圖表,如圖b所示。圖b部分Python程序如下,請?jiān)趧澗€處填入合適的代碼。import matplotlib.pyplot as pltdf=pd.read _excel("health.xls")data=finenum(df)y=[0]*16classnum=[33,37,35,34,37,47,44,35,32,33,45,41,46,38,43,45]#各班級(jí)人數(shù)i=0while ① : y[i]=② i=i+1x= ③plt.plot(x,y,color="c")#設(shè)置繪圖參數(shù),顯示如圖b所示線形圖,代碼略(3)若該校要表彰體測優(yōu)秀率最高的班級(jí)為“體能之班”,由圖b可知,需要表彰的班級(jí)是 班。17.某城市引入內(nèi)澇預(yù)警系統(tǒng),實(shí)時(shí)監(jiān)測河道水位和地道橋的積水情況,并根據(jù)設(shè)定的閾值自動(dòng)觸發(fā)調(diào)節(jié)系統(tǒng)和報(bào)警裝置,該系統(tǒng)的結(jié)構(gòu)示意圖如圖a所示。Web服務(wù)器端程序采用Flask Web框架開發(fā)。請回答下列問題:圖a(1)圖a中①②處表示的硬件設(shè)備名稱分別是 (單選,填字母)。A.傳感器、傳感器 B.執(zhí)行器、傳感器 C.傳感器、執(zhí)行器(2)在設(shè)計(jì)“城市內(nèi)澇預(yù)警系統(tǒng)”的過程中,需要進(jìn)行輸入設(shè)計(jì)、輸出設(shè)計(jì)和人機(jī)界面設(shè)計(jì)等,這一過程屬于 單選,填字母)。A.需求分析 B.可行性分析 C.概要設(shè)計(jì) D.詳細(xì)設(shè)計(jì)(3)該系統(tǒng)網(wǎng)絡(luò)應(yīng)用軟件的實(shí)現(xiàn)架構(gòu)是 (選填,填字母:A.B/S架構(gòu)/B.C/S架構(gòu))。(4)若某監(jiān)測點(diǎn)的積水高度超過50厘米時(shí),系統(tǒng)將發(fā)布一級(jí)內(nèi)澇預(yù)警。負(fù)責(zé)人想了解昨天各監(jiān)測點(diǎn)的平均積水高度,以及各監(jiān)測點(diǎn)發(fā)布一級(jí)內(nèi)澇預(yù)警的次數(shù)。于是管理員將昨天的監(jiān)測數(shù)據(jù)導(dǎo)出為文件“監(jiān)測點(diǎn)積水?dāng)?shù)據(jù).xlsx”,數(shù)據(jù)格式如圖b所示,并制作圖表(如圖c所示),部分程序代碼如下,請?jiān)趧澗€處填入合適的代碼。圖b圖cdf=pd. read_excel("監(jiān)測點(diǎn)積水?dāng)?shù)據(jù)xlsx")waterline_ avg=df. #計(jì)算各監(jiān)測點(diǎn)的平均積水高度print (waterline_ avg)x=df. colunns[1:] #取出列標(biāo)題y=[]for i in x:df1=df[ ]counts=len (df1)y. append (counts) #添加到列表plt. bar(x, y, labe1="一級(jí)預(yù)警次數(shù)") #繪制柱形圖#設(shè)置圖形參數(shù)并顯示圖形,代碼略18.游老師統(tǒng)計(jì)了 2013 年至 2021 年每年專科、本科、碩士和博士的畢業(yè)人數(shù) (單位:萬人) ,數(shù) 據(jù)保存在“Graduate.csv”中,如圖a所示。圖a(1) 統(tǒng)計(jì)每年的畢業(yè)總?cè)藬?shù)并繪制柱狀圖,請?jiān)趧澗€處填寫合適的代碼。import pandas as pdimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['simhei']df=pd.read_csv("Graduate.csv")df.共計(jì)= ①x=df["年份"]y= ②plt.bar(x,y)#設(shè)置繪圖參數(shù),繪制線型圖,代碼略(2) 游老師編寫如下代碼用來統(tǒng)計(jì)畢業(yè)人數(shù)增長率最高的年份,增長率相同的年份同時(shí)輸出。 請?jiān)趧澗€處填寫合適的代碼。輸出結(jié)果如圖 b 所示圖b注:2014 年增長率= (2014 年畢業(yè)人數(shù)-2013 年畢業(yè)人數(shù)) /2013 年畢業(yè)人數(shù)data=df["共計(jì)"].values.tolist() #將每年畢業(yè)總?cè)藬?shù)數(shù)據(jù)轉(zhuǎn)換成列表year=["2014 年","2015 年","2016 年","2017 年","2018 年","2019 年","2020 年","2021 年"]rate=[];imax=[0]for i in range( 1,len(data)):rate.append(round( ① ,4))for i in range(len(rate)): print(year[i],"增長率為:",rate[i])for i in range( 1,len(rate)): if ② : imax=[i] elif rate[imax[0]]==rate[i]: imax.append(i)print("畢業(yè)人數(shù)增長率最高的年份是:",end="")for i in range(len(imax)): print( ③ )四、填空題19.動(dòng)態(tài)熱力圖一般用于數(shù)據(jù)關(guān)系分析中 的可視化呈現(xiàn)。20.通過報(bào)告不僅是把數(shù)據(jù)分析的起因、過程、結(jié)果及建議完整的展現(xiàn)出來,更為決策者提供科學(xué)、嚴(yán)謹(jǐn)?shù)臎Q策依據(jù)。 ( )21.大數(shù)據(jù)是以 大、 多、 快、 高為主要特征的數(shù)據(jù)集合,它正快速發(fā)展為對數(shù)量巨大、來源分散、格式多樣的數(shù)據(jù)進(jìn)行 、 和 ,從中發(fā)現(xiàn)新知識(shí),創(chuàng)造新價(jià)值、提升新能力的新一代信息技術(shù)和服務(wù)業(yè)態(tài)。22.?dāng)?shù)據(jù)分析報(bào)告是項(xiàng)目 的展示,也是數(shù)據(jù)分析結(jié)論的有效承載形式。在數(shù)據(jù)分析報(bào)告中,首先需要明確數(shù)據(jù)分析的 ,闡述目前 及通過分析希望解決的問題;其次需要描述數(shù)據(jù)來源和數(shù)據(jù)分析的 、 和 ;最后需要重點(diǎn)呈現(xiàn)數(shù)據(jù)分析的 、 和 。23.以圖形、圖像和動(dòng)畫等方式更加直觀生動(dòng)地呈現(xiàn)數(shù)據(jù)及數(shù)據(jù)分析結(jié)果,揭示數(shù)據(jù)之間的關(guān)系、趨勢和規(guī)律等的表達(dá)方式稱為 表達(dá)。五、判斷題24.?dāng)?shù)據(jù)分析一般包括特征探索、關(guān)聯(lián)分析、聚類與分類、建立模型和模型評(píng)價(jià)等。( )25.?dāng)?shù)據(jù)分析方法只有對比分析法和平均分析法兩種。( )26.張三想要調(diào)查“中學(xué)生課外閱讀傾向”,可以采用騰訊在線文檔對數(shù)據(jù)進(jìn)行統(tǒng)計(jì)與分析。( )27.?dāng)?shù)據(jù)分析的目的是提取有用信息,并形成結(jié)論或觀點(diǎn),從而指導(dǎo)決策。( )28.可以用于分析數(shù)據(jù)趨勢的可視化呈現(xiàn)類型包括折線圖、分組柱形圖、堆疊柱形圖和柱線混合圖等。( )參考答案:1.D2.C3.A4.C5.C6.A7.A8.A9.A10.A11.C12.B13.C14.(1)我認(rèn)為表格中的數(shù)據(jù)比較可靠,因?yàn)閿?shù)據(jù)來源于官網(wǎng)。(2)此程序繪制出了折線圖,此類圖表的優(yōu)勢是易看出變化趨勢。(3)對比分析法,選擇這種分析方法理由闡述清即可。15.int(s[p+1:q])*60 df.index或range(len(df)) sm[j]+=t avg D16.B i<16 data.總分[i+1]/classnum[i]或data["總分"][i+1]/classnum[i]或其它等價(jià)答案 [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16] 517.B D A mean( ) df[i]>5018.df["專科"]+df["本科"]+df["碩士"]+df["博士"] 或 df.專科+df.本科+df.碩士+df.博士 df["共計(jì)"] 或 df.共計(jì) (data[i]-data[i-1])/data[i-1] rate[imax[0]]19.空間關(guān)系20.對21.容量 類型 存取速度 應(yīng)用價(jià)值 采集 存儲(chǔ) 關(guān)聯(lián)分析22. 研究結(jié)果 目的和背景 存在的問題 思路 方法 模型 過程 結(jié)論 建議23.?dāng)?shù)據(jù)可視化24.正確25.錯(cuò)誤26.正確27.正確28.正確 展開更多...... 收起↑ 資源預(yù)覽 縮略圖、資源來源于二一教育資源庫