資源簡介 第三章 數據處理與應用 章節測試一、選擇題1.下列設備中通常不能用于圖像數據采集的是( )A.掃描儀 B.顯示器 C.智能手機 D.數碼相機2.李軍同學在做研究性學習時,想通過問卷調查了解人們垃圾分類的情況,遇到了以下難題,請你幫他完成。請根據以上情境,完成此題。問卷的發放、填寫、回收的過程主要屬于數據處理的什么階段( )A.數據采集 B.數據分析 C.數據呈現 D.數據整理3.數據安全主要的威脅是( )①計算機病毒②黑客攻擊③數據存儲介質損壞④個人失誤⑤數據備份A.①②③④ B.①②③⑤ C.①②④⑤ D.②③④⑤4.利用計算平均數的方法,可以反映總體在一定時間、地點條件下數據特征的數據分析方法是( )A.對比分析法 B.平均分析法 C.交叉分析法 D.總結分析法5.下列關于數據采集的說法,正確的是( )A.傳感器是數據采集必須使用的設備 B.采集的數據必須經過計算機加工才能夠被使用C.掃描二維碼是手機獲取日常所需數據的唯一來源 D.“智能運動手環”可以獲取運動數據6.如果設置某網絡賬號的密碼,以下密碼安全性最高的是( )A.123123 B.abcdef C.qq16888 D.Asd#2GY7.在高一半期考試后,現需分析每個班的平均成績,選用下列哪種分析方法最合適( )A.對比分析 B.平均分析 C.聚類分析 D.案例分析8.為了防止丟失重要數據,應該對其進行( )A.備份 B.殺毒 C.格式化 D.可視化9.某班主任對班級的所有同學考試進行多次對照分析后,找到每位同學的薄弱學科和優勢學科,這樣的分析方法屬于( )A.對比分析法 B.總體分析法 C.平均分析法 D.結構分析法10.小明U盤上存儲的數據因人為失誤不小心徹底刪除了,不能找回。針對這樣的情景,對于重要的數據應該采用什么方式保護數據的安全( )A.數據備份 B.數據加密 C.設置防火墻 D.打開殺毒軟件11.下列哪種分析法不是常用數據分析的基本方法( )A.橫向分析 B.縱向分析 C.平均分析 D.感性分析法12.通常情況下,以下相同長度的密碼哪種安全級別最高( )A.純英文 B.姓名首拼+手機號碼C.姓名全拼+生日 D.大小寫字母+數字+特殊符號13.數據分析廣泛應用于社會各個領域,常見的數據分析方法有對比分析法、平均分析法和結構分析法等,關于對比分析法,以下說法中錯誤的是( )A.對比分析分為橫向和縱向對比兩大類 B.分析事物內部的結構和部分與整體之間的關系C.對比分析法將兩個或兩個以上的數據進行比較 D.對比分析法能夠說明研究對象的規模大小14.數據采集是指人們根據需要獲取數據,以下不能獲取數據的是( )A.問卷調查采集數據 B.利用傳感器采集數據C.調整表格中數據的字體大小 D.通過網絡獲取數據15.數據可視化表達是為了更加直觀形象地呈現數據,下列關于數據可視化表達不合理的是( )A.利用折線圖呈現多次考試成績的變化趨勢B.利用條形圖展示娛樂節目參賽選手的得票情況C.利用雷達圖對比兩個用戶在購買頻率、購買商品種類等5個維度上的差異D.利用餅圖反映游客人數與節假日關系二、填空題16.數據分析方法中, 就是分析并發現存在于大量數據之間的關聯性或者相關性,從而描述一個事物中某些屬性同時出現的規律和模式。17.平均分析就是運用 的方法,來反映總體在一定時間、地點條件下某一數量特征的 。18. 是指將兩個或兩個以上的數據進行比較,分析它們的 ,從而揭示這些數據所代表的事物發展變化 。對比分為 對比和 對比。橫向對比指的是 的事物之間進行比較;縱向對比指的是和 事物的 進行比較。19.數據分析的常用方法有 、 等。20.對數據進行分析,首先要根據分析的目標 ,然后選擇恰當的 進行分析, 是否正確,繼而得出相應的結論。三、判斷題21.在信息社會活動中,數據的價值日益凸顯,因此,養成良好的數據備份習慣,有助于避免因為重要數據丟失而給工作和學習造成損失。( )22.高中生的個人數據泄密或丟失造成的損失和影響很小,可以不必在意數據的保護。( )23.由于學校計算機教室的服務器硬盤損壞,導致學生微電影作品丟失。該案例中的數據安全威脅屬于個人失誤。( )24.在計算機操作系統上安裝殺毒軟件和防火墻是一種數據保護方法。( )25.現在的數據加密技術很成熟,加密后的數據不會泄露。( )四、操作題26.小李利用他所學習的知識幫助老師整理并統計本次考試的成績,成績文件"cj.xlsx"的部分界面如圖a所示:圖a(1)在整理數據時發現一些數據問題,下列說法不正確的是 (單選,填字母)A.“趙正”同學有兩條數據,需要進行數據合并處理B.“徐子言”同學的信息成績51分,屬于異常數據C.對于表格中的缺失數據,通常采用平均值、中間值或概率統計值來填充缺失值。(2)數據整理完畢后,為統計學生“信息”全校排名,選中F2單元格輸入公式,然后利用自動填充完成F2:F201的數據計算,發現結果有誤,請修改F2單元格的計算公式 (提示:RANK函數用于計算某單元格中數據在某區域內的排名,如=RANK(D2,D2:D201),計算D2單元格中數據在D2:D201的排名)(3)為了統計5個班級的平均分以及平均分最高的班級(若有多個班級平均分同時最高,取班級號最小的班級),小李編寫了Python程序,運行界面如圖b所示:圖bPython代碼如下,請在劃線處填入合適的代碼。import pandas as pda=[0,0,0,0,0,0] #用于統計班級總分,下標0不使用b=[0,0,0,0,0,0]#用于統計各班人數,下標0不使用c=[0,0,0,0,0,0]#用于存儲各班平均分,下標0不使用df=pd. ① ("cj.xlsx")for i in range(len(df)): bj=int(df.at[i,"班級"]) a[bj]+=df.at[i,"信息"]+df.at[i,"通用"] b[bj]= ②for i in range(1,len(a)): c[i]=a[i]/b[i] print(i,"班的平均分為:",c[i])maxx=0pos=0for i in range(1,len(a)): if ③ : maxx=c[i] pos=iprint("平均分最高的班級為",pos,"班,平均分為:",maxx)27.為了解學生在食堂和校園超市的消費情況,學校把9月1-4日各個窗口的消費數據導出并保存在“eat.xlsx”文件中,數據格式如圖1所示。如圖2所示,1-14號窗口為食堂一樓,15-28號是食堂二樓,29-34號是校園超市。圖1 圖2 圖3用python讀取該文件并作數據分析后輸出如圖3所示結果,請回答下列問題。(1)讀入數據后,需要將數據集df中的數據按窗口號設置相應的位置信息:#引用pandas及matplotlib,并設置參數,代碼略df = pd.read_excel('eat.xlsx') df['位置']=" #增加'位置'列,初始值為空for i in ①____: if df['窗口'][i] <=14: df['位置'][i] ='食堂一樓' elif ②____: df['位置'][i] ='食堂二樓' else: df['位置'][i] ='校內超市'劃線①處應填寫代碼: (單選,填寫字母:A.df.index /B.df.columns /C.df.values)劃線②處應填寫代碼:(2)完成窗口號設置后,統計各個位置的金額總和,代碼如下:a=['校內超市','食堂一樓','食堂二樓']b = [0,0,0] #存儲各個位置的消費總金額for x in df.values: for i in range(3): if x[5] == a[i]: ①____plt.bar(②____)#輸出如圖3所示圖表plt.show()劃線①處代碼為: ,劃線②處代碼為: 。(3)觀察圖3可知,消費總金額最多的位置是 (單選,填字母)。A.校內超市 B.食堂一樓 C.食堂二樓28.李老師統計了某次考試各班學生的選擇題答題情況(共12個小題,每小題答對記2分,答錯記0分),數據存儲在“score.xlsx”文件中,如圖1所示。為計算每班選擇題平均分(選擇題平均分是指12個小題的平均分之和),同時找出選擇題平均分最高的3個班級,李老師通過Python編程進行數據處理,并以圖表的形式呈現結果。(1)實現上述功能的Python程序如下,請在劃線處填入合適的代碼。import pandas as pdimport matplotlib.pyplot as pltimport numpy as npplt.rcParams['font.sans-serif']=['SimHei'] #顯示中文字符,字體為黑體df=pd.read_excel("① ")pjf=df.groupby("班級",as_index=False).mean()pjf= pjf.drop("考號",axis=1)pjf["選擇題平均分"]= ②y1=pjf.min()["選擇題平均分"]y2=pjf.max()["選擇題平均分"]px=pjf.sort_values("選擇題平均分",ascending=False)print(px)s= px.head(3)plt.figure()plt.bar(s.班級, ③ )plt.title("選擇題平均分最高的3個班級")plt.ylim(y1-0.2,y2+0.2)plt.yticks(np.linspace(y1-0.2,y2+0.2,20)) #設置y坐標軸的刻度plt.show()(2)運行該程序段后,繪制出的圖表如圖2所示,則該圖表的類型是 (填字母:A.線形圖 /B.垂直柱形圖 /C.水平柱形圖 )。參考答案1.B2.A3.A4.B5.D6.D7.B8.A9.A10.A11.D12.D13.B14.C15.D16.關聯分析17.計算平均值 一般水平18.對比分析 差異 情況和規律 橫向 縱向 類似或者同類 相同 不同時期19.對比分析 平均分析20.提出假設 分析方法 驗證假設21.正確22.錯誤23.錯誤24.正確25.錯誤26.B =RANK(D2,$D$2:$D$201) 或 =RANK(D2,D$2:D$201) read_excel b[bj]+1 c[i]>maxx27.A df['窗口'][i] <=28 b[i]+=x[3] 或 b[i]=b[i]+x[3] a,b C28.score.xlsx pjf.sum(axis=1) s.選擇題平均分 或 s["選擇題平均分"] B 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫