資源簡介 第3章 數據處理與應用 單元卷一、選擇題1.為了保證計算機系統中的數據安全,下列操作不可取的是( )A.數據定期備份 B.建立磁盤陣列 C.建立容災系統 D.格式化硬盤2.全班同學將填寫好的睡眠情況調查問卷交給小明同學。小明同學將數據錄入Excel后,下一步要做的工作是( )A.收集數據 B.確定數據需求C.分析數據 D.撰寫分析報告3.數據分類說法正確的是( )A.對數據進行預處理,發現和處理缺失值,異常數據、繪制直方圖,觀察數據分布的特征,求最大值、最小值、極差等描述性統計量。B.分析發現存在于大量數據之間的關聯性和相關性,從而描述一個事物的共同規律和模式。C.是一種探索性的分析。不必事先給出一個分類標準,而是讓其自動分類。D.是數據分析中最基本的方法。先基于樣本數據構建分類器,然后進行預測。4.從信息安全角度看,以下選項中比較適合作為密碼的是( )A.12345678 B.PASWORD C.PX965M#H D.aaaaaaaa5.一般情況下,下列相同長度的密碼中安全級別最高的是( )A.大小寫字母+數字+特殊符號 B.姓名縮寫+生日C.英語單詞+數字 D.姓名縮寫+手機號碼6.學校組織一次社會實踐活動,參觀當地的“敬老院”,要求同學們自己帶相關設備,將實踐的所見、所聞、所想形成一個報告,進行一次比賽,請選擇你認為應該帶的設備是( )。A.掃描儀、照相機、攝像機、計算機B.照相機、攝像機、打印機、錄音設備C.掃描儀、照相機、攝像機、計算機D.照相機、攝像機、錄音設備7.全班同學將填寫好的睡眠情況調查問卷交給小明同學。小明同學將數據錄入Excel,數據的收集方式是( )A.紙質問卷調查 B.實地考察C.面對面訪談 D.網絡收集8.半結構化數據包括( )A.Excel表格B.銀行賬戶上的消費記錄C.檢查身體后得到的體檢報告D.HTML文檔9.下面幾種采集信息的過程中,依次需要用到的工具是( )。①自然界的景象轉化成數字圖片輸入到計算機;②書本中的插圖轉化成數字圖片輸入到計算機;③制作配樂詩朗誦,把朗誦的聲音保存到電腦;A.數碼相機 繪圖儀 耳機 B.數碼攝像機 掃描儀 耳機C.數碼相機 繪圖儀 麥克風 D.數碼相機 掃描儀 麥克風10.下列選項中,不是數據保護方法的是( )A.數據壓縮 B.數據備份C.數據加密 D.安裝殺毒軟件和防火墻11.下列關于詞云說法錯誤的是( )。A.詞云是目前常用的關鍵詞可視化形式B.用詞云可視化文本數據可以幫助人們快速地了解文本的內容和特征信息C.詞云通常使用字體的大小和顏色表示關鍵詞的重要程度或出現頻次D.在詞云中,字越大表示該關鍵詞使用頻率就越低12.設置一個安全性高的密碼是防止個人信息泄露的重要手段。下列設置密碼的方式中安全性最高的是( )。A.使用字母、數字和符號的組合 B.使用自己的手機號碼C.使用自己的生日 D.使用自己姓名的漢語拼音13.下列選項中,可用來采集互聯網數據的工具是( )A.網絡爬蟲 B.電子表格軟件 C.Wi-Fi監控攝像頭 D.思維導圖工具14.圖為某一時期全國各省份的國民生產總值(GDP)累計值統計圖(來源于國家統計局網站),左下角的不同顏色代表著不同等級的數值區間。這樣的數據可視化表達形式為( )A.詞云圖 B.餅圖 C.柱狀圖 D.數據地圖15.因疫情防控需要,學校要求學生家長及時上報體溫、行程等數據,匯總后上報上級防控部門,采集上述數據最為高效的方法是( )A.填寫在線收集表 B.填寫紙質表格C.發送電子郵件 D.打電話上報二、填空題16.常見的數據計算有數值數據、 、日期/時間數據、邏輯數據。17.為了更好地了解某地的水質情況,科研人員采集了該地各監測點當天的水質數據。數據中包含了各監測點的水質類別、水溫(℃)、pH、溶解氧(mg/L)、高錳酸鹽指數(mg/L)。通過數字化學習,小申了解到水質類別從高到低分為1-5類,級別最高(質量最好)為1,級別最低(質量最差)為5。小申把整理后的數據存儲于“T4_2.csv”文件中。如圖所示,他寫程序對這些數據進行分析,在水質類別為3的記錄中,找出水溫的最大值。請將程序填寫完整,可以點擊圖標進入開發環境,數據文件與程序位于同一文件夾目錄,本題提供的環境僅用作算法驗證。import pandas as pd import numpy as np df=pd.read_csv('T4_2.csv',encoding='ANSI') mydf=df[(____① ==3)] temp=np.max(mydf['水溫']) print(temp)18.詞云是對文本數據進行分析處理后的可視化形式。某同學采集微信好友簽名制作了如圖所示的詞云。觀察詞云圖,分析并寫出至少三個出現頻率較高的詞語 。19.為了更好地了解某地的水質情況,科研人員采集了該地各監測點當天的水質數據。數據中包含了各監測點的水質類別、水溫(℃)、pH、溶解氧(mg/L)、高錳酸鹽指數(mg/L)。通過數字化學習,小申了解到水質類別從高到低分為1-5類,級別最高(質量最好)為1,級別最低(質量最差)為5。小申了解到水溫、pH、溶解氧、高錳酸鹽等指標都會影響水質類別,他選擇了溶解氧進行重點分析。分析如圖所示的“各監測點水質類別和溶解氧分布”可視化圖形,說出溶解氧指數最高的監測點的水質類別為 。請學習數字化資源中的“地表水環境質量標準”,嘗試歸納水質類別和溶解氧之間的相關關系 。20.圖結構中的每個頂點( )與其他頂點有邊相連,數據元素之間是( )的關系。三、判斷題21.數據以文件或數據庫的形式永久存儲在外存儲器中。( )22.數據可視化是指以圖形、圖像和動畫等方式更加直觀生動地呈現數據及數據分析結果,揭示數據之間的關系、趨勢和規律等。( )23.為確保數據安全,可定期將數據從D:盤備份到E:盤。( )24.舞蹈《唐宮夜宴》由鄭州歌舞劇院舞蹈編導陳琳創作,14名女舞蹈演員,用婀娜多姿、秀逸韻致的舞姿將大唐盛世的傳統文化形象完美的呈現在舞臺上,讓觀眾在欣賞“鬢云欲度香腮雪,衣香袂影是盛唐”的別樣豐腴身韻審美風姿的同時,感受中華厚重的歷史和文化。其精致詼諧的舞蹈編排、雍容大氣的高科技特效,乃至于圓潤討喜的“唐宮少女”形象,均獲得了文化學者、文博愛好者以及舞蹈觀眾們的好評。結合材料,完成判斷。在尋找創作《唐宮夜宴》素材的過程中,陳琳游覽河南博物院并被唐樂舞俑所吸引,并使用數碼照相機拍攝以便隨時觀看研究,數碼照相機屬于信息加工工具。( )25.為了保證數據的安全,可能的做法是把數據上傳到騰訊云。( )四、操作題26.李老師收集了高三年級某次考試語數外成績,并保存在scores.xlsx中,數據表如圖a所示:李老師用Python編寫了一個程序,對數據進行分析處理,輸出總分大于等于260分的學生信息,并直觀顯示英語前三名的分數情況,生成了如圖b所示的圖表。Python程序代碼如下,請在劃線處填上合適的代碼:import pandas as pdimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei'] #使圖形中的中文編碼正常顯示df=pd.read_excel("scores. xlsx" )df["總分"] = # 計算總分列數據#下行代碼:輸出總分大于等于260分的學生信息print( df [ ] )g=df.groupby("班級",as_index=False)print(g.英語.mean())df1=df.sort_values("英語”, )plt.title("英語成績前三名分數情況")x=df1[0:3].姓名y=df1[0:3].英語plt.bar(x,y)plt.legend()plt.27.小鄭在網上搜集整理出了“足球世界杯歷史進球前50名”的數據,存儲在文件“進球.xlsx”中,部分界面如圖a所示。圖a小鄭利用Python對該數據進行如下分析:(1)統計出各個國家(地區)的進球總數,輸出進球總數最多的前5名,如圖b 所示。具體程序如下,劃線處應填入的代碼是 (單選,填字母)。A.①count②ascending=FalseB.①sum()②ascending=FalseC.①count()②ascending=FalseD.①sum()②ascending=Trueimport pandas as pddfl=pd.read_excel("進球.xlsx")df2=dfl.groupby(" 國 家 ( 地 區 ) " ,as_index=False).① df2=df2.drop("出場次數",axis=1)df3=df2.sort_values("進球個數",② ).head(5)print(df3)圖b(2)統計各國家(地區)的球員人數,計算球員人數最多的國家(地區)的球員的場均進球并繪制柱形圖,如圖c所示。部分Pythom程序如下,請在劃線處填入合適的代碼。import matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei']country={}for i in dfl["國家(地區)"] : =統計各國家(地區)的球員人數 if i not in country country[i]=1 else:①cmax=0country_max=[ ]for i in country: #計算球員人數最多的國家(地區)及對應人數 if country[i]>cmax cmax=country[i] country_max=idf4=dfl[dfl["國家(地區)]==country_max]df4=df4.reset_index(drop=True)#重置索引cijq=[]for i in range(② ): #計算“場均進球”js=df4[”進球個數”][i]/df4[”出場次數”"][i]js=round(js,2)cijq.append(js)③ =cijq #增加“場均進球”列plt.barh(df4[”姓名”],df4["場均進球"],label="場均進球")plt.xlim(0.1.2)plt.legend()plt.show()圖c(3)由圖c可知,球員人數最多的國家(地區)的球員的場均進球超過0.6的球員共 位。五、簡答題28.智能手環能夠實時記錄用戶的運動數據和生理數據,其實,智能手環還包含了用戶更多的隱私數據,如行蹤等,那么請你說一說應該如何保護這些數據?29.結合現實生活中的體驗,談一下數據分析的意義。30.以下數據為1945年—2015年間登陸我國的臺風數據記錄。按數據流計算,嘗試使用數據分析的方法,建立模型推測下一次臺風登陸我國的地點及時間,并闡述你的理由。圖1圖2圖331.改革開放以來,中國經濟發展取得令人矚目的成就,但是中國各省發展差異大。如歷年各省的國內生產總值(GDP)和人口數據,我們可以發現經濟發展和人口數據的變化規律。請采集有關數據,并進行數據分析,通過數據分析發現數據中的一些規律。參考答案1.D2.C3.D4.C5.A6.D7.A8.D9.D10.A11.D12.A13.A14.D15.A16.文本數據17.df["水質類別"]18.祖國 努力 愛 富強 分享等19.1 溶解氧越高,水質類別質量越好。20.都可以 多對多21.正確22.正確23.錯誤24.錯誤25.√26.df["語文"]+ df["數學"]+ df["英語"] df.總分>=260 ascending=False show()27.B country[i]+=1 或country[i]=country[i]+1cmax df4.loc[:,"場均進球"] 528.從信息安全意識和相關設置等方面考慮,答案不唯一。29.結合現實生活中的體驗,數據分析的意義有:比如可以分析的自己的購物行為習慣,學習習慣,時間管理等。30.下一次臺風登陸我國的廣東,2016年7月上旬(根據出現頻率的推斷)31.根據歷年各省的國內生產總值(GDP)和人口數據,采用關聯分析法推得隨著時間的增長,經濟和人口成正比增長,但經濟增長較快,人口增長緩慢。 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫