資源簡介 綜合測試卷-2023—2024學年浙教版(2019)高中信息技術選修3一、選擇題1.需求分析中,開發人員要從用戶那里解決最重要的問題是( )A.讓軟件做什么 B.軟件能存儲多少信息C.軟件的工作效率如何 D.讓軟件具有何種結構2.網格員準備做一份關于社區老齡化的數據分析報告。下列說法正確的是( )。A.該報告要有社區老齡化數據分析的結論與建議B.老齡化數據分析的目的與背景在報告中可以忽略C.報告中數據來源、質量可以不用說明D.報告中關于數據分析的思路與方法可以略寫或不寫3.針對某路公交車高峰擁擠時段情況數據分析時,下列選項中相對合適的分析方法是( )。A.縱向平均分析 B.縱向對比分析 C.橫向對比分析 D.橫向平均分析4.不能用于分析邏輯關系的是( )A.散點圖 B.雷達圖 C.折線圖 D.詞云圖5.用某個條件對數據清單進行“自動篩選”后,不符合條件的數據將被( )A.隱藏 B.徹底刪除 C.單獨顯示 D.撤銷6.為了更好地了解某地的水質情況,科研人員采集了該地各監測點當天的水質數據。數據中包含了各監測點的水質類別、水溫(℃)、pH、溶解氧(mg/L)、高錳酸鹽指數(mg/L)。通過數字化學習,小申了解到水質類別從高到低分為1-5類,級別最高(質量最好)為1,級別最低(質量最差)為5。采集的水質數據如表所示,小申使用Python的數據分析核心庫pandas提供的方法進行數據整理。經檢查確認,對于同一監測點出現多條記錄的情況,視為重復記錄,只需保留其中的第一條。若讀取的數據存放在變量df中,以下方法中能夠正確去重的是( )監測點名稱 水質類別 水溫 pH 溶解氧 高錳酸鹽指數監測點 1 4 24.8 7.25 4.77 5.16監測點 2 3 23.6 7.56 5.62 3.54監測點 3 5 24 6.99 2.45 4.75…… …… …… …… …… ……監測點 9 4 25 7.33 4.16 5.84監測點 2 3 23.6 7.56 5.62 3.54監測點 10 3 24.1 7.27 5.18 4.35監測點 11 1 23.3 7.74 7.76 1.86A.df.dropna(axis=1,how='any',inplace=True)B.df.dropna(axis=0,how='any',inplace=False)C.df.drop_duplicates(subset=['監測點名稱'],keep='first',inplace=True)D.df.drop_duplicates(subset=['監測點名稱'],keep='last',inplace=False)7.下列選項中,不能實現網絡備份課件文件的是( )A.從電子郵箱中下載備份課件 B.從 Kugou中下載備份課件C.從手機微信中下載備份課件 D.從百度云盤上下載備份課件8.下列選項中,不屬于數據可視化應用的是( )A.掌上公交 B.抖音 C.百度地圖 D.滴滴打車9.數據可以用表格,也可以用圖表呈現。下列說法中正確的是( )A.圖表來源于表格,所以用表格更好B.圖表一旦生成,便不會隨表格數據的變化而變化C.可以通過修改圖表來改變表格數據內容D.圖形化表示更形象直觀10.小明對卡塔爾世界杯十分感興趣,于是收集相關資料制作了一張有關卡塔爾世界杯的標簽云,如下圖。則下列有關該標簽云的說法中,不正確的是( )A.小明收集的文本資料屬于非結構化數據B.在制作該標簽云的過程中需要進行分詞,但不需要特征提取C.在該標簽云中,詞語“卡塔爾”比“世界杯”的出現頻率高D.該標簽云不需要顯示文本數據中的全部詞語11.下列哪個選項是數字化可視化表達工具。( )A.數碼照相機 B.搜索引擎 C.U盤 D.演示文稿12.“詞云圖”是數據可視化的一種方式。右圖是小曲利用 Python編程對“云南”百度詞條分析形成的詞云圖,下列說法中正確的是( )A.對文本分詞后可直接創建詞云,無須提取特征B.詞云圖必須顯示該數據集中包含的全部詞語C.從詞云圖中可以看出詞語“云南”比“昆明”的出現頻率高D.最能表現該數據集中文本特征的詞是“鐵路”13.2021年5月11日上午,國務院新聞辦公室就第七次全國人口普查數據舉行發布會。新聞媒體在報道該新聞時,運用 信息類型,可顯著增強數據的直觀可視化效果。( )A.聲音 B.文本 C.圖形 D.數字14.下列選項中不是數據可視化形式的是( )A.柱形圖 B.雷達圖 C.散點圖 D.點陣圖15.下列關于數據分析報告作用,不包括( )A.數據分析結果的呈現 B.記錄項目實施各項日志C.數據分析項目的總結 D.為決策者提供決策依據16.關于平均分析法的描述不正確的是( )A.平均指標比總量指標更具有說服力B.平均數是綜合指標,它的特點是將總體內各單位的數量差異具體化,C.利用平均指標對比某些現象在不同歷史時期的變化,更能說明其發展趨勢和規律D.平均分析法是運用計算平均數的方法來反映總體在一定時間、地點條件下某一數量特征的一般水平17.隨著計算機的廣泛應用,涌現出很多數據分析工具,下列不是數據分析工具的是( )A.圖像處理軟件 B.電子表格軟件 C.在線數據分析平臺 D.編程工具18.下圖是對文本數據進行處理生成的“詞云”圖。圖中的詞語顯示有大有小,顯示較大的是因為這個詞( )A.比較重要 B.出現次數較多 C.比較關鍵 D.比較流行19.常用的數據分析方法包括( )A.對比分析法、結構分析法B.平均分析法、結構分析法C.對比分析法、結構分析法、平均分析法D.對比分析法、平均分析法20.題圖為統計局網站公布的中國創新指數變化情況圖表。這種呈現數據的形式稱為( )A.虛擬化形式 B.可視化形式 C.多樣化形式 D.文字化形式二、填空題21.數據備份一般有本機備份和 兩種方式。22.通過報告不僅是把數據分析的起因、過程、結果及建議完整的展現出來,更為決策者提供科學、嚴謹的決策依據。 ( )23.以圖形、圖像和動畫等方式更加直觀生動地呈現數據及數據分析結果,揭示數據之間的關系、趨勢和規律等的表達方式稱為 表達。24.對數據進行分析,首先要根據分析的目標 ,然后選擇恰當的 進行分析, 是否正確,繼而得出相應的結論。25.數據分析是指用恰當的 方法對收集來的數據進行 ,從而得出有意義的結論的技術。三、判斷題26.在數據處理中,除了可以對數值型數據進行分析外,還可以對文本、圖像等數據進行分析。( )27.數據分析的方法主要有對比分析、平均分析。對比分析是指將兩個或兩個以上的數據進行比較,分析它們的差異,來反映總體在一定時間、地點條件下某一數量特征的一般水平。 ( )28.詞云可以使得難以實現結構化的數據文本挖掘成為輕而易舉的事情。( )29.數據分析中采取調查問卷,問題設計越多,得到的信息越多。( )30.數據分析方法只有對比分析法和平均分析法兩種。( )四、操作題31.小明收集了某2所學校的選課情況,對應科目值為1表示選課,為空表示未選。部分文件如圖a所示。圖a為統計分析各個學校的各個科目選課的情況,編寫Python程序。請回答下列問題:(1)數據整理。已知前3列數據均沒有缺失,每個學生選課數量應該為3,小明想要查看是否有學生的選課數量不為3,若有則輸出該學生的學生編號。實現代碼如下,請在劃線處填入合適的代碼。import pandas as pddf1=pd.read_excel("1.xlsx")df2=df1.T #將df1行列轉置后的結果賦值給df2flag=Truefor i in df2.columns:if ① .count()!=6: s=df2.at["學生編號",i] print("編號為",s,"的學生選課科目數量不為3!") ②if flag:print("學生選課科目數量均為3!")(2)若存在學生選課數量不為3的,則該數據存在的數據問題是 (單選,填字母:A.數據重復B.異常數據C.邏輯錯誤)(3)數據計算和可視化。小明將上述數據整理后,計算兩所學校各個科目選課人數占學校總人數的比例,繪制如圖b所示散點圖進行比較,部分Python程序如下,請在劃線處填入合適的代碼。圖bg=dfl.groupby("學校名稱").count()km=["物理","化學","生物","政治","歷史","地理","技術"]zb=[]for i in g.index:for j in g.columns[2:]:a=g.at[i,j]/g.at[i,"姓名"]*100plt.scatter(km,zb,label=i+"各科選課占比")zb=[]plt.title("兩所中學各科目選課占比比較")plt. legend();plt. show()(4)由圖可知選課比例最接近的科目是 (選填:物理/化學/生物/政治/歷史/地理/技術)。32.小明為了研究某地近十年每月的溫差變化,編寫Python程序。以2023年4月為例,該月每天的溫度數據分別保存在以8位日期字符串命名的excel文件中,部分文件如圖a所示,每個文件記錄了一天24小時的溫度數據,如圖b記錄了4月28日的數據。圖a 圖b(1)定義dv函數,功能為:讀取某天的excel文件,返回當天最高溫度與最低溫度的差值。函數代碼如下,劃線處應填入的代碼為 (單選,填字母)。A.df["溫度"].head(1)-df["溫度"].tail(1)B.df["溫度"].(max()-min())C.df["溫度"].max()-df["溫度"].min()D.df["溫度"].(head(1)-tail(1))def dv(dayfile): df=pd.read_excel(dayfile) diff=________ return diff(2)定義find函數,功能為:用字典創建DataFrame對象,并篩選出4月份溫差大于13的日期,輸出結果如圖c所示,請在劃線處填入代碼。圖cdef find(r,t): dic={"日期":r,"溫差":t} dfl=pd.DataFrame(dic) df2= return df2(3)繪制4月份每天的溫差柱形圖,部分Python程序如下,請在劃線處填寫合適的代碼。def tstr(t): if t<10: return'0'+str(t) else: return str(t)td=[];date=[]for i in range(30): dstr=tstr( ① ) dayfile='202304'+dstr+'.xlsx' date.append(dayfile[4:8]) td.append( ② )#設置繪圖參數,代碼略plt.bar(date, ③ )plt.show()print(find(date,td))圖d33.小王通過掃描儀獲取到技術周考的學生信息技術單選題答題信息,記錄了學生每個小題的答題選項,如圖a所示:為了統計分析出每一小題的答題情況,小王編寫了Python 程序,請回答下列問題:(1)分析學生每個小題的 A,B,C,D 選項的占比,代碼如下:import pandas as pd import matplotlib.pyplot as plt plt.rcParams[("font.sans-serif")]= ["KaiTi"] df=pd.read_excel ("ITdata.xlsx") stunum=len(df) for i in range(1,13): print("第"+str(i)+"小題") for k in "ABCD" : t= print(k+":",round(len(t)/stunum*100,2),"%")該程序段運行結果的部分界面如圖b 所示。圖b畫線處填入的代碼為 (單選,填字母)A.df["單選"+str(i)]==k] B.df[df["單選"+str(i)]==k]C.df[["單選"+str(i)]==k] D.df[df["單選"+str(i)]]==k(2)計算出全班學生的各小題得分并統計各小題平均分,繪制出線形圖(如圖c所示),部分Python程序如下,請在劃線處填入合適的代碼。 圖 csans="CBCABCABDABD"qnum=list(df.columns)for i in df.index :#本次單選題的標準答案 for j in range(2,14): if df.at[i,qnum[j]]== : r=2 #回答正確得 2 分 else: r=0#回答不正確得 0 分df.at [i,qnum[j]]=raver= []for j in qnum[2:]: #統計各單選題的平均分 aver.append( )plt. (qnum[2:],aver,label="平均分")plt.legend()plt.show ()(3)由圖b 可知,12 道選擇題中難度最低的是“單選 ”。34.某次考試一共12題,1~10題為單選題,每小題3分,11~12題為非選擇題,每題10分。閱卷后系統導出小題得分存儲在文件xxcj. xlsx中,部分截圖如圖a所示。圖a小明用Python編寫了程序解決如下問題。(1)讀取Excel文件中的數據賦值給df,劃線處的代碼為 (單選,填字母)。A.read_excel B.to_axcel C.read.excel D.read_xlsximport pandas as pddf=pd. ("xxcj.xlsx")(2)分析某小題的每個班級均分情況代碼如下,請在劃線處填入合適的代碼。dfl=df.groupby("班級").dfl=dfl.drop(’考號’,axis=l)#刪除“考號”列(3)將小題均分情況做可視化處理。如輸入“10”,生成如第11題圖b所示的折線圖。加框處代碼有誤,請改正。圖bimport matplotlib. pyplot as pltplt.rcParams[’font.sans-serif’]=[’SimHei’] # 使圖形中的中文正常編碼顯示tno=input("請輸入題號:")plt. plot(,dfl [tno],label="各班級均分")# 繪制年級均分折線圖,代碼略(4)從圖b可以看出,第10題超過年級均分的班級個數是 。35.某網站服務器五月(31天)的后臺訪問記錄保存在log.xlsx文件中,如1圖所示:圖1請回答下列問題:(1)定義oneday函數,功能為:讀取日期為day的訪問記錄,將訪問地區依次保存在列表city中,并返回該列表。函數代碼如下:import pandas as pddf = pd.read_excel ('1og. xlsx')def oneday(day):city = []for i in :if df.at[i"時間戳"][0:2] == day:city. Append(df.at[I, "地區"])return city劃線處代碼為: (單選:A.df.index ()/B.df.index/C. df.values()/ D.df.values)(2)統計該月每天華東五市的訪問數據,并繪制線型圖,部分Python程序如下,請在劃線處填寫合適的代碼。import matplotlib.pyplot as plteastcity=["上海"、"南京","杭州","蘇州","無錫"]x = [i for i in range(1, 32)]y = []t = 0for i in range(1, 32):①if i < 10:day = "0" + daycity = one day(day)for j in city:if j in eastcity: ②y.append(t)t = 0plt.plot( ③ )plt.show()(3)由圖2可知,該網站本月訪問量低于4萬次天數共有 天。圖2參考答案:1.A2.A3.B4.C5.A6.C7.B8.B9.D10.B11.D12.C13.C14.D15.B16.A17.A18.B19.C20.B21.云備份22.對23.數據可視化24. 提出假設 分析方法 驗證假設25. 統計分析 計算、處理26.正確27.錯28.錯誤29.錯誤30.錯誤31. df2[i] flag=False C zb.append(a) 物理32. C df1[df1.溫差>13] 或df1[df1["溫差"]>13] i+1 dv(dayfile) td33. B sans[j-2] df[j].mean() plot 1034. A mean() dfl.index 7 或七 或7個 或七個35. B 或 df. index day = str(i) t+=1 x, y 5 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫