中文字幕精品无码一区二区,成全视频在线播放观看方法,大伊人青草狠狠久久,亚洲一区影音先锋色资源

數據管理與分析 綜合練習2023—2024學年粵教版(2019)高中信息技術選修3

資源下載
  1. 二一教育資源

數據管理與分析 綜合練習2023—2024學年粵教版(2019)高中信息技術選修3

資源簡介

數據管理與分析 綜合練習2023—2024學年粵教版(2019)高中信息技術選修3
一、選擇題
1.數據庫表中,一列稱為一個( )
A.信息 B.數據 C.記錄 D.字段
2.某員工工資表中包含工號、姓名、工資、職稱等字段,查找工資在3000元以上并且職稱為“工程師”的記錄,其邏輯表達式為( )
A.工資>3000 OR 職稱=工程師 B.工資>3000 AND 職稱="工程師"
C.工資>"3000" AND 職稱="工程師" D.工資>3000 AND 職稱=工程師
3.下列關于數據分析報告的表述正確的是( )
A.數據分析要基于可靠的數據源
B.數據分析報告就是數據分析流程工作匯報
C.基于相同的數據一定能得到完全相同的分析結果
D.數據分析報告只宜對大數據進行分析
4.在現代信息系統中,數據庫占有重要的地位,信息系統中的數據往往會保存在數據庫中,Access就是常用的數據庫管理系統之一。下列關于Access數據庫,說法不正確的是( )
A.Access數據庫是一種關系型數據庫
B.Access數據庫的單個數據表中允許創建多個主鍵
C.Access數據庫可以存儲視頻等多媒體數據的超鏈接
D.Access數據庫的擴展名有.mdb和.accdb
5.觀察數據分布特征,統計中位數等,屬于數據分析中的( )
A.特征探索 B.關聯分析 C.聚類分折 D.數據清洗
6.在學校的社團管理系統注冊帳號時,成功提交個人信息后,社團管理系統的數據庫進行的操作是( )
A.新增記錄 B.刪除記錄 C.查詢記錄 D.修改記錄
7.將多個數據進行比較,從而揭示這些數據所代表的事物的發展變化情況和規律的分析方法為( )
A.現狀分析 B.原因分析 C.預測分析 D.對比分析
8.下列不屬于大數據分析的是( )
A.特征探索 B.關聯分析 C.聚類與分類 D.海量分析
9.通常不能用來集成項目研究成果的是( )
A.項目分析報告 B.記事本 C.幻燈片 D.視頻
10.下列關于數據來源的敘述中,不正確的是( )
A.針對具體信息的獲取,直接數據和間接數據一定是相同的
B.按照獲取數據的渠道,可以將數據分為直接數據和間接數據
C.統計調查或科學實驗得到的數據一般稱為直接數據或一手數據
D.查閱資料獲得的數據或他人對原始數據處理過的數據,一般稱為間接數據或二手數據
11.通過訪問國家統計局網站,可以查閱相關數據報告,下列關于撰寫數據分析報告說法不正確的是( )
A.不能采用專業術語,篇幅較長 B.內容客觀,分析準確
C.呈現數據分析的過程、結論和建議 D.引用資料要加注釋
12.關于SQL語言描述正確的是( )
A.SQL語言可以自動實現關系數據庫的規范化 B.SQL語言無法對數據庫對象進行刪除操作
C.SQL語句不可以嵌入到高級語言程序中 D.SQL語言是關系數據庫的標準語言
13.在SQL語言中,更新數據表里的數據使用的命令是( )
A.UPDATE B.DROP C.ALTER D.SELECT
14.以下關于數據管理的說法,正確的是( )
A.數據處理的速度主要取決于計算機硬件設備,軟件技術影響不大
B.使用電子表格Excel是當前最合理的處理數據的方法和技術
C.在計算機中,所有的數據都是非結構化
D.數據安全不僅是保障數據不損壞,也要考慮數據被入侵偷竊的情況
15.下列關于電子郵件的描述中,錯誤的是( )
A.電子郵箱一般具有定時發送、自動回復等功能
B.郵件中的超大附件沒有文件大小的限制
C.為了安全不要使用與用戶名相同的郵箱密碼
D.同一封郵件可以同時發送給多個收件人
16.小張采集了運動會的報名數據錄入到Excel文件,每位同學最多參加兩個項目,部分界面如下圖所示。他先使用Excel軟件整理數據,存儲為“運動會報名.xlsx”文件后,編寫Python程序完成后續處理。小張編寫了如下程序,實現輸出跳高人數最多的3個班級的功能。
import pandas as pd
df=pd.read_excel("運動會報名.xlsx")
g=df.groupby("班級").跳高. ①
df1=pd.DataFrame({"班級":g.index,"跳高人數":g.values})
df2=df1.sort_values("跳高人數", ② )
print(df2. ③ )
劃線處的代碼應填( )
A.①count() ②ascending=False ③tail(3)
B.①sum() ②ascending=True ③head(3)
C.①count() ②ascending=True ③tail(3)
D.①sum() ②ascending=False ③head(3)
17.某中學食堂部署了一套刷臉支付系統,學生在食堂消費并通過刷臉支付后,系統可根據累積的消費數據分析每個學生的口味及最喜愛的菜品,食堂據此來改進服務。為獲取上述分析結果,系統采用的關鍵技術是( )
A.數據挖掘 B.虛擬現實 C.智能代理 D.數據壓縮
18.某學校引進了一個在線智慧教學平臺,經過若干學期的線上教學實踐積累了學習資源、教學互動、學情信息等大量教學數據。為了不斷提高線上教學質量,在線智慧教學平臺可根據當前積累的教學數據,采用( )技術來估計學生的學習效果,并生成綜合的改進方案,完善線上教學方法。( )
A.數據存儲與加密 B.數據索引與排序
C.數據分析與預測 D.數據共享與保護
19.某調查機構準備做一份關于《在校學生視力情況數據分析報告》,下列說法正確的是( )
A.學生視力情況分析的目的與背景在報告中可以忽略
B.該報告中涉及的數據呈現方式必須用圖表
C.該報告報告重點呈現數據分析的過程,可以沒有結論
D.該報告要重點呈現數據分析過程、結論和建議
20.小申將一個月內每天的書籍銷售量繪制了箱形圖,以下可以用于數據分析報告的是( )
A.有兩天的銷售量非常高
B.這個月中銷售量最大的一天,值在[300,400]之間
C.這個月的書籍銷售量中位數在100左右
D.這個月中每天的銷售量差異不大
二、填空題
21.Photoshop是數字圖像處理軟件,其眾多的繪圖工具可以有效地進行圖片編輯工作。請為下列圖標選擇對應的工具名稱(填字母即可)。
A.移動工具 B.裁切工具 C.磁性套索工具 D.文字工具 E.橡皮擦工具 F.油漆桶工具
22.在ACCESS中,如果文本數據的字段大小設置為8,那么該字段最多可以存放( )個漢字。每一行稱為一個( ),每一列稱為一個( )。
23.如下圖所示,小申收集了2000-2018年某地的臺風數據。臺風等級分為5級:熱帶風暴、強熱帶風暴、臺風、強臺風、超強臺風,分別對應表中的A級、B級、C級、D級、E級。
year A級 B級 C級 D級 E級
2000 6 2 9 3 3
2001 6 1 12 5 2
2002 5 4 4 12 1
2003 2 5 5 6 3
2004 7 3 6 11 2
2004 7 3 6 11 2
2005 3 6 2 9 3
… … … … … …
小申在撰寫數據分析報告時,繪制了“2000-2018年之間臺風總數數量”的箱形圖,請幫助小申進行分析。
24.在數據挖掘中 旨在發現哪些行為或現象總是一起發生。
25.在數據挖掘中通過觀測大量數據后得出規則建立類別模式,將數據根據屬性分門別類加以定義,這種處理問題的類型叫作 。
三、判斷題
26.數據分析的目的是提取有用信息,并形成結論或觀點,從而指導決策。( )
27.(必修)在計算機中,一般將靜態的圖分為圖形和圖像。 ( )
28.對重要數據進行操作,可直接修改原始文件,并及時保存。( )
29.數據分析一般包括特征探索、關聯分析、聚類與分類、建立模型和模型評價等。( )
30.(必修)數據庫管理系統是用來建立、運用和維護數據庫系統的,它隨數據庫系統的不同而不同。( )
四、操作題
31.北斗系統
古有北斗七星辨明方向,今有北斗衛星定位九州。我國自主建設、獨立運行的全球衛星導航系統——北斗衛星導航系統,將為全球用戶提供全天候、全天時、高精度的定位、導航和授時服務。
(1)北斗衛星導航系統是一個龐大的信息系統。作為信息系統,一般具有輸入、 、 、輸出和 等功能。
A、計算 B、決策 C、處理 D、存儲 E、控制 F、規劃
(2)北斗系統具有短信通訊功能,現需傳送120個漢字的訊息(一個漢字需要16位二進制存儲),則存儲這些漢字至少需要 個字節。
(3)使用北斗衛星導航系統的某導航軟件,通過分析多種渠道采集的數據,挖掘出有價值的信息,可為用戶出行提供實時的路況信息和最優路線推薦,這種服務主要采用了( )技術。
A、大數據 B、物聯網 C、云計算 D、語音識別
(4)手機導航是使用( )來獲取用戶位置信息。
A、定位器 B、重力傳感器 C、二維碼 D、超聲波傳感器
(5)在數據處理過程中,需要運用一定的分析方法進行整理分析,挖掘出內在的結構和規律,從而提取有價值的、有意義的數據。對比分析是將兩個或兩個以上的數據進行比較,分析他們的差異,從而揭示這些數據所代表的事物的發展變化情況和規律。聚類分析能夠從樣本數據出發,自動進行數據分類。如圖是某城市公共交通運營里程的分析結果,這是運用了 分析方法。
32.小明下載了本校某次聯考數據“kscj.csv”,每位學生均有6科成績,數據無缺失。采用pandas模塊讀入數據,如圖a所示(注意:本題圖a、b、c中,均僅呈現前6條記錄)。現對本次考試進行數據分析,請閱讀程序,回答下列問題。
圖a
圖b
(1)根據讀入數據,創建格式如圖b所示的DataFrame,各學科和總分列的初值均為“0”。請為 處選擇合適代碼選項(多選,填字母)。
A.df[i]=0 B.df[cName[i]]=0
C.df.insert(i,cName[i],0) D.df.insert(i+3,cName[i],0)
importpandasaspd; importnumpyasnp
dfs=pd.read_csv("kscj.csv", encoding="GBK")
dfs=dfs.sort_values("學號",ascending=True)
df=dfs.drop_duplicates(subset=['學號'],keep="first", ignore_index=True)#學號相同行僅保留首行
df=df.drop(["學科","得分"],axis=1)#刪除“學科”和“得分”列
cName=["語文","數學","英語","物理","化學","生物","政治","歷史","地理","技術","總分"]
df.insert(1,"班級",df["學號"]//100) #參數:第1個列位置索引(0開始編號),第2個列標題,第3個列值
foriinrange(11):#添加各學科列和總分列
______
(2)將dfs中的學科得分轉存到df中對應學科,并計算總分。請為劃線處填寫合適代碼。
for i in df.index:
idx=df.at[i,"學號"]
student= #dfs中篩選出學號為idx的6條相關記錄
for si in student.index:
course=student.at[si,"學科"]
df.at[i,course]=student.at[si,"得分"]
df.at[i,"總分"]=
圖c
圖d
(3)求出各科和總分的班級平均分,如圖c所示。請為 處選擇合適代碼選項(單選,填字母)。
A.groupby("班級",as_index=False).mean()
B.groupby("班級",as_index=True).count()
C.groupby("班級",as_index=False).sum()
df=df.replace(0,np.nan)#np.nan表示空值,df中數據“0”用空值替換
df=df.______
df=df.drop("學號",axis=1)
print(df)
(4)繪制各班總分平均分對比圖,如圖d所示。請為劃線處填寫合適代碼。
importmatplotlib.pyplotasplt
plt.bar(df.班級, )
plt.title("班級總分平均分對比圖")
plt.show()
33.某校高三年級開展體質健康測試,數據存儲在Excel文件中,部分數據如圖a所示。
圖a
請回答下列問題:
(1)定義finenum函數,功能為:讀取各班級的總分等級,返回等級為“優秀”的個數。函數代碼如下,劃線處應填入的代碼為 (單選,填字母)。
A.df.總分等級="優秀"
B.df[df.總分等級=="優秀"]
C.df[df[總分等級]="優秀"]
D.pd[pd.總分等級=="優秀"]
import pandas as pd
def finenum(df):
df1=
return dfl.groupby("班級編號").count()
(2)將數據整理后存儲在“health.xls”文件中,編寫Python程序,統計各班體測優秀率,并繪制圖表,如圖b所示。
圖b
部分Python程序如下,請在劃線處填入合適的代碼。
import matplotlib.pyplot as plt
df=pd.read _excel("health.xls")
data=finenum(df)
y=[0]*16
classnum=[33,37,35,34,37,47,44,35,32,33,45,41,46,38,43,45]#各班級人數
i=0
while ① :
y[i]=②
i=i+1
x= ③
plt.plot(x,y,color="c")
#設置繪圖參數,顯示如圖b所示線形圖,代碼略
(3)若該校要表彰體測優秀率最高的班級為“體能之班”,由圖b可知,需要表彰的班級是 班。
34.為了完善某學校食堂管理、持續提高食堂服務質量,讓全校師生更加精神飽滿地開展工作、學習,對學校食堂進行了一些調查,調查項目共5項(具體內容略)。學校后勤管理謝老師收集了12個班級的調查結果,分別存儲在“dy01.csv”、“dy02.csv”、…、“dy12.csv”等12個文件中(如圖a所示),每個文件部分界面如圖b所示。

圖a 圖b
現需要分析12個班級學生對這5個問題的選“A”情況。謝老師用Python的pandas模塊編寫了以下代碼,實現相關問題的解決。請回答下列問題。
(1)定義了fun_A()函數實現了統計某個班級5個問題的選“A”的人數情況。Python程序代碼如下,請在劃線處填入合適代碼。
import pandas as pd
def fun_A(file):
df=pd. read_csv(file)
A_list=[]
for i in df. columns[1:]:
j=0
c=0
while jif :
c+=1
j+=1
A_list. append(c)
return A_list
(2)調用上述函數,處理12個班級每個問題的選“A”的總人數,Python程序代碼如下,請在劃線處填入合適代碼。
ans_list=[]
s="010203040506070809101112"
for i in range(0, len (s) -1, 2):
filename="dy"+ ① +"~. csv"
res=fun_A(filename)
ans_list. append(res)
x=["問題1","問題2",“問題3","問題4","問題5"]
y=[0,0,0,0,0]
for i in range (5):
s=0 #每個問題選A的人數
for j in range (12):

y[i]=s
(3)經上述處理后,接著以圖的形式匯報結果(如圖c所示),Python程序代碼如下,請回答下列問題。
import matplotlib. py plot as plt
plt. rcParams['font. sans-serif’] =[’SimHei’] #圖表顯示中文字體
plt. title ("每個問題選A的總人數")
plt. legend ()
plt. show()
加框處代碼合適的是 (單選,填字母)
A.plt. bar (x, y) B.plt. bar (x, y, label=’A選項’)
C. plt. plot (x, y) D.plt. plot (x, y, label=’A選項’)
(4)調查數據的有效問卷共550份,從圖c中可以觀察出有 (填數字)個問題的選“A”總人數低于60%。
每個問題選A的總人數
圖c
35.小明收集了某2所學校的選課情況,對應科目值為1表示選課,為空表示未選。部分文件如圖a所示。
圖a
為統計分析各個學校的各個科目選課的情況,編寫Python程序。請回答下列問題:
(1)數據整理。已知前3列數據均沒有缺失,每個學生選課數量應該為3,小明想要查看是否有學生的選課數量不為3,若有則輸出該學生的學生編號。實現代碼如下,請在劃線處填入合適的代碼。
import pandas as pd
df1=pd.read_excel("1.xlsx")
df2=df1.T #將df1行列轉置后的結果賦值給df2
flag=True
for i in df2.columns:
if ① .count()!=6:
s=df2.at["學生編號",i]
print("編號為",s,"的學生選課科目數量不為3!")

if flag:
print("學生選課科目數量均為3!")
(2)若存在學生選課數量不為3的,則該數據存在的數據問題是 (單選,填字母:A.數據重復B.異常數據C.邏輯錯誤)
(3)數據計算和可視化。小明將上述數據整理后,計算兩所學校各個科目選課人數占學校總人數的比例,繪制如圖b所示散點圖進行比較,部分Python程序如下,請在劃線處填入合適的代碼。
圖b
g=dfl.groupby("學校名稱").count()
km=["物理","化學","生物","政治","歷史","地理","技術"]
zb=[]
for i in g.index:
for j in g.columns[2:]:
a=g.at[i,j]/g.at[i,"姓名"]*100
plt.scatter(km,zb,label=i+"各科選課占比")
zb=[]
plt.title("兩所中學各科目選課占比比較")
plt. legend();plt. show()
(4)由圖可知選課比例最接近的科目是 (選填:物理/化學/生物/政治/歷史/地理/技術)。
五、簡答題
36.自新型冠狀病毒變為乙類乙管以來,全國文化和旅游行業在強勁復蘇的基礎上,乘勢而上,跑出發展“加速度”。全國各地持續出臺利好政策,積極推動文化和旅游加速復蘇和深度融合發展。隨著旅游業的復蘇,全國鐵路、航空運輸客運量如表所示。其中,人公里是運輸計算客運量的單位,表示運送旅客人數與運送距離的乘積。(數據來源于國家數據統計局 http://www.stats./)
(億人公里) 2022年10月 2022年11月 2022年12月 2023年1月 2023年2月
鐵路旅客周轉量 436.36 277.25 400.31 1031.29 1107.39
民航旅客周轉量 240.9 200.66 307.85 641.19 697.16
(1)你認為表格中的數據可靠嗎?為什么?
(2)為呈現數據分析的結果,某同學編寫了如下所示代碼。請問此程序繪制出了什么類型的圖表?此類圖表的優勢是什么?
import matplotlib.pyplot as plt x=["22-10","22-11","22-12","23-1","23-2"] y=[240.9,200.66,307.85,641.19,697.16] plt.plot(x,y) plt.show()
(3)常用的數據分析方法有對比分析法、平均分析法和結構分析法。問題(2)中同學的分析使用了何種數據分析方法并闡述選擇該分析方法理由。
參考答案:
1.D
2.B
3.A
4.B
5.A
6.A
7.D
8.D
9.B
10.A
11.A
12.D
13.A
14.D
15.B
16.D
17.A
18.C
19.D
20.BC
21. D F E B C A
22. 4 記錄 字段
23.大部分年份的臺風總數數量處于22.5~25.0,存在異常年份的臺風總數數量小于15.0
24.關聯規則(或相關性分組)
25.決策樹
26.正確
27.正確
28.錯誤
29.正確
30.正確
31. C D E 240 A A 對比
32. BD dfs[dfs["學號"]==idx] df.at[i,"總分"]+ student.at[si,"得分"] A df.總分 或 df["總分"]
33. B i<16 data.總分[i+1]/classnum[i]或data["總分"][i+1]/classnum[i]或其它等價答案 [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16] 5
34. df[i][j]=="A" s[i:i+2] s=s+ans_list[i][j] 或 s+=ans_list[i][j] B 2
35. df2[i] flag=False C zb.append(a) 物理
36.(1)我認為表格中的數據比較可靠,因為數據來源于官網。
(2)此程序繪制出了折線圖,此類圖表的優勢是易看出變化趨勢。
(3)對比分析法,選擇這種分析方法理由闡述清即可。

展開更多......

收起↑

資源預覽

<pre id="tfb94"><li id="tfb94"></li></pre>

<bdo id="tfb94"><rt id="tfb94"></rt></bdo>
  • <menu id="tfb94"><dl id="tfb94"></dl></menu><i id="tfb94"><acronym id="tfb94"><sub id="tfb94"></sub></acronym></i>

    1. 主站蜘蛛池模板: 东丰县| 上思县| 醴陵市| 沧州市| 突泉县| 宁南县| 沂源县| 庆城县| 石柱| 云安县| 邛崃市| 沁阳市| 佛坪县| 上饶县| 永和县| 衡东县| 镇宁| 肃宁县| 社旗县| 南木林县| 赤峰市| 芦山县| 伊宁市| 东丽区| 新乐市| 深州市| 太湖县| 定陶县| 石狮市| 定襄县| 美姑县| 绍兴市| 古田县| 泰安市| 久治县| 乌拉特前旗| 沽源县| 康平县| 朝阳县| 肇庆市| 昭平县|