資源簡介 數(shù)據(jù)處理與應(yīng)用大單元——pandas+matplotlib提升練習(xí)班級 姓名1.【202208浙名協(xié)】(1) AD (2 分)(2) ①sum() (1 分)②g.index (1 分)③技術(shù)人數(shù) (1 分)④df1.班級[0:3] 或 df1["班級"] [0:3] (1 分)2.【202208A9浙協(xié)作】①read_excel (2分)②plt.bar(df2.index,df2.學(xué)考等第) (2分)③plt.title (2分)3.【202208山水聯(lián)盟】①df.at[0,"銷售人員"]="畢春艷" 或 df["銷售人員"][0]="畢春艷"或df.銷售人員[0]="畢春艷"或等同答案 1分②df.groupby("商品名稱")[["銷售數(shù)量","利潤"]].sum() 或等同答案 1分df.groupby("商品名稱")["銷售數(shù)量","利潤"].sum() 會出警告,也給1分③df1.sort_values("利潤",ascending=False).head(3) 或等同答案 1分④df2[(df2["銷售數(shù)量"]>25) | (df2["銷售數(shù)量"]<10)] 或等同答案 2分⑤df2["銷售人員"] 或 df2.銷售人員 或等同答案 1分4.【202209七彩陽光】①at[19,'92 號汽油'] (2 分)(寫出at[]包括[]得1分,寫at(19,'92 號汽油')得1分,完全寫對得2分。注意:答案中的單引號可以使用雙引號也可以使用三個單引號即'''92 號汽油''', 沒有引號不算完全寫對,下同。)②drop('優(yōu)惠',axis=1)或drop(columns='優(yōu)惠') (2 分)(寫出drop()包括()得1分,完全 寫對得2分)③df[df['0 號柴油']<=8.4] (2 分)(寫出 df['0 號柴油']<=8.4 得 1 分,完全寫對得 2 分)④groupby('地域') (2 分) (寫出 groupby()包括()得 1 分,完全寫對得 2分)數(shù)據(jù)處理與應(yīng)用大單元——pandas+matplotlib提升練習(xí)班級 姓名1.【202208浙名協(xié)】大力老師收集了學(xué)校高三年級7選3選課數(shù)據(jù),存儲在“選課情況.xlsx”中,其數(shù)據(jù)格式如圖所示,學(xué)科列下的“1”表示相應(yīng)行的學(xué)生選了該學(xué)科,“0”表示未選。(1)大力老師收集的數(shù)據(jù)存在一些問題,需要進(jìn)行數(shù)據(jù)整理,下列說法合理的是( )(多選)A.數(shù)據(jù)集中格式不一致的數(shù)據(jù),需要進(jìn)行格式轉(zhuǎn)換B.數(shù)據(jù)集中的異常數(shù)據(jù)應(yīng)該直接刪除或忽略C.數(shù)據(jù)集中的缺失的數(shù)據(jù)可以用任意值填充D.數(shù)據(jù)集中的重復(fù)數(shù)據(jù)須在審核的基礎(chǔ)上進(jìn)行合并或刪除(2)為實現(xiàn)統(tǒng)計各班技術(shù)選考人數(shù),并找出技術(shù)選考人數(shù)最多的3個班級,大力老師通過Python編程進(jìn)行數(shù)據(jù)處理,并以圖表的形式呈現(xiàn)結(jié)果。實現(xiàn)上述功能的Python程序如下,請在劃線處填入合適的代碼。import pandas as pdimport matplotlib.pyplot as pltplt.rcParams["font.sans-serif"]=["SimHei"] #中文顯示df=pd.read_excel("選課情況.xlsx")g=df.groupby("班級",as_index=True).技術(shù).①df1=pd.DataFrame({"班級":② ,"技術(shù)人數(shù)":g.values})df1=df1.sort_values("③ ",ascending = False)x=④y=df1.技術(shù)人數(shù)[0:3]plt.bar(x,y,lable="選技術(shù)人數(shù)")plt.title("技術(shù)選科人數(shù)最多的三個班級")plt.xlabel("班級")plt.ylabel("人數(shù)")plt.legend()plt.ylim(40,50)plt.show()2.【202208A9浙協(xié)作】我校 2020 級學(xué)生高二技術(shù)學(xué)考模擬考成績存儲在文件“學(xué)考模擬.xlsx”中,部分成績?nèi)缦?圖所示。小陳利用 Python 編程統(tǒng)計出各班技術(shù)A等人數(shù),并使用圖表呈現(xiàn)統(tǒng)計結(jié)果,如下2圖所示。實現(xiàn)上述功能的 Python 程序代碼如下,請在劃線處填入合適的代碼。import pandas as pdimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei'] #用來正常顯示中文標(biāo)簽df=pd.① ("學(xué)考模擬.xlsx")df1=df[df.學(xué)考等第=='A']df2=df1.groupby("班級",as_index=True).count()② #繪制圖表for a,b in zip(df2.index, df2.學(xué)考等第): #添加圖表數(shù)字標(biāo)簽plt.text(a, b+0.1, '%.0f' % b)③ ("各班技術(shù)A等人數(shù)") #設(shè)置圖表標(biāo)題plt.show()3.【202208山水聯(lián)盟】某商場開業(yè)不久,老板為研判商場運營情況,調(diào)取了最近一個月的商品銷售情況,如下表如示。老板想知道哪些商品賣的多,哪些商品產(chǎn)生的利潤多,同時為表彰先進(jìn),需統(tǒng)計每個員工銷售商品數(shù)量,并做成圖表,現(xiàn)老板高薪聘請你為運營總監(jiān),要求你設(shè)計python程序,完成上述功能。import pandas as pdimport matplotlib.pyplot as pltpd.set_option('display.unicode.ambiguous_as_wide',True) #處理列數(shù)據(jù)無法對齊的情況pd.set_option('display.unicode.east_asian_width',True)plt.rcParams['font.sans-serif'] = 'simhei' #圖表顯示中文字體df=pd.read_csv("sale.csv",encoding="gbk") #導(dǎo)入待處理 CSV 文件① #修改第 1 行顯示器的銷售人員為“畢春艷df["利潤"]=(df["單品售價"]-df["單品進(jìn)價"])*df["銷售數(shù)量"] #計算出每一筆業(yè)業(yè)務(wù)利潤的情況df1=② #按"商品名稱"統(tǒng)計本月"銷售數(shù)量","利潤"的總和print(③ ) #篩選出本月賺錢較多的前3種商品#同理,統(tǒng)計同種商品的月銷量,代碼略#統(tǒng)計本月每一位銷售人員的商品銷售數(shù)量df2=df.groupby("銷售人員",as_index=False)["銷售數(shù)量"].sum()print(④ ) #篩選出本月銷售數(shù)量>25 或銷售數(shù)量<10 的銷售人員x=⑤ ; y=df2["銷售數(shù)量"] #以垂直柱形圖的形式統(tǒng)計顯示所有銷售員的業(yè)績plt.figure(figsize=(8,4))plt.title("商場運營情況分析")plt.bar(x,y,label="銷售人員業(yè)績圖",color="r")plt.legend( )plt.show()4.【202209七彩陽光】小林收集了各地區(qū)的油價存于文件“數(shù)據(jù).xls” 中(如下1圖所示),他對數(shù)據(jù)進(jìn)行了如下操作:Ⅰ.將文件“數(shù)據(jù).xls”中的數(shù)據(jù)讀入對象df中;將數(shù)據(jù)中的“八.八”修改為8.8;Ⅱ.刪除對象“df”中的“優(yōu)惠”列,并將對象“df”進(jìn)行更新;Ⅲ.添加“平均油價”列,再進(jìn)行相關(guān)計算;將對象“df”中數(shù)據(jù)按地區(qū)降序排序;Ⅳ.篩選出對象“df”中數(shù)據(jù)“0 號柴油”不大于 8.4 元的數(shù)據(jù)行,保存到對象“d5”中;Ⅴ.統(tǒng)計對象“d5”中的各個地域的地區(qū)個數(shù),并繪制圖表,如下2圖所示。請在劃線①②③④處填入合適的代碼。import pandas as pdimport matplotlib.pyplot as pltplt.rc('font',**{'family':'SimHei'})df = pd.read_excel('數(shù)據(jù).xls')df.① =8.8df = df.②df['平均油價']=(df['92 號汽油']+df['95 號汽油']+df['0 號柴油'])/3df=df.sort_values('地區(qū)',ascending=False)d5=③g=d5.④ ['地區(qū)'].count()plt.bar(g.index,g.values)plt.title("地域分布圖")plt.show() 展開更多...... 收起↑ 資源列表 浙教版新教材(2019)《數(shù)據(jù)與計算》選考一輪復(fù)習(xí) 學(xué)考復(fù)習(xí)配套練習(xí)——pandas+matplotlib模塊數(shù)據(jù)處理與應(yīng)用提升練習(xí).docx 浙教版新教材(2019)《數(shù)據(jù)與計算》選考一輪復(fù)習(xí) 學(xué)考復(fù)習(xí)配套練習(xí)——pandas+matplotlib模塊數(shù)據(jù)處理與應(yīng)用提升練習(xí)答案.docx 縮略圖、資源來源于二一教育資源庫