資源簡介 (共36張PPT)利用pandas模塊處理數據常用數據處理模塊numpy模塊:科學計算的基礎庫。pandas模塊:處理表格數據的庫。matplotlib模塊:繪圖庫,可快速繪制圖表。導入pandas模塊:import pandas as pdPandas數據結構Series數據結構:一維數據結構,包含一組數據和一個與數據關聯的行索引(index)。索引值默認從0開始遞增。Series數據結構創建Series對象列表創建Series數據結構。import pandas as pds=pd.Series([166,178,180])#創建Series對象時指定行索引import pandas as pds=pd.Series([166,178,180],index=[“s01”,”s02”,”s03”])Series數據結構創建Series對象字典創建Series數據結構。字典的鍵作為行索引import pandas as pda={“s01”:166,”s02”:178,”s03”:180}s=pd.Series(a)Series數據結構常用屬性index:獲取索引values:獲取數據import pandas as pds=pd.Series([166,178,180],index=[“s01”,”s02”,”s03”])for i in s.index:print(i)for j in s.values:print(j)Series數據結構查看和修改Series對象中的數據import pandas as pds=pd.Series([166,178,180],index=[“s01”,”s02”,”s03”])print(s [“s01”]) #輸出行索引為“s01”的值s[“s01”]=170 #修改行索引為“s01” 的值為170s[“s04”]=190 #添加新的數據Pandas數據結構DataFrame數據結構:二維數據結構,由一個行索引、列標題和數據組成的數據結構。行索引默認從0開始01姓名 性別張三 男列標題行索引數據李麗 女DataFrame數據結構創建DataFrame對象通過相等長度的列表創建DataFrame數據結構。行索引默認從0開始import pandas as pddata=[[“張三”, “男”],[“李麗”, “女”]]s=pd.DataFrame(data,columns=[“姓名”,”性別”])01姓名 性別張三 男李麗 女DataFrame數據結構創建DataFrame對象通過相等長度的字典創建DataFrame數據結構。字典的鍵作為列標題,字典的值作為數據import pandas as pddata={“姓名”:[“張三”,”李四”],”性別”:[“男”,”男”]}s=pd.DataFrame(data)DataFrame數據結構讀取文件創建DataFrame數據結構。ExcelPandasDataFrame數據結構創建DataFrame對象讀取二維數據文件創建DataFrame數據結構。import pandas as pddf=pd.read_csv(“2.csv”)常用屬性顯示索引、列標題及值:df.index:行索引DataFrame數據結構常用屬性顯示索引、列標題及值:df.columns:列標題DataFrame數據結構常用屬性顯示索引、列標題及值:df.values:獲取數據DataFrame數據結構常用屬性顯示索引、列標題及值:d.T:行列轉置DataFrame數據結構1、讀取excel文件創建二維數據結構s2、獲取行索引3、獲取列標題4、獲取數據二維數據結構,行索引默認從___開始DataFrame數據結構檢索一列數據:df.列名 df[“列名”]檢索多列數據:df[[“列名”,”列名”,”列名”]]DataFrame數據結構某列數據擴大或縮小c倍:df.列名*c df.列名/c列數據進行計算(不可有空單元格)df.列名+df.列名DataFrame數據結構檢索行數據:df [開始行索引:結束行索引]或df.loc[行索引]DataFrame數據結構篩選滿足條件的若干行數據:df[條件]注:篩選滿足多個條件時用連接符號:且用&,或用|,條件用()df[(df.學校==“一中”)&( df.成績>=99 )]DataFrame數據結構檢索具體某個單元格的數據:①df.at[行索引,"列名"]②df["列名"][行索引] ,df.列名[行索引]5、獲取一列數據,獲取多列數據6、獲取某行數據7、篩選成績大于90的若干行數據8、檢索具體某個單元格的數據DataFrame數據結構一、排序①df. sort_values(“列名”,ascending=True/False,inplace=True/False)排序方式:True升序,False降序不寫默認升序是否修改原數據:True修改,False不修改不寫默認不修改將排序結果重新賦值給變量時不需要修改原數據df1=df. sort_values(“成績”,ascending=False)DataFrame數據結構二、刪除①df. drop(行索引,inplace=True/False)②df.drop(“列名”,axis=1, inplace=True/False)將排序結果重新賦值給變量時不需要修改原數據df1=df.drop(“人數”,axis=1)不寫默認不修改DataFrame數據結構三、分組df.groupby(“列名”,as_index=True/False)是否作為行索引默認是TrueDataFrame數據結構1、按成績列降序排序,賦給df12、刪除成績列,賦給df13、刪除第三行,賦給df14、按班級分組求和,且班級不作為行索引常用函數①插入一列數據:df.insert(列位置,列標題,數據)如df.insert(3,“測試”,data)或df[“新增列名”]=數據②追加函數:df1=df.append({“學校”:”五中”,”分數”:85,人數:“7”},ignore_index=True)DataFrame數據結構常用函數①統計非空數據項df.count() #返回非空數據項的數量DataFrame數據結構②求和、求最大值、求最小值、求平均值df.sum() #求某一列、某些列和df.max() df.min() #返回最大值或最小值df.mean() #求某一列、某些列平均值DataFrame數據結構③ df[“總分”]= df.sum(axis=1)求某行數字的和【全適用】DataFrame數據結構④df[“總分”]=df.成績+df.人數求某行數字的和【單元格有空值不可用】常用函數④找出DataFrame的前/后多少行df.head(2) #前兩行df.tail(2) #后兩行df.head() 參數不寫,默認取前五行DataFrame數據結構4、插入一列數據5、統計非空數據項個數、求平均值6、取前兩行、取后兩行7、按行求和 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫