中文字幕精品无码一区二区,成全视频在线播放观看方法,大伊人青草狠狠久久,亚洲一区影音先锋色资源

4.2.2大數據處理_利用pandas模塊處理數據 課件(共36張PPT) 浙教版高中信息技術必修一

資源下載
  1. 二一教育資源

4.2.2大數據處理_利用pandas模塊處理數據 課件(共36張PPT) 浙教版高中信息技術必修一

資源簡介

(共36張PPT)
利用pandas模塊處理數據
常用數據處理模塊
numpy模塊:科學計算的基礎庫。
pandas模塊:處理表格數據的庫。
matplotlib模塊:繪圖庫,可快速繪制圖表。
導入pandas模塊:
import pandas as pd
Pandas數據結構
Series數據結構:
一維數據結構,包含一組數據和一個與數據關聯的行索引(index)。索引值默認從0開始遞增。
Series數據結構
創建Series對象
列表創建Series數據結構。
import pandas as pd
s=pd.Series([166,178,180])
#創建Series對象時指定行索引
import pandas as pd
s=pd.Series([166,178,180],index=[“s01”,”s02”,”s03”])
Series數據結構
創建Series對象
字典創建Series數據結構。
字典的鍵作為行索引
import pandas as pd
a={“s01”:166,”s02”:178,”s03”:180}
s=pd.Series(a)
Series數據結構
常用屬性
index:獲取索引
values:獲取數據
import pandas as pd
s=pd.Series([166,178,180],index=[“s01”,”s02”,”s03”])
for i in s.index:
print(i)
for j in s.values:
print(j)
Series數據結構
查看和修改Series對象中的數據
import pandas as pd
s=pd.Series([166,178,180],index=[“s01”,”s02”,”s03”])
print(s [“s01”]) #輸出行索引為“s01”的值
s[“s01”]=170 #修改行索引為“s01” 的值為170
s[“s04”]=190 #添加新的數據
Pandas數據結構
DataFrame數據結構:
二維數據結構,由一個行索引、列標題和數據組成的數據結構。行索引默認從0開始
01
姓名 性別
張三 男
列標題
行索引
數據
李麗 女
DataFrame數據結構
創建DataFrame對象
通過相等長度的列表創建DataFrame數據結構。行索引默認從0開始
import pandas as pd
data=[[“張三”, “男”],[“李麗”, “女”]]
s=pd.DataFrame(data,columns=[“姓名”,”性別”])
01
姓名 性別
張三 男
李麗 女
DataFrame數據結構
創建DataFrame對象
通過相等長度的字典創建DataFrame數據結構。
字典的鍵作為列標題,字典的值作為數據
import pandas as pd
data={“姓名”:[“張三”,”李四”],”性別”:[“男”,”男”]}
s=pd.DataFrame(data)
DataFrame數據結構
讀取文件創建DataFrame數據結構。
Excel
Pandas
DataFrame數據結構
創建DataFrame對象
讀取二維數據文件創建DataFrame數據結構。
import pandas as pd
df=pd.read_csv(“2.csv”)
常用屬性顯示索引、列標題及值:
df.index:行索引
DataFrame數據結構
常用屬性顯示索引、列標題及值:
df.columns:列標題
DataFrame數據結構
常用屬性顯示索引、列標題及值:
df.values:獲取數據
DataFrame數據結構
常用屬性顯示索引、列標題及值:
d.T:行列轉置
DataFrame數據結構
1、讀取excel文件創建二維數據結構s
2、獲取行索引
3、獲取列標題
4、獲取數據
二維數據結構,行索引默認從___開始
DataFrame數據結構
檢索一列數據:
df.列名 df[“列名”]
檢索多列數據:
df[[“列名”,”列名”,”列名”]]
DataFrame數據結構
某列數據擴大或縮小c倍:
df.列名*c df.列名/c
列數據進行計算(不可有空單元格)
df.列名+df.列名
DataFrame數據結構
檢索行數據:
df [開始行索引:結束行索引]

df.loc[行索引]
DataFrame數據結構
篩選滿足條件的若干行數據:
df[條件]
注:篩選滿足多個條件時用連接符號:且用&,或用|,條件用()
df[(df.學校==“一中”)&( df.成績>=99 )]
DataFrame數據結構
檢索具體某個單元格的數據:
①df.at[行索引,"列名"]
②df["列名"][行索引] ,df.列名[行索引]
5、獲取一列數據,獲取多列數據
6、獲取某行數據
7、篩選成績大于90的若干行數據
8、檢索具體某個單元格的數據
DataFrame數據結構
一、排序
①df. sort_values(“列名”,ascending=True/False,inplace=True/False)
排序方式:
True升序,False降序
不寫默認升序
是否修改原數據:
True修改,False不修改
不寫默認不修改
將排序結果重新賦值給變量時不需要修改原數據
df1=df. sort_values(“成績”,ascending=False)
DataFrame數據結構
二、刪除
①df. drop(行索引,inplace=True/False)
②df.drop(“列名”,axis=1, inplace=True/False)
將排序結果重新賦值給變量時不需要修改原數據
df1=df.drop(“人數”,axis=1)
不寫默認不修改
DataFrame數據結構
三、分組
df.groupby(“列名”,as_index=True/False)
是否作為行索引
默認是True
DataFrame數據結構
1、按成績列降序排序,賦給df1
2、刪除成績列,賦給df1
3、刪除第三行,賦給df1
4、按班級分組求和,且班級不作為行索引
常用函數
①插入一列數據:df.insert(列位置,列標題,數據)
如df.insert(3,“測試”,data)
或df[“新增列名”]=數據
②追加函數:
df1=df.append({“學校”:”五中”,”分數”:85,人數:“7”},ignore_index=True)
DataFrame數據結構
常用函數
①統計非空數據項
df.count() #返回非空數據項的數量
DataFrame數據結構
②求和、求最大值、求最小值、求平均值
df.sum() #求某一列、某些列和
df.max() df.min() #返回最大值或最小值
df.mean() #求某一列、某些列平均值
DataFrame數據結構
③ df[“總分”]= df.sum(axis=1)
求某行數字的和
【全適用】
DataFrame數據結構
④df[“總分”]=df.成績+df.人數
求某行數字的和
【單元格有空值不可用】
常用函數
④找出DataFrame的前/后多少行
df.head(2) #前兩行
df.tail(2) #后兩行
df.head() 參數不寫,默認取前五行
DataFrame數據結構
4、插入一列數據
5、統計非空數據項個數、求平均值
6、取前兩行、取后兩行
7、按行求和

展開更多......

收起↑

資源預覽

<pre id="tfb94"><li id="tfb94"></li></pre>

<bdo id="tfb94"><rt id="tfb94"></rt></bdo>
  • <menu id="tfb94"><dl id="tfb94"></dl></menu><i id="tfb94"><acronym id="tfb94"><sub id="tfb94"></sub></acronym></i>

    1. 主站蜘蛛池模板: 馆陶县| 宜昌市| 金川县| 两当县| 尼木县| 唐海县| 阿拉尔市| 广宗县| 福建省| 石景山区| 普安县| 陵川县| 犍为县| 化隆| 宜州市| 牟定县| 昌平区| 鸡东县| 象山县| 平顶山市| 深圳市| 炎陵县| 鄱阳县| 北安市| 榆林市| 紫金县| 崇明县| 涞水县| 个旧市| 潞城市| 凯里市| 读书| 梁平县| 青浦区| 诸暨市| 台州市| 绥中县| 长汀县| 寻乌县| 黎川县| 石家庄市|