Python 数据分析命令
导入数据: pd.read_csv/table/excel/sql/json/html (文件名)
导出数据: df.read_csv/table/excel/sql/json (文件名)
查看数据:
df.head(n) 查看数据前n行
df.tail(n) 查看最后n行
df.shape() 查看行数和列数
df.info() 查看索引数据类型信息
df.describe() 汇总统计
value_counts() 统计某个值出现的次数
df.ismull().any() 查看是否有缺失值
duplicated() 查看重复信息
数据选取:
df[col,col2]
df.iloc[0,:] 返回第一行
注意loc函数是按索引,iloc是按数据参数
数据处理:
df.columns=[“a”,”b”] 重命名列名
pd.isnull() 检查空值
df.dropna() 删除所有包含空值的
df.dropna(axis=1)
df.fillna(value=x) 替换对象中所有的空值
s.astype(float) 将数据类型更改为float
s.replace(1,’one’) 代替所有等于1的值
数据合并:
df.append(df2) 将df2数据合并到df1
df.concat([df1,df2]’) 将两个按照行合并