【秋招】一些Python数据分析命令

Data Analysis Interview

Posted by Zaki on July 12, 2022

Python 数据分析命令

导入数据: pd.read_csv/table/excel/sql/json/html (文件名)

导出数据: df.read_csv/table/excel/sql/json (文件名)

查看数据:

df.head(n) 查看数据前n行

df.tail(n) 查看最后n行

df.shape() 查看行数和列数

df.info() 查看索引数据类型信息

df.describe() 汇总统计

value_counts() 统计某个值出现的次数

df.ismull().any() 查看是否有缺失值

duplicated() 查看重复信息

数据选取:

df[col,col2]

df.iloc[0,:] 返回第一行

注意loc函数是按索引,iloc是按数据参数

数据处理:

df.columns=[“a”,”b”] 重命名列名

pd.isnull() 检查空值

df.dropna() 删除所有包含空值的

df.dropna(axis=1)

df.fillna(value=x) 替换对象中所有的空值

s.astype(float) 将数据类型更改为float

s.replace(1,’one’) 代替所有等于1的值

数据合并:

df.append(df2) 将df2数据合并到df1

df.concat([df1,df2]’) 将两个按照行合并