python pandas常用语法，数据分析神器pandas入门宝典-小超越工作室

Pandas 是 Python 的核心数据分析支持库，拥有快速、灵活、明确的数据结构，旨在简单、直观、快速地处理关系型、标记型数据，是一款强大、灵活的开源数据分析工具。

参数名称	说明
data	输入的数据，可以是 ndarray，series，list，dict，标量以及一个 DataFrame。
index	行标签，如果没有传递 index 值，则默认行标签是 np.arange(n)，n 代表 data 的元素个数。
columns	列标签，如果没有传递 columns 值，则默认列标签是 np.arange(n)。
dtype	dtype表示每一列的数据类型。
copy	默认为 False，表示复制数据 data。

推荐阅读：http://c.biancheng.net/pandas/dataframe.html

二、数据表信息查看

1、维度查看：df.shape

2、数据表基本信息（维度、列名称、数据格式、所占空间等）：df.info()

3、每一列数据的格式：df.dtypes

4、某一列格式：df['B'].dtype

5、空值：df.isnull()

6、查看某一列空值：df['B'].isnull()

7、查看某一列的唯一值：df['B'].unique()

8、查看数据表的值：df.values

9、查看列名称：df.columns

10、查看前5行数据 df.head()、后5行数据：df.tail()

三、pandas删除指定行或列

# 删除列，注意：结果返回的是一个新对象，原对象不会被改变

df.drop(['ca'],axis=1)
# 删除多列
df.drop(['ca','te'],axis=1)
# 删除行
df.drop(['a'])
# 按列条件删除行
df.drop(df[df.oh&gt;3].index)
查找指定数值的索引
z=df.query('user_id=="326541"').index
#删除指定索引并重建索引
z=df.drop(z).reset_index(drop=True)

更多常用方法待更新

如需转载请保留本文出处: https://zhe94.com/917.html