亲宝软件园·资讯

展开

Pandas条件筛选与组合筛选的使用

Dusk2090 人气:0

在使用pandas进行数据分析时,经常需要根据逻辑条件来筛选数据。

如果使用 for循环语句 遍历的方式来查找,将十分耗时。

推荐使用pandas自身的功能函数进行筛选,效率更高。

以下列出笔者常用的筛选方法。

条件筛选

根据具体值筛选

df[df['Num'] == 10]
df[df['Name'] == 'Tom']

找出df中值在具体列表中的数据

val_list = [100, 200, 300]
df[df['Num'].isin(val_list)]

筛选某列值长度为固定值的数据

df[df['content'].str.len() == 10]

筛选某列是否为空的数据

# 找出content列为空的数据
df[df['content'].isna()]

# 找出content不为空的数据
df[~df['content'].isna()]

组合筛选

多条件同时满足

# 找出df中A列值为100 且 B列值为‘a'的所有数据
df[(df['A']==100)&(df['B']=='a')]

多条件满足其一即可

# 找出df中A列值为100或B列值为‘b'的所有数据
df[(df['A']==100)|(df['B']=='b')]

注:筛选后所得数据的索引一般是乱的,可使用 df = df.reset_index(drop=True) 的方式重置索引。

加载全部内容

相关教程
猜你喜欢
用户评论