百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

一文详解Pandas数据筛选_pandas筛选特定的值

liuian 2025-10-14 01:02 18 浏览

Pandas 是 Python 中强大的数据分析库,数据筛选是其核心功能之一。本文详细讲解 Pandas 数据筛选的各种方法,包括基础筛选、条件筛选、函数筛选等,结合实例帮助你快速掌握。


1. Pandas 数据筛选概述

数据筛选是指从 Pandas 的 DataFrame 或 Series 中提取符合特定条件的子集数据。Pandas 提供了多种灵活的方式来实现筛选,包括:

  • 索引/切片:通过行/列标签或位置提取数据。
  • 布尔索引:使用条件表达式筛选符合条件的行。
  • loc 和 iloc:基于标签或整数位置筛选。
  • query 方法:使用字符串表达式筛选。
  • isin 方法:筛选值在特定列表中的数据。
  • 自定义函数:通过 apply 或其他方法实现复杂筛选逻辑。

2. 准备示例数据

import pandas as pd

# 创建示例 DataFrame
data = {
    'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
    'age': [25, 30, 35, 40, 45],
    'city': ['New York', 'Los Angeles', 'Chicago', 'Houston', 'Boston'],
    'salary': [50000, 60000, 75000, 80000, 65000]
}
df = pd.DataFrame(data)

name

age

city

salary

Alice

25

New York

50000

Bob

30

Los Angeles

60000

Charlie

35

Chicago

75000

David

40

Houston

80000

Eve

45

Boston

65000


3. 基本筛选方法

3.1 按列名筛选

# 提取单列
age = df['age']

# 提取多列
subset = df[['name', 'salary']]

结果:

单列:

index

age

0

25

1

30

2

35

3

40

4

45

多列:

name

salary

Alice

50000

Bob

60000

Charlie

75000

David

80000

Eve

65000

3.2 按行索引筛选

# iloc 按行
row_0 = df.iloc[0]
rows_1_to_3 = df.iloc[1:3]

# loc 按标签
row_0_loc = df.loc[0]

name

age

city

salary

Alice

25

New York

50000

name

age

city

salary

Bob

30

Los Angeles

60000

Charlie

35

Chicago

75000


4. 布尔索引

4.1 单条件

over_30 = df[df['age'] > 30]

name

age

city

salary

Charlie

35

Chicago

75000

David

40

Houston

80000

Eve

45

Boston

65000

4.2 多条件

high_salary_over_30 = df[(df['age'] > 30) & (df['salary'] > 70000)]

name

age

city

salary

Charlie

35

Chicago

75000

David

40

Houston

80000

4.3 isin 筛选

cities = ['New York', 'Boston']
selected_cities = df[df['city'].isin(cities)]

name

age

city

salary

Alice

25

New York

50000

Eve

45

Boston

65000


5. query 方法

result = df.query('age > 30 and salary > 70000')

name

age

city

salary

Charlie

35

Chicago

75000

David

40

Houston

80000


6. 高级筛选

6.1 apply 自定义

long_names = df[df['name'].apply(lambda x: len(x) > 4)]

name

age

city

salary

Charlie

35

Chicago

75000

David

40

Houston

80000

6.2 str 操作

york_cities = df[df['city'].str.contains('York')]

name

age

city

salary

Alice

25

New York

50000


7. loc/iloc 经纬筛选

result = df.loc[df['age'] > 30, ['name', 'salary']]

name

salary

Charlie

75000

David

80000

Eve

65000


8. 处理缺失值

df.loc[2, 'salary'] = None
not_null_salary = df[df['salary'].notna()]

name

age

city

salary

Alice

25

New York

50000

Bob

30

Los Angeles

60000

David

40

Houston

80000

Eve

45

Boston

65000


9. 性能优化建议

  • 优先使用向量化操作,如布尔索引、query
  • 避免链式索引:df['col'][condition]
  • 对字符串列使用 astype('category')
  • 进行預排序处理

10. 总结

Pandas 数据筛选功能强大且灵活,核心方法包括:

  • 基础索引:[]、.loc、.iloc
  • 布尔索引:条件表达式筛选
  • query方法:简洁的字符串查询
  • isin和 str方法:处理特定值和字符串
  • apply自定义逻辑:应对复杂需求

通过上述方法,你可以高效地从 DataFrame 中提取所需数据。根据数据规模和需求,合理选择方法以平衡代码可读性和性能。

相关推荐

怎么判断该换硅脂了(cpu硅脂干了影响真的很大吗)

方法步骤如下第一,从系统软件的运行上来看,如果在运行某些大型软件,容易导致显卡发热的程序时,出现画面掉帧,或卡顿,甚至是画面卡死等情况,这大多是因为显卡散热出现问题,导致显卡自动降频,以降低功耗来减少...

壁纸图片2025最新款(电脑桌面壁纸图片2025最新款)

要更换2023最新款壁纸图片,可以按照以下步骤操作:首先,找到您想要更换的壁纸图片并下载到您的设备上。其次,进入您的设备设置,找到“壁纸”或“桌面壁纸”选项,并点击进入。然后,选择“更换壁纸”并在相册...

清理垃圾的神器(清理垃圾的神器是什么)

1、《腾讯手机管家》这款可以帮助用户进行强力的清理,加速告别空间卡顿,缓慢延迟的问题的软件当中,用户可以随时随地登录软件进行自动清理和自动清理,自动清理包括图片,视频,语音文件在内的各种换成文件,为手...

苹果笔记本怎样重装系统(苹果笔记本怎样重装系统还原)

苹果笔记本电脑系统可以通过以下步骤进行重装:1.备份数据:在开始重装前,需要备份你的重要数据。你可以将数据存储到外部硬盘、云存储或其他可靠的设备中。2.下载安装器:从AppStore中下载macOS...

手机wifi打不开怎么办

手机wifi打不开的原因,可能集中在该手机出现了手机文件丢失、手机版本不稳定、手机文件出错以及手机wifi模块摔坏等故障造成的。手机wifi打不开修复教程1.wcnss_qcom_cfg文件丢失导...

bios恢复出厂设置后无法开机

可通过进入BIOS界面设置bios恢复出厂设置的方法解决,步骤如下:1、通过按Delete或数字键盘中的Del键进入BIOS。2、按箭头键输入并将光标移动到“加载设置默认值”项,然后按enter确认。...

电脑硬盘打不开怎么办(电脑硬盘打不开怎么办)

电脑硬盘坏了是不能开机的。硬盘坏道的修复方法:1、逻辑坏道的修复对于逻辑坏道,Windows自带的“磁盘扫描程序(Scandisk)”就是最简便常用的解决手段。如果硬盘出现了坏道,我们可在Window...

linux系统备份与还原工具(linux系统备份与还原工具在哪)

用GHOST对LINUX系统做备份1:要求将安装了LINUX系统的硬盘(原盘)整盘刻至另一硬盘(目标盘)。2:所需工具:DOS系统引导盘,GHOST2003(版本低的对文件格式不能很好的支持),原盘(...

pdf怎么转换成xml格式(如何将pdf格式转换成xml格式)

将PDF转换为XML需要使用专业的PDF转换工具。以下是一些常用的PDF转XML工具:1.AdobeAcrobatDC:AdobeAcrobatDC是一款功能强大的PDF编辑软件,其中包括P...

windows7iso文件(iso文件 win7)

利用winrar可以直接打开iso文件,如果双击不能直接打开需要设置winrar,步骤如下:1、启动winrar,点击选项菜单设置命令;2、点击综合选项卡,点击全部选择,点击确定即可。具体操作方法步骤...

路由器ip地址是什么意思(路由器的ip地址是)

路由器IP地址是指连接到互联网的路由器在局域网内的唯一标识符,一般为192.168.1.1或192.168.0.1等地址。通过路由器IP地址,用户可以通过浏览器等工具登录到路由器管理界面,进行网络设置...

mediaplayer播放记录在哪里(mediaplayer历史记录)
mediaplayer播放记录在哪里(mediaplayer历史记录)

《WindowsMediaPlayer》无法播放该文件,表示《WindowsMediaPlayer》目前的版本不支持该视频的格式编码。解决方法:  1.如果安装的是正版操作系统,点帮助→检查更新,稍待片刻,WindowsMed...

2026-01-14 02:37 liuian

电脑xp怎么换系统win7(电脑xp系统换win7教程)

第一种方法:自助安装win7系统  我们在进行自助安装win7系统之前我们要保证我们的电脑是联网的。为了能更加顺利的完成对xp系统的升级,我们的电脑最好是能高速上网的,只有能联网我们才可以下载最新的系...

appstore官方网站(appstore.apple.com)

Appstore即applicationstore,通常理解为应用商店。Appstore是苹果公司基于iPhone的软件应用商店,向iPhone的用户提供第三方的应用软件服务,这是苹果开创的一...

电脑开不了机怎么办显示英文字母

win7操作系统电脑在开机的时候屏幕界面出现CLIENTMACADDR,然后就一直停在了这个界面,要等很长时间才能进入系统登入界面。出现这样问题的原因是什么?这是因为网卡启用了BOOTROM芯片...