pandas学习笔记-条件筛选(二)
liuian 2025-01-10 15:14 45 浏览
在上一集中,我们学习了基本的筛选技术。今天,我们将学习如何使用`.query()`和`.apply()`方法进行更高级的筛选。
条件筛选进阶概述
随着数据集的复杂性增加,我们需要更强大的工具来帮助我们筛选数据。Pandas提供了`.query()`和`.apply()`这样的方法,让我们能够以更灵活、更强大的方式进行筛选。
使用.query()方法
python代码
# 使用.query()筛选工资高于平均值的员工
df_query = df.query('Salary > @df["Salary"].mean()')
# .query()方法允许我们使用python代码原生的变量,并且使筛选条件的表达更加直观。
使用.apply()方法
python代码
# 假设我们要根据一个自定义函数的计算结果来筛选数据
def is_top_earner(row):
return row['Salary'] > df['Salary'].mean()
# 使用.apply()和自定义函数筛选
df_apply = df.apply(is_top_earner, axis=1)
# .apply()方法允许我们对DataFrame的行或列应用一个函数,根据函数的返回值来筛选数据。
综合案例分析
假设我们有一个包含员工信息的DataFrame df,数据如下:
python代码
import pandas as pd
import numpy as np
# 示例数据
data = {
'EmployeeID': [101, 102, 103, 104, 105, 106],
'Name': ['John Doe', 'Jane Smith', 'Bob Johnson', 'Alice Davis', 'Mike Brown', 'Sophia Lee'],
'Department': ['Engineering', 'HR', 'Marketing', 'Engineering', 'Sales', 'Engineering'],
'Age': [34, 29, 45, 31, 28, 40],
'Salary': [70000, 50000, 60000, 75000, 48000, 80000]
}
df = pd.DataFrame(data)
步骤1:使用.query()方法
我们想要筛选出工资高于平均工资的员工。
python代码
# 使用.query()方法筛选
average_salary = df['Salary'].mean()
high_earners = df.query("Salary > @average_salary")
print(high_earners)
步骤2:使用.apply()方法
假设我们要根据员工的工龄(假设工龄为当前年份减去入职年份)来筛选员工,工龄超过10年的员工我们认为是资深员工。
python代码
# 假设当前年份为2023
current_year = 2023
# 使用.apply()方法筛选资深员工
senior_employees = df.apply(lambda x: current_year - x['EmployeeID'] // 100 > 10, axis=1)
print(senior_employees)
步骤3:结合.apply()和自定义函数
我们可以定义一个自定义函数来判断员工是否为高薪。
python代码
# 定义自定义函数判断是否为高薪
def is_high_earner(salary):
return salary > 75000
# 使用.apply()和自定义函数筛选高薪员工
high_earning_employees = df.apply(lambda x: is_high_earner(x['Salary']), axis=1)
print(high_earning_employees)
步骤4:筛选并展示结果
使用.query()和.apply()筛选出的数据可以用于进一步的分析或可视化。
python代码
# 使用.query()筛选高薪员工
high_earning_employees_query = df.query("Salary > 75000")
print(high_earning_employees_query)
步骤5:应用更改
将筛选后的数据保存到新的DataFrame或CSV文件中。
python代码
# 将筛选后的高薪员工数据保存到新的CSV文件
high_earning_employees_query.to_csv('high_earning_employees.csv', index=False)
性能考量
在进行筛选时,我们也需要考虑代码的性能。`.query()`通常比`.apply()`更快,因为它进行了优化以处理向量化操作。但是,`.apply()`提供了更大的灵活性,尤其是在处理复杂的自定义逻辑时。
总结与预告
今天我们学习了如何使用Pandas的`.query()`和`.apply()`方法进行高级筛选。这些方法提供了筛选数据的强大工具,使我们能够更加精确地控制数据的筛选过程。如果大家对条件筛选有任何疑问,或者在实践中遇到问题,请在评论区留言,我会尽快解答。
- 上一篇:Java基础教程:k8s快速入门
- 下一篇:Pandas入门-5.数据筛选
相关推荐
- 壁纸图片2025最新款(电脑桌面壁纸图片2025最新款)
-
要更换2023最新款壁纸图片,可以按照以下步骤操作:首先,找到您想要更换的壁纸图片并下载到您的设备上。其次,进入您的设备设置,找到“壁纸”或“桌面壁纸”选项,并点击进入。然后,选择“更换壁纸”并在相册...
- 清理垃圾的神器(清理垃圾的神器是什么)
-
1、《腾讯手机管家》这款可以帮助用户进行强力的清理,加速告别空间卡顿,缓慢延迟的问题的软件当中,用户可以随时随地登录软件进行自动清理和自动清理,自动清理包括图片,视频,语音文件在内的各种换成文件,为手...
- 苹果笔记本怎样重装系统(苹果笔记本怎样重装系统还原)
-
苹果笔记本电脑系统可以通过以下步骤进行重装:1.备份数据:在开始重装前,需要备份你的重要数据。你可以将数据存储到外部硬盘、云存储或其他可靠的设备中。2.下载安装器:从AppStore中下载macOS...
- 手机wifi打不开怎么办
-
手机wifi打不开的原因,可能集中在该手机出现了手机文件丢失、手机版本不稳定、手机文件出错以及手机wifi模块摔坏等故障造成的。手机wifi打不开修复教程1.wcnss_qcom_cfg文件丢失导...
- bios恢复出厂设置后无法开机
-
可通过进入BIOS界面设置bios恢复出厂设置的方法解决,步骤如下:1、通过按Delete或数字键盘中的Del键进入BIOS。2、按箭头键输入并将光标移动到“加载设置默认值”项,然后按enter确认。...
- 电脑硬盘打不开怎么办(电脑硬盘打不开怎么办)
-
电脑硬盘坏了是不能开机的。硬盘坏道的修复方法:1、逻辑坏道的修复对于逻辑坏道,Windows自带的“磁盘扫描程序(Scandisk)”就是最简便常用的解决手段。如果硬盘出现了坏道,我们可在Window...
- linux系统备份与还原工具(linux系统备份与还原工具在哪)
-
用GHOST对LINUX系统做备份1:要求将安装了LINUX系统的硬盘(原盘)整盘刻至另一硬盘(目标盘)。2:所需工具:DOS系统引导盘,GHOST2003(版本低的对文件格式不能很好的支持),原盘(...
- pdf怎么转换成xml格式(如何将pdf格式转换成xml格式)
-
将PDF转换为XML需要使用专业的PDF转换工具。以下是一些常用的PDF转XML工具:1.AdobeAcrobatDC:AdobeAcrobatDC是一款功能强大的PDF编辑软件,其中包括P...
- windows7iso文件(iso文件 win7)
-
利用winrar可以直接打开iso文件,如果双击不能直接打开需要设置winrar,步骤如下:1、启动winrar,点击选项菜单设置命令;2、点击综合选项卡,点击全部选择,点击确定即可。具体操作方法步骤...
- 路由器ip地址是什么意思(路由器的ip地址是)
-
路由器IP地址是指连接到互联网的路由器在局域网内的唯一标识符,一般为192.168.1.1或192.168.0.1等地址。通过路由器IP地址,用户可以通过浏览器等工具登录到路由器管理界面,进行网络设置...
-
- mediaplayer播放记录在哪里(mediaplayer历史记录)
-
《WindowsMediaPlayer》无法播放该文件,表示《WindowsMediaPlayer》目前的版本不支持该视频的格式编码。解决方法: 1.如果安装的是正版操作系统,点帮助→检查更新,稍待片刻,WindowsMed...
-
2026-01-14 02:37 liuian
- 电脑xp怎么换系统win7(电脑xp系统换win7教程)
-
第一种方法:自助安装win7系统 我们在进行自助安装win7系统之前我们要保证我们的电脑是联网的。为了能更加顺利的完成对xp系统的升级,我们的电脑最好是能高速上网的,只有能联网我们才可以下载最新的系...
- appstore官方网站(appstore.apple.com)
-
Appstore即applicationstore,通常理解为应用商店。Appstore是苹果公司基于iPhone的软件应用商店,向iPhone的用户提供第三方的应用软件服务,这是苹果开创的一...
- 电脑开不了机怎么办显示英文字母
-
win7操作系统电脑在开机的时候屏幕界面出现CLIENTMACADDR,然后就一直停在了这个界面,要等很长时间才能进入系统登入界面。出现这样问题的原因是什么?这是因为网卡启用了BOOTROM芯片...
- win7此windows副本不是正版(win7 此windows副本不是正版)
-
win7系统提示副本不是正版解决方法:1.打开设备,调出运行窗口,输入命令“cmd”,并按下回车键;2.这时命令提示符窗口便会自动弹出;3.输入命令“SLMGR-REARM”,再按下回车键;4.命令...
- 一周热门
-
-
飞牛OS入门安装遇到问题,如何解决?
-
如何在 iPhone 和 Android 上恢复已删除的抖音消息
-
Boost高性能并发无锁队列指南:boost::lockfree::queue
-
大模型手册: 保姆级用CherryStudio知识库
-
用什么工具在Win中查看8G大的log文件?
-
如何在 Windows 10 或 11 上通过命令行安装 Node.js 和 NPM
-
威联通NAS安装阿里云盘WebDAV服务并添加到Infuse
-
Trae IDE 如何与 GitHub 无缝对接?
-
idea插件之maven search(工欲善其事,必先利其器)
-
如何修改图片拍摄日期?快速修改图片拍摄日期的6种方法
-
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
