Pandas 常用函数
liuian 2025-03-11 18:02 32 浏览
Pandas 提供了大量用于数据处理和分析的函数,以下是一些常用的函数:
通用函数
函数 | 描述 |
pd.isna(obj) | 检查对象是否为缺失值(NaN 或 None)。 |
pd.notna(obj) | 检查对象是否不为缺失值。 |
pd.isnull(obj) | 同 pd.isna(),检查对象是否为缺失值。 |
pd.notnull(obj) | 同 pd.notna(),检查对象是否不为缺失值。 |
pd.concat(objs, axis) | 沿指定轴连接多个对象(如 Series 或 DataFrame)。 |
pd.merge(left, right, on) | 根据指定列合并两个 DataFrame。 |
pd.get_dummies(data) | 将分类变量转换为哑变量(One-Hot 编码)。 |
pd.cut(x, bins) | 将连续数据分箱为离散区间。 |
pd.qcut(x, q) | 将数据按分位数分箱。 |
pd.to_numeric(arg) | 将参数转换为数值类型。 |
pd.to_datetime(arg) | 将参数转换为日期时间类型。 |
pd.to_timedelta(arg) | 将参数转换为时间差类型。 |
pd.date_range(start, end) | 生成日期范围。 |
pd.period_range(start, end) | 生成周期范围。 |
pd.timedelta_range(start, end) | 生成时间差范围。 |
pd.unique(values) | 返回数组中的唯一值。 |
pd.value_counts(values) | 返回数组中每个值的频率。 |
pd.factorize(values) | 将数组编码为枚举类型。 |
pd.crosstab(index, columns) | 计算交叉表。 |
pd.pivot_table(data, values, index, columns) | 创建透视表。 |
pd.melt(frame) | 将宽格式数据转换为长格式数据。 |
pd.cut(x, bins) | 将连续数据分箱为离散区间。 |
pd.qcut(x, q) | 将数据按分位数分箱。 |
数学和统计函数
函数 | 描述 |
pd.Series.sum() | 返回 Series 的和。 |
pd.Series.mean() | 返回 Series 的平均值。 |
pd.Series.median() | 返回 Series 的中位数。 |
pd.Series.min() | 返回 Series 的最小值。 |
pd.Series.max() | 返回 Series 的最大值。 |
pd.Series.std() | 返回 Series 的标准差。 |
pd.Series.var() | 返回 Series 的方差。 |
pd.Series.corr(other) | 返回两个 Series 的相关系数。 |
pd.Series.cov(other) | 返回两个 Series 的协方差。 |
pd.Series.quantile(q) | 返回 Series 的分位数。 |
pd.Series.mode() | 返回 Series 的众数。 |
pd.Series.skew() | 返回 Series 的偏度。 |
pd.Series.kurt() | 返回 Series 的峰度。 |
pd.Series.cumsum() | 返回 Series 的累计和。 |
pd.Series.cumprod() | 返回 Series 的累计积。 |
pd.Series.cummax() | 返回 Series 的累计最大值。 |
pd.Series.cummin() | 返回 Series 的累计最小值。 |
字符串处理函数
函数 | 描述 |
pd.Series.str.lower() | 将字符串转换为小写。 |
pd.Series.str.upper() | 将字符串转换为大写。 |
pd.Series.str.strip() | 去除字符串两端的空白字符。 |
pd.Series.str.replace(old, new) | 替换字符串中的子串。 |
pd.Series.str.contains(pattern) | 检查字符串是否包含指定模式。 |
pd.Series.str.split(sep) | 按分隔符拆分字符串。 |
pd.Series.str.cat(others) | 连接字符串。 |
pd.Series.str.extract(regex) | 使用正则表达式提取子串。 |
pd.Series.str.find(sub) | 返回子串的起始位置。 |
pd.Series.str.len() | 返回字符串的长度。 |
时间序列函数
函数 | 描述 |
pd.to_datetime(arg) | 将参数转换为日期时间类型。 |
pd.date_range(start, end) | 生成日期范围。 |
pd.Timestamp() | 创建一个时间戳对象。 |
pd.Timedelta() | 创建一个时间差对象。 |
pd.Period() | 创建一个周期对象。 |
pd.Series.dt.year | 返回日期时间的年份。 |
pd.Series.dt.month | 返回日期时间的月份。 |
pd.Series.dt.day | 返回日期时间的天数。 |
pd.Series.dt.hour | 返回日期时间的小时数。 |
pd.Series.dt.minute | 返回日期时间的分钟数。 |
pd.Series.dt.second | 返回日期时间的秒数。 |
pd.Series.dt.weekday | 返回日期时间的星期几(0-6)。 |
实例
import pandas as pd
# 通用函数
s = pd.Series([1, 2, 3, None])
print(pd.isna(s)) # 检查缺失值
# 数学和统计函数
print(s.sum()) # 计算和
# 字符串处理函数
s_str = pd.Series(['a', 'b', 'c'])
print(s_str.str.upper()) # 转换为大写
# 时间序列函数
dates = pd.to_datetime(['2023-01-01', '2023-02-01'])
print(dates.dt.month) # 提取月份
相关推荐
- 421文档 全文免费阅读(421小说在线阅读)
-
根据1,我回答如下:1,"421文档"是在4月21日发布的。2,"421文档"作为一份重要的文件,通常在特定日期或时间点发布,供相关人员参考和使用。3,除了发布日...
- 阿里旺旺网页版登录入口(阿里旺旺卖家版官网)
-
手机淘宝的旺旺在打开商品后,会看到左下角有个旺旺的图标,点击就可以联系了。 阿里旺旺是将原先的淘宝旺旺与阿里巴巴贸易通整合在一起的一个新品牌。它是淘宝和阿里巴巴为商人量身定做的免费网上商务沟通软件,...
- 网易电脑版登录入口(main.163网易电脑版登录入口)
-
http://mail.163.com步骤一:输入邮箱官网网址http://mail.163.com/打开163邮箱登录入口界面。步骤二:输入已有的邮箱账号、密码,点击登录即可。步骤三:如果没有邮箱账...
- qq截图快捷键不能用(qq快捷截图不能使用)
-
笔记本上面的PrtSC能用么,是不是需要用Fn+这个按键才能截屏呀。有些机器在bios下有Fn快捷键设置,你需要把这个功能键开启或者关闭后才能单独点击使用。或者你使用Fn+PrtSC在试试,另外,何必...
- 大地影视中文第二页的背景故事
-
大地影院通常会有明显的入口标识,你可以根据影院外部的建筑结构和指示牌来找到入口。一般来说,大地影院的入口可能位于建筑的主立面或者侧面,有时也可能位于地下停车场或者商场内部。当你到达影院所在的建筑时,可...
- win10共享打印机需要密码(win10共享打印机需要密码吗)
-
共享打印机需要输入用户名和密码,该如何操作,下面给大家来介绍下。1、首先打开电脑的控制面板,点击管理工具。2、然后在打开的管理工具窗口中,点击本地安全策略。3、接着在打开的页面中,点击本地策略。4、然...
- 系统引导启动项怎么设置(系统引导按哪个键)
-
如果您想在计算机启动时添加系统启动引导选项,可以按照以下步骤进行操作:1.打开“运行”窗口,可以通过快捷键Win+R打开“运行”窗口。2.在“运行”窗口中输入“msconfig”命令,并点击“...
- win10录屏快捷键ctrl+alt+(win10录屏功能快捷键)
-
答,笔记本电脑录屏快捷键是ctrl+alt+s。绝大多数人录制屏幕时,第一个想到的就是电脑自带的录屏功能,比较的方便快捷。这种方法运用起来时非常简单的,只需在键盘上同时按下“ctrl+alt+s”键就...
- 壁纸下载(壁纸下载安装)
-
回答如下:要下载电视屏保相册,您需要先找到适用于您的电视的屏保应用程序。这些应用程序可能会根据您的电视品牌和型号而有所不同,您可以在电视的应用商店中搜索或查看电视制造商的网站以获取更多信息。一旦您找到...
- 木马病毒下载安装(木马病毒下载安装不实名认证)
-
现在1,你自己机器上下载个杀毒软件,安装之后不要删除安装包2,运行杀毒软件3,插入优盘,杀毒软件会自动扫描优盘发现病毒然后提示你4,选择处理/杀毒/清理这些字样5,把杀毒软件安装包复制到优盘6,右键优...
- 手机cdr转jpg最简单的方法(手机cdr转换jpg)
-
cdr文件怎么转换成jpg,快来看下操作方法吧。方法/步骤1、打开电脑中的cdr软件,点击文件,打开,打开需要转换格式的cdr文件。2、点击菜单栏的文件,导出。3、打开导出对话框选择保存文件路径。4、...
- xp永久激活工具(xp永久激活码)
-
如果你需要重置XP的激活器,你需要先打开“开始”菜单,然后选择“运行”。在运行对话框中,输入“regedit”,然后按回车键。这会打开注册表编辑器。在编辑器中,使用左侧面板来导航到“HKEY_LOCA...
- cad2008激活序列号(激活cad的序列号)
-
1.首先运行“AutoCAD2008安装包”中的“Setup.exe”安装AutoCAD2008,安装过程需要十分钟左右;2.第一次运行AutoCAD2008时,请在注册界面输入序列号666-9...
- 自己可以重装电脑系统么(可以自己重装系统吗)
-
电脑自身也可以重装系统。1.电脑是一个可编程的设备,通过特定的步骤和操作,用户可以自行进行系统重装。2.重装系统的过程包括备份重要数据、获取系统安装介质、重新启动电脑进入安装界面、按照指引选择系统...
- 一周热门
-
-
飞牛OS入门安装遇到问题,如何解决?
-
如何在 iPhone 和 Android 上恢复已删除的抖音消息
-
Boost高性能并发无锁队列指南:boost::lockfree::queue
-
大模型手册: 保姆级用CherryStudio知识库
-
用什么工具在Win中查看8G大的log文件?
-
如何在 Windows 10 或 11 上通过命令行安装 Node.js 和 NPM
-
威联通NAS安装阿里云盘WebDAV服务并添加到Infuse
-
Trae IDE 如何与 GitHub 无缝对接?
-
idea插件之maven search(工欲善其事,必先利其器)
-
如何修改图片拍摄日期?快速修改图片拍摄日期的6种方法
-
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
