Pandas 常用函数
liuian 2025-03-11 18:02 40 浏览
Pandas 提供了大量用于数据处理和分析的函数,以下是一些常用的函数:
通用函数
函数 | 描述 |
pd.isna(obj) | 检查对象是否为缺失值(NaN 或 None)。 |
pd.notna(obj) | 检查对象是否不为缺失值。 |
pd.isnull(obj) | 同 pd.isna(),检查对象是否为缺失值。 |
pd.notnull(obj) | 同 pd.notna(),检查对象是否不为缺失值。 |
pd.concat(objs, axis) | 沿指定轴连接多个对象(如 Series 或 DataFrame)。 |
pd.merge(left, right, on) | 根据指定列合并两个 DataFrame。 |
pd.get_dummies(data) | 将分类变量转换为哑变量(One-Hot 编码)。 |
pd.cut(x, bins) | 将连续数据分箱为离散区间。 |
pd.qcut(x, q) | 将数据按分位数分箱。 |
pd.to_numeric(arg) | 将参数转换为数值类型。 |
pd.to_datetime(arg) | 将参数转换为日期时间类型。 |
pd.to_timedelta(arg) | 将参数转换为时间差类型。 |
pd.date_range(start, end) | 生成日期范围。 |
pd.period_range(start, end) | 生成周期范围。 |
pd.timedelta_range(start, end) | 生成时间差范围。 |
pd.unique(values) | 返回数组中的唯一值。 |
pd.value_counts(values) | 返回数组中每个值的频率。 |
pd.factorize(values) | 将数组编码为枚举类型。 |
pd.crosstab(index, columns) | 计算交叉表。 |
pd.pivot_table(data, values, index, columns) | 创建透视表。 |
pd.melt(frame) | 将宽格式数据转换为长格式数据。 |
pd.cut(x, bins) | 将连续数据分箱为离散区间。 |
pd.qcut(x, q) | 将数据按分位数分箱。 |
数学和统计函数
函数 | 描述 |
pd.Series.sum() | 返回 Series 的和。 |
pd.Series.mean() | 返回 Series 的平均值。 |
pd.Series.median() | 返回 Series 的中位数。 |
pd.Series.min() | 返回 Series 的最小值。 |
pd.Series.max() | 返回 Series 的最大值。 |
pd.Series.std() | 返回 Series 的标准差。 |
pd.Series.var() | 返回 Series 的方差。 |
pd.Series.corr(other) | 返回两个 Series 的相关系数。 |
pd.Series.cov(other) | 返回两个 Series 的协方差。 |
pd.Series.quantile(q) | 返回 Series 的分位数。 |
pd.Series.mode() | 返回 Series 的众数。 |
pd.Series.skew() | 返回 Series 的偏度。 |
pd.Series.kurt() | 返回 Series 的峰度。 |
pd.Series.cumsum() | 返回 Series 的累计和。 |
pd.Series.cumprod() | 返回 Series 的累计积。 |
pd.Series.cummax() | 返回 Series 的累计最大值。 |
pd.Series.cummin() | 返回 Series 的累计最小值。 |
字符串处理函数
函数 | 描述 |
pd.Series.str.lower() | 将字符串转换为小写。 |
pd.Series.str.upper() | 将字符串转换为大写。 |
pd.Series.str.strip() | 去除字符串两端的空白字符。 |
pd.Series.str.replace(old, new) | 替换字符串中的子串。 |
pd.Series.str.contains(pattern) | 检查字符串是否包含指定模式。 |
pd.Series.str.split(sep) | 按分隔符拆分字符串。 |
pd.Series.str.cat(others) | 连接字符串。 |
pd.Series.str.extract(regex) | 使用正则表达式提取子串。 |
pd.Series.str.find(sub) | 返回子串的起始位置。 |
pd.Series.str.len() | 返回字符串的长度。 |
时间序列函数
函数 | 描述 |
pd.to_datetime(arg) | 将参数转换为日期时间类型。 |
pd.date_range(start, end) | 生成日期范围。 |
pd.Timestamp() | 创建一个时间戳对象。 |
pd.Timedelta() | 创建一个时间差对象。 |
pd.Period() | 创建一个周期对象。 |
pd.Series.dt.year | 返回日期时间的年份。 |
pd.Series.dt.month | 返回日期时间的月份。 |
pd.Series.dt.day | 返回日期时间的天数。 |
pd.Series.dt.hour | 返回日期时间的小时数。 |
pd.Series.dt.minute | 返回日期时间的分钟数。 |
pd.Series.dt.second | 返回日期时间的秒数。 |
pd.Series.dt.weekday | 返回日期时间的星期几(0-6)。 |
实例
import pandas as pd
# 通用函数
s = pd.Series([1, 2, 3, None])
print(pd.isna(s)) # 检查缺失值
# 数学和统计函数
print(s.sum()) # 计算和
# 字符串处理函数
s_str = pd.Series(['a', 'b', 'c'])
print(s_str.str.upper()) # 转换为大写
# 时间序列函数
dates = pd.to_datetime(['2023-01-01', '2023-02-01'])
print(dates.dt.month) # 提取月份
相关推荐
-
- 驱动网卡(怎么从新驱动网卡)
-
网卡一般是指为电脑主机提供有线无线网络功能的适配器。而网卡驱动指的就是电脑连接识别这些网卡型号的桥梁。网卡只有打上了网卡驱动才能正常使用。并不是说所有的网卡一插到电脑上面就能进行数据传输了,他都需要里面芯片组的驱动文件才能支持他进行数据传输...
-
2026-01-30 00:37 liuian
- win10更新助手装系统(微软win10更新助手)
-
1、点击首页“系统升级”的按钮,给出弹框,告诉用户需要上传IMEI码才能使用升级服务。同时给出同意和取消按钮。华为手机助手2、点击同意,则进入到“系统升级”功能华为手机助手华为手机助手3、在检测界面,...
- windows11专业版密钥最新(windows11专业版激活码永久)
-
Windows11专业版的正版密钥,我们是对windows的激活所必备的工具。该密钥我们可以通过微软商城或者通过计算机的硬件供应商去购买获得。获得了windows11专业版的正版密钥后,我...
-
- 手机删过的软件恢复(手机删除过的软件怎么恢复)
-
操作步骤:1、首先,我们需要先打开手机。然后在许多图标中找到带有[文件管理]文本的图标,然后单击“文件管理”进入页面。2、进入页面后,我们将在顶部看到一行文本:手机,最新信息,文档,视频,图片,音乐,收藏,最后是我们正在寻找的[更多],单击...
-
2026-01-29 23:55 liuian
- 一键ghost手动备份系统步骤(一键ghost 备份)
-
步骤1、首先把装有一键GHOST装系统的U盘插在电脑上,然后打开电脑马上按F2或DEL键入BIOS界面,然后就选择BOOT打USDHDD模式选择好,然后按F10键保存,电脑就会马上重启。 步骤...
- 怎么创建局域网(怎么创建局域网打游戏)
-
1、购买路由器一台。进入路由器把dhcp功能打开 2、购买一台交换机。从路由器lan端口拉出一条网线查到交换机的任意一个端口上。 3、两台以上电脑。从交换机任意端口拉出网线插到电脑上(电脑设置...
- 精灵驱动器官方下载(精灵驱动手机版下载)
-
是的。驱动精灵是一款集驱动管理和硬件检测于一体的、专业级的驱动管理和维护工具。驱动精灵为用户提供驱动备份、恢复、安装、删除、在线更新等实用功能。1、全新驱动精灵2012引擎,大幅提升硬件和驱动辨识能力...
- 一键还原系统步骤(一键还原系统有哪些)
-
1、首先需要下载安装一下Windows一键还原程序,在安装程序窗口中,点击“下一步”,弹出“用户许可协议”窗口,选择“我同意该许可协议的条款”,并点击“下一步”。 2、在弹出的“准备安装”窗口中,可...
- 电脑加速器哪个好(电脑加速器哪款好)
-
我认为pp加速器最好用,飞速土豆太懒,急速酷六根本不工作。pp加速器什么网页都加速,太任劳任怨了!以上是个人观点,具体性能请自己试。ps:我家电脑性能很好。迅游加速盒子是可以加速电脑的。因为有过之...
- 任何u盘都可以做启动盘吗(u盘必须做成启动盘才能装系统吗)
-
是的,需要注意,U盘的大小要在4G以上,最好是8G以上,因为启动盘里面需要装系统,内存小的话,不能用来安装系统。内存卡或者U盘或者移动硬盘都可以用来做启动盘安装系统。普通的U盘就可以,不过最好U盘...
- u盘怎么恢复文件(u盘文件恢复的方法)
-
开360安全卫士,点击上面的“功能大全”。点击文件恢复然后点击“数据”下的“文件恢复”功能。选择驱动接着选择需要恢复的驱动,选择接入的U盘。点击开始扫描选好就点击中间的“开始扫描”,开始扫描U盘数据。...
- 系统虚拟内存太低怎么办(系统虚拟内存占用过高什么原因)
-
1.检查系统虚拟内存使用情况,如果发现有大量的空闲内存,可以尝试释放一些不必要的进程,以释放内存空间。2.如果系统虚拟内存使用率较高,可以尝试增加系统虚拟内存的大小,以便更多的应用程序可以使用更多...
-
- 剪贴板权限设置方法(剪贴板访问权限)
-
1、首先打开iphone手机,触碰并按住单词或图像直到显示选择选项。2、其次,然后选取“拷贝”或“剪贴板”。3、勾选需要的“权限”,最后选择开启,即可完成苹果剪贴板权限设置。仅参考1.打开苹果手机设置按钮,点击【通用】。2.点击【键盘】,再...
-
2026-01-29 21:37 liuian
- 平板系统重装大师(平板重装win系统)
-
如果你的平板开不了机,但可以连接上电脑,那就能好办,楼主下载安装个平板刷机王到你的个人电脑上,然后连接你的平板,平板刷机王会自动识别你的平板,平板刷机王上有你平板的我刷机包,楼主点击下载一个,下载完成...
- 联想官网售后服务网点(联想官网售后服务热线)
-
联想3c服务中心是联想旗下的官方售后,是基于互联网O2O模式开发的全新服务平台。可以为终端用户提供多品牌手机、电脑以及其他3C类产品的维修、保养和保险服务。根据客户需求层次,联想服务针对个人及家庭客户...
- 一周热门
-
-
用什么工具在Win中查看8G大的log文件?
-
如何修改图片拍摄日期?快速修改图片拍摄日期的6种方法
-
RK3588-HDMIRX(瑞芯微rk3588芯片手册)
-
windows11专业版密钥最新(windows11专业版激活码永久)
-
用纯Python轻松构建Web UI:Remi 动态更新,实时刷新界面内容
-
tplink无线路由器桥接教程(tplink路由器如何进行无线桥接)
-
R语言 | CNS绘图第1款——linkET万物皆可连
-
都说Feign是RPC,没有侵入性,为什么我的代码越来越像 C++
-
如何在 Ubuntu 命令行中使用 Wireshark 进行抓包?
-
玩转命令行:7 个高效 Linux 命令技巧,助你事半功倍!
-
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
