超实用!用Python快速实现数据分组统计与透视表
liuian 2025-01-13 15:31 36 浏览
在Python数据分析领域,Pandas库中的GroupBy功能提供了强大的数据分组和聚合能力。通过GroupBy,我们可以根据一个或多个列对DataFrame进行分割、应用函数并重新组合结果,从而实现数据集的深入分析和统计。本文将详细介绍如何使用Pandas GroupBy进行分组统计,并结合实际代码示例展示其应用场景。
GroupBy基础操作
假设我们有一个包含用户购买记录的数据集:
import pandas as pd
# 创建一个简单的DataFrame
data = {'User': ['Alice', 'Bob', 'Charlie', 'Alice', 'Bob', 'Charlie'],
'Product': ['Apple', 'Banana', 'Orange', 'Apple', 'Banana', 'Orange'],
'Quantity': [3, 2, 1, 4, 5, 3],
'Price': [0.5, 0.25, 0.75, 0.5, 0.25, 0.75]}
df = pd.DataFrame(data)
print(df)
- 按单一列分组
grouped = df.groupby('User')
# 计算每个用户的总购买量(Quantity之和)
total_quantity = grouped['Quantity'].sum()
print(total_quantity)
# 计算每个用户的总消费金额(Quantity * Price之和)
total_spending = grouped[['Quantity', 'Price']].sum().prod(axis=1)
print(total_spending)
- 按多个列分组
grouped_multi = df.groupby(['User', 'Product'])
# 每个用户对每种产品的购买总量
product_purchases = grouped_multi['Quantity'].sum()
print(product_purchases)
更复杂的分组统计操作
1. 应用自定义函数
# 计算每个用户购买产品种类的数量
unique_products_per_user = df.groupby('User')['Product'].nunique()
print(unique_products_per_user)
2. 使用agg方法进行多重聚合
# 对每个用户计算购买量的平均值和总和
aggregated_stats = df.groupby('User')['Quantity'].agg(['mean', 'sum'])
print(aggregated_stats)
3. 分层索引与透视表
# 创建一个带有层次索引的分组统计结果
multi_index_grouped = df.groupby(['User', 'Product']).sum()
# 将多级索引的结果转换为透视表形式
pivot_table = multi_index_grouped.unstack()
print(pivot_table)
进阶应用及注意事项
- 分组后的过滤操作:可以结合filter()方法,在分组后对满足特定条件的组进行筛选。
- 处理缺失值:在执行分组操作前,应先对数据进行清洗,处理缺失值,以避免影响分组结果。
- 性能优化:对于大型数据集,可利用groupby()配合apply()函数分块处理数据,提高运算效率。
总结
Pandas GroupBy功能是数据分析过程中的重要工具,它能够帮助我们从不同维度深入理解数据,发现隐藏的规律和趋势。熟练掌握GroupBy的各种用法,将极大地提升Python Web开发中数据处理的能力,特别是在数据挖掘、报表生成以及机器学习特征工程等场景中发挥关键作用。
关注我,手把手带你快速入门 AI 机器学习编程!
相关推荐
- 一个win10密钥能激活几台电脑
-
零售版的密钥只能激活一台电脑,VOL版的能够批量激活。切实而今根基上用东西的人比较多,那样比较便当,提议也能够碰运气。软件可以正确辨认用户计较机上布置的悉数office版本和windows版本,包括w...
- 电脑城买电脑(电脑城买电脑装了盗版系统)
-
不太靠谱。首先电脑城的电脑同个款式配置很凌乱,要么来个阉割版、要么来个升级版,而所谓升级往往会以次充好,为的就是让你觉得少花了钱还买到了更好的配置。其次电脑城的销售人员大部分都是那种半懂的非专业人员,...
- win11很多游戏不兼容(win11不兼容的游戏)
-
据我们了解,Windows11系统和传奇游戏之间没有直接的冲突或不兼容问题。然而,可能有一些间接的原因导致此问题。首先,传奇游戏是一款老游戏,可能需要在Windows11系统上运行一些兼容性设置或...
- 华为路由器登录(华为路由器登录入口手机版)
-
华为路由器的登录地址是192.168.3.1,电脑/手机连接到华为路由器的网络后,在浏览器中输入192.168.3.1,就能进入登录入口。然后输入登录密码,可以进入华为路由器的设置页面。华为wifi设...
- 固态硬盘的缺点(固态硬盘缺点和坏处)
-
1.价格与容量 固态硬盘的容量和价格都要比机械硬盘贵 2.物理特性 固态硬盘无噪音,抗震动,体积小,发热量低,功耗也非常低,工作温度范围很大!固态硬盘的内部并没有任何机械活动部件,没有马达和风...
- 联想自带系统怎么重装(联想电脑自带系统如何重装系统)
-
联想电脑重装系统步骤:1、制作好U盘启动盘,然后把下载的联想win7系统iso文件直接复制到U盘的GHO目录下:2、在联想电脑上插入U盘,重启后不停按F12或Fn+F12快捷键打开启动菜单,选择U盘项...
- 笔记本亮度调节快捷键(调亮笔记本电脑屏幕亮度快捷键)
-
在键盘最上一排“F”打头的键中,标有小太阳的就是调节亮度的快捷键。“小太阳-”是调低,“小太阳+”是调高。有些笔记本电脑直接按这个键就可以调节,有些需要同时按住Fn(一般Fn在键盘左下角,ctrl右...
- 手机一键还原(iphone手机一键还原)
-
如果你希望恢复华为手机上的一键锁屏功能,你可以按照以下步骤进行操作:1.进入设置:在你的华为手机上,打开设置应用程序。你可以在应用抽屉中找到该应用,通常是一个齿轮或者包含「设置」字样的图标。2.寻...
- 系统修复u盘(优盘系统修复)
-
1、我们在网络中,找到修复软件U盘烧录修复(PortFreeProductionProgram)v3.27,记得不需要太高级的版本,这个比较好用。 2、打开软件,出现的页面是,初始状态下,看到...
- sony笔记本u盘启动快捷键(索尼笔记本u盘快速启动键)
-
索尼笔记本按assist按键快捷键进入u盘启动索尼笔记本进入U盘启动的步骤:1、索尼笔记本位于键盘右上角有一个ASSIST的按键,首先按这个键就可以进入vaiocare的设置。2、通过按ASSIST...
- win7旗舰版密匙(正版win7旗舰版密钥)
-
一、Windows7旗舰版激活密钥零售版:Windows7UltimateRetail永久序列号【尝试联网激活,如果不能激活,可电话激活】[Key]:RHTBY-VWY6D-QJRJ9-JGQ...
- 一键ghost备份还原工具绿色版硬盘版
-
可以的。1.打开GHOST软件,接受许可协议,点击OK。2.从图像中选择Local→Partition→,3.选择镜像文件所在的分区,找到镜像文件(winxp.gho),然后单击enter。4.显示镜...
- 一周热门
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
