超实用!用Python快速实现数据分组统计与透视表
liuian 2025-01-13 15:31 42 浏览
在Python数据分析领域,Pandas库中的GroupBy功能提供了强大的数据分组和聚合能力。通过GroupBy,我们可以根据一个或多个列对DataFrame进行分割、应用函数并重新组合结果,从而实现数据集的深入分析和统计。本文将详细介绍如何使用Pandas GroupBy进行分组统计,并结合实际代码示例展示其应用场景。
GroupBy基础操作
假设我们有一个包含用户购买记录的数据集:
import pandas as pd
# 创建一个简单的DataFrame
data = {'User': ['Alice', 'Bob', 'Charlie', 'Alice', 'Bob', 'Charlie'],
'Product': ['Apple', 'Banana', 'Orange', 'Apple', 'Banana', 'Orange'],
'Quantity': [3, 2, 1, 4, 5, 3],
'Price': [0.5, 0.25, 0.75, 0.5, 0.25, 0.75]}
df = pd.DataFrame(data)
print(df)
- 按单一列分组
grouped = df.groupby('User')
# 计算每个用户的总购买量(Quantity之和)
total_quantity = grouped['Quantity'].sum()
print(total_quantity)
# 计算每个用户的总消费金额(Quantity * Price之和)
total_spending = grouped[['Quantity', 'Price']].sum().prod(axis=1)
print(total_spending)
- 按多个列分组
grouped_multi = df.groupby(['User', 'Product'])
# 每个用户对每种产品的购买总量
product_purchases = grouped_multi['Quantity'].sum()
print(product_purchases)
更复杂的分组统计操作
1. 应用自定义函数
# 计算每个用户购买产品种类的数量
unique_products_per_user = df.groupby('User')['Product'].nunique()
print(unique_products_per_user)
2. 使用agg方法进行多重聚合
# 对每个用户计算购买量的平均值和总和
aggregated_stats = df.groupby('User')['Quantity'].agg(['mean', 'sum'])
print(aggregated_stats)
3. 分层索引与透视表
# 创建一个带有层次索引的分组统计结果
multi_index_grouped = df.groupby(['User', 'Product']).sum()
# 将多级索引的结果转换为透视表形式
pivot_table = multi_index_grouped.unstack()
print(pivot_table)
进阶应用及注意事项
- 分组后的过滤操作:可以结合filter()方法,在分组后对满足特定条件的组进行筛选。
- 处理缺失值:在执行分组操作前,应先对数据进行清洗,处理缺失值,以避免影响分组结果。
- 性能优化:对于大型数据集,可利用groupby()配合apply()函数分块处理数据,提高运算效率。
总结
Pandas GroupBy功能是数据分析过程中的重要工具,它能够帮助我们从不同维度深入理解数据,发现隐藏的规律和趋势。熟练掌握GroupBy的各种用法,将极大地提升Python Web开发中数据处理的能力,特别是在数据挖掘、报表生成以及机器学习特征工程等场景中发挥关键作用。
关注我,手把手带你快速入门 AI 机器学习编程!
相关推荐
- 不用电脑怎么恢复(不用电脑怎么恢复出厂设置)
-
操作方法01方法一:通过设置重置电脑使用快捷键Windows+A,点击所有设置,点击更新系统-恢复,重置此电脑点开始。02选择仅保留我的文件,删除应用和设置,提示窗口会显示出将被删除的应用,点击下一步...
- 最强视频播放器(2020视频播放器排行榜前十名)
-
应该是MXPlayer。他是一款安卓版上十分强悍的视频播放器,他以解码性能强、兼容性高而闻名,并且,对视频字幕的支持更是堪称一绝,支持在线匹配,对特效字幕的支持也是非常的高的。作为一款优质的手机视频播...
- 三星固态驱动官网(三星固态官方软件)
-
三星手机序列号查询官网是http://www.samsung110.com/。手机序列号(S/N号)查询方法:设置-关于手机-状态-序列号(序号)。或通过以下方式查询:通过机器包装盒上的标贴查询用...
- 雨林木风u盘装机教程(雨林木风u盘装系统,步骤)
-
电脑系统安装步骤:1、用【u启动u盘启动盘制作工具】制作u启动盘,重启电脑等待出现开机画面按下启动快捷键,选择u盘启动进入到u启动主菜单,选取“【02】Win8PE装机维护版(新机器)”选项2、进...
- 无法连接到这个网络是怎么回事
-
有可能是网络本身有问题,需要联系运营商解决。也有可能是因为网卡驱动问题,首先鼠标右击开始按钮,然后点击设备管理器,双击网络适配器,最后查看网卡驱动有没有出现黄色的感叹号,如果有的话,右击选择更新驱动程...
- 刷机精灵怎么解除锁屏密码(刷机精灵怎么解除锁屏密码设置)
-
刷机精灵解锁手机锁屏密码方法:下载好刷机精灵。打开链接手机,之后在刷机精灵页面里能看到“实用工具”的选项。解除手机解锁图案要获取root权限,若没有获取的可以在这里点击获取root权限的选项。获取了...
- 联想云服务官网(联想云服务官网查找手机)
-
华为手机也是可以下载云服务软件安装然后使用联想账号登陆云服务的。部分云服务功能将无法使用。登录联想云服务方法:点开云服务软件,选择立即使用,即出现:手机号码登入,邮箱登入,第三方登入;手机号码登入,邮...
- 宏基笔记本系统重装快捷键(宏基笔记本重装系统步骤)
-
如果用系统u盘、光盘安装:1、需要在Bios中设置从u盘或光盘启动。2、启动电脑,dcer一般默认按Del键(有些型号F2、F12)进入Bios设置界面。F2键。宏碁笔记本重装系统按F2键,进入BIO...
- windows10官网打不开(win10系统官网打不开)
-
你可以通过以下步骤在Windows10官网上更新操作系统:1.打开windows官网,进入“下载和工具”页面。2.单击“立即下载工具”按钮,将下载“Windows10更新助手”。3.运行“...
- win7无线网卡插上没反应(win7无线网卡插上没反应怎么回事)
-
1、如果是路由器的问题,如果原来可以用,暂时不能用了,在有就是恢复出厂设置,从新设置就可以用了(这是在物理连接正确的前提下)。2、如果是宽带本身的问题,首先直接联接宽带网线测试,如果是宽带的问题,联系...
- 下载爱奇艺安装(下载爱奇艺安装包)
-
如果你的电脑无法安装爱奇艺,可能有以下原因,第一种原因可能是你的电脑系统版本太低,升级你的电脑操作系统,可以促进爱奇艺的下载,第二种情况是你下载的爱奇艺可能捆绑一些病毒软件,系统的杀毒软件识别有霸王软...
- 5000元左右的电脑配置单(5000左右的电脑配置推荐2021)
-
五千元至六千元价位电脑主机,如果组装机,可以配置配置很高的档次,电脑主机主板可以配置不低于十二代产品,可以设四个内存条插槽,相应的内存可以配置128GB内存条2至四根,电脑处理器也同样不低于十二代产品...
-
- 快速关机(快速关机按什么键)
-
1、我们直接长按手机右侧的电源键,大概5秒的时间,这时候手机页面会直接显示是否关机,选择关机就可以直接关机了。2、找到手机一侧的音量“+”键,再找到电源按键,之后只需同时按住音量“+”键和电源按钮,直到手机屏幕关闭即可强制关机。3、点击【设...
-
2025-12-25 08:05 liuian
- 云电脑免登录破解版(“云电脑破解版”)
-
虎牙YOWA云游戏平台便是一款完全免费的产品,只要玩家在自己的账号上购买过相关的产品即可通过云游戏平台直接登陆。但云游戏平台终归只是改变玩家的游戏方式,用户最终还是要回归于游戏中,如果难以保证游戏体验...
- 联想家庭版win7(联想家庭版笔记本电脑)
-
1、开机到欢迎界面时,按Ctrl+Alt+Delete,跳出帐号窗口,输入用户名:administrator,回车。2、如果这个帐号也有密码采用开机启动时按F8选“带命令行的安全模式”。3、选“Ad...
- 一周热门
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
