百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

超实用!用Python快速实现数据分组统计与透视表

liuian 2025-01-13 15:31 36 浏览

在Python数据分析领域,Pandas库中的GroupBy功能提供了强大的数据分组和聚合能力。通过GroupBy,我们可以根据一个或多个列对DataFrame进行分割、应用函数并重新组合结果,从而实现数据集的深入分析和统计。本文将详细介绍如何使用Pandas GroupBy进行分组统计,并结合实际代码示例展示其应用场景。

GroupBy基础操作

假设我们有一个包含用户购买记录的数据集:

import pandas as pd

# 创建一个简单的DataFrame
data = {'User': ['Alice', 'Bob', 'Charlie', 'Alice', 'Bob', 'Charlie'],
        'Product': ['Apple', 'Banana', 'Orange', 'Apple', 'Banana', 'Orange'],
        'Quantity': [3, 2, 1, 4, 5, 3],
        'Price': [0.5, 0.25, 0.75, 0.5, 0.25, 0.75]}
df = pd.DataFrame(data)

print(df)
  • 按单一列分组
grouped = df.groupby('User')

# 计算每个用户的总购买量(Quantity之和)
total_quantity = grouped['Quantity'].sum()
print(total_quantity)

# 计算每个用户的总消费金额(Quantity * Price之和)
total_spending = grouped[['Quantity', 'Price']].sum().prod(axis=1)
print(total_spending)
  • 按多个列分组
grouped_multi = df.groupby(['User', 'Product'])

# 每个用户对每种产品的购买总量
product_purchases = grouped_multi['Quantity'].sum()
print(product_purchases)

更复杂的分组统计操作

1. 应用自定义函数

# 计算每个用户购买产品种类的数量
unique_products_per_user = df.groupby('User')['Product'].nunique()
print(unique_products_per_user)

2. 使用agg方法进行多重聚合

# 对每个用户计算购买量的平均值和总和
aggregated_stats = df.groupby('User')['Quantity'].agg(['mean', 'sum'])
print(aggregated_stats)

3. 分层索引与透视表

# 创建一个带有层次索引的分组统计结果
multi_index_grouped = df.groupby(['User', 'Product']).sum()

# 将多级索引的结果转换为透视表形式
pivot_table = multi_index_grouped.unstack()
print(pivot_table)

进阶应用及注意事项

  • 分组后的过滤操作:可以结合filter()方法,在分组后对满足特定条件的组进行筛选。
  • 处理缺失值:在执行分组操作前,应先对数据进行清洗,处理缺失值,以避免影响分组结果。
  • 性能优化:对于大型数据集,可利用groupby()配合apply()函数分块处理数据,提高运算效率。

总结

Pandas GroupBy功能是数据分析过程中的重要工具,它能够帮助我们从不同维度深入理解数据,发现隐藏的规律和趋势。熟练掌握GroupBy的各种用法,将极大地提升Python Web开发中数据处理的能力,特别是在数据挖掘、报表生成以及机器学习特征工程等场景中发挥关键作用。

关注我,手把手带你快速入门 AI 机器学习编程!

相关推荐

一个win10密钥能激活几台电脑

零售版的密钥只能激活一台电脑,VOL版的能够批量激活。切实而今根基上用东西的人比较多,那样比较便当,提议也能够碰运气。软件可以正确辨认用户计较机上布置的悉数office版本和windows版本,包括w...

电脑城买电脑(电脑城买电脑装了盗版系统)

不太靠谱。首先电脑城的电脑同个款式配置很凌乱,要么来个阉割版、要么来个升级版,而所谓升级往往会以次充好,为的就是让你觉得少花了钱还买到了更好的配置。其次电脑城的销售人员大部分都是那种半懂的非专业人员,...

win11很多游戏不兼容(win11不兼容的游戏)

据我们了解,Windows11系统和传奇游戏之间没有直接的冲突或不兼容问题。然而,可能有一些间接的原因导致此问题。首先,传奇游戏是一款老游戏,可能需要在Windows11系统上运行一些兼容性设置或...

华为路由器登录(华为路由器登录入口手机版)

华为路由器的登录地址是192.168.3.1,电脑/手机连接到华为路由器的网络后,在浏览器中输入192.168.3.1,就能进入登录入口。然后输入登录密码,可以进入华为路由器的设置页面。华为wifi设...

固态硬盘的缺点(固态硬盘缺点和坏处)

1.价格与容量  固态硬盘的容量和价格都要比机械硬盘贵  2.物理特性  固态硬盘无噪音,抗震动,体积小,发热量低,功耗也非常低,工作温度范围很大!固态硬盘的内部并没有任何机械活动部件,没有马达和风...

联想自带系统怎么重装(联想电脑自带系统如何重装系统)

联想电脑重装系统步骤:1、制作好U盘启动盘,然后把下载的联想win7系统iso文件直接复制到U盘的GHO目录下:2、在联想电脑上插入U盘,重启后不停按F12或Fn+F12快捷键打开启动菜单,选择U盘项...

电脑设置自动关机软件(电脑设置自动关机程序)
  • 电脑设置自动关机软件(电脑设置自动关机程序)
  • 电脑设置自动关机软件(电脑设置自动关机程序)
  • 电脑设置自动关机软件(电脑设置自动关机程序)
  • 电脑设置自动关机软件(电脑设置自动关机程序)
笔记本亮度调节快捷键(调亮笔记本电脑屏幕亮度快捷键)

在键盘最上一排“F”打头的键中,标有小太阳的就是调节亮度的快捷键。“小太阳-”是调低,“小太阳+”是调高。有些笔记本电脑直接按这个键就可以调节,有些需要同时按住Fn(一般Fn在键盘左下角,ctrl右...

手机一键还原(iphone手机一键还原)

如果你希望恢复华为手机上的一键锁屏功能,你可以按照以下步骤进行操作:1.进入设置:在你的华为手机上,打开设置应用程序。你可以在应用抽屉中找到该应用,通常是一个齿轮或者包含「设置」字样的图标。2.寻...

系统修复u盘(优盘系统修复)

1、我们在网络中,找到修复软件U盘烧录修复(PortFreeProductionProgram)v3.27,记得不需要太高级的版本,这个比较好用。  2、打开软件,出现的页面是,初始状态下,看到...

sony笔记本u盘启动快捷键(索尼笔记本u盘快速启动键)

索尼笔记本按assist按键快捷键进入u盘启动索尼笔记本进入U盘启动的步骤:1、索尼笔记本位于键盘右上角有一个ASSIST的按键,首先按这个键就可以进入vaiocare的设置。2、通过按ASSIST...

win7旗舰版密匙(正版win7旗舰版密钥)

一、Windows7旗舰版激活密钥零售版:Windows7UltimateRetail永久序列号【尝试联网激活,如果不能激活,可电话激活】[Key]:RHTBY-VWY6D-QJRJ9-JGQ...

ip怎么改地址(怎么改ip地区)
  • ip怎么改地址(怎么改ip地区)
  • ip怎么改地址(怎么改ip地区)
  • ip怎么改地址(怎么改ip地区)
  • ip怎么改地址(怎么改ip地区)
一键ghost备份还原工具绿色版硬盘版

可以的。1.打开GHOST软件,接受许可协议,点击OK。2.从图像中选择Local→Partition→,3.选择镜像文件所在的分区,找到镜像文件(winxp.gho),然后单击enter。4.显示镜...

2010office官方下载免费完整版
  • 2010office官方下载免费完整版
  • 2010office官方下载免费完整版
  • 2010office官方下载免费完整版
  • 2010office官方下载免费完整版