pandas知识课堂:apply和agg函数,如何传递参数?
liuian 2025-01-13 15:32 46 浏览
在数据处理过程中,我们在使用apply和agg函数的时候,一般都是直接使用自定义函数的名称,即默认带入自定义函数中的只有1个隐式参数(每个分组)。比如下面的例子:
df = pd.read_excel('d:/fqb/2/tmp.xlsx')
g = df.groupby(['name','year'])
def fm(sr):
return sr.unique()
res = g.agg({'rev':sum, 'bj':fm})
print(res.reset_index()) name year rev bj
0 大狗 2020 3 [2020dg1, 2020dg2]
1 大狗 2021 3 [2021dg]
2 大狗 2022 9 [2022dg]
3 李四 2019 21 [lisi]
4 李四 2021 19 [lisi]我们在agg()中的字典里,对bj列使用自定义函数fm时,直接用的是fm的名称,在定义自定义函数时,即def fm(sr),我们加入了隐式的参数sr,这里sr是每个分组(pd.Series)。
但是,我们想在自定义函数fm中传递参数,应该如何使用呢?
一、agg中传递参数
方法1:使用lambda
df = pd.read_excel('d:/fqb/2/tmp.xlsx')
g = df.groupby(['name','year'])
def fm(sr,tmp):
res = sr.unique()
res = [tmp+s for s in res]
return '、'.join(res)
res = g.agg({'rev':sum, 'bj':lambda sr:fm(sr,'BJ_')})
print(res.reset_index()) name year rev bj
0 大狗 2020 3 BJ_2020dg1、BJ_2020dg2
1 大狗 2021 3 BJ_2021dg
2 大狗 2022 9 BJ_2022dg
3 李四 2019 21 BJ_lisi
4 李四 2021 19 BJ_lisi注意,agg()中的字典键值对'bj':lambda sr:fm(sr,'BJ_'),直接使用自定义函数是'bj':fm,定义def fm(sr);而这里使用的'bj': lambda sr: fm(sr,'BJ_'),定义def fm(sr,tmp)。
这里传递了参数'BJ_',将这个字符串带入到自定义函数fm中,将每个分组中的元素前面加上这个字符串。同理,我们可以传递2个参数 'bj': lambda sr: fm(sr,'BJ_', 4),定义def fm(sr,tmp, num)。参数'BJ_'是字符串,参数4是数值,定义def fm()中有3个参数。
方法2:使用partial绑定自定义函数和传递的参数
from functools import partial
df = pd.read_excel('d:/fqb/2/tmp.xlsx')
g = df.groupby(['name','year'])
def fm(sr,tmp, num):
res = sr.unique()
res = [tmp + str(num) + '_' +s for s in res]
return '、'.join(res)
new_fm = partial(fm, tmp='BJ_', num = 4)
res = g.agg({'rev':sum, 'bj':new_fm})
print(res.reset_index()) name year rev bj
0 大狗 2020 3 BJ_4_2020dg1、BJ_4_2020dg2
1 大狗 2021 3 BJ_4_2021dg
2 大狗 2022 9 BJ_4_2022dg
3 李四 2019 21 BJ_4_lisi
4 李四 2021 19 BJ_4_lisi这里使用partial函数将函数fm和2个传递的参数进行绑定,然后将新函数new_fm,作为agg中的聚合函数来使用。
二、apply中传递参数
df = pd.read_excel('d:/fqb/2/tmp.xlsx')
g = df.groupby(['name','year'])
def fm(dj):
res = dj.shape[0]
return res
res = g.apply(fm)
print(res.reset_index()) name year 0
0 大狗 2020 2
1 大狗 2021 1
2 大狗 2022 2
3 李四 2019 3
4 李四 2021 2使用apply得到按name和year分组的每组(DataFrame类型)的行数。结果只保留了2个分组列和fm返回的结果组成的1列。
df = pd.read_excel('d:/fqb/2/tmp.xlsx')
def fm(ve,num):
return ve + num
res = df['rev'].apply(fm, args=(1.2,))
print(res)将df的rev列的每个元素都加上1.2。
df = pd.read_excel('d:/fqb/2/tmp.xlsx')
def fm(ve,num, rate):
return (ve + num)*(1+rate)
res = df['rev'].apply(fm, args=(1,0.1))
print(res)将df的rev列的每个元素都加上1后再增加10%(0.1)。
df = pd.read_excel('d:/fqb/2/tmp.xlsx')
def fm(row,num, rate):
res = row['sex'] + '_' + row['bj']
return res + str(num) + '_' + str(rate)
res = df.apply(fm, args=(1,0.1), axis=1)
print(res)使用整个df,而不是df的某个列。这里row就是df的一行数据,axis=1是按行读取,row可以直接按列名称提取该行的值。
相关推荐
- 不用电脑怎么恢复(不用电脑怎么恢复出厂设置)
-
操作方法01方法一:通过设置重置电脑使用快捷键Windows+A,点击所有设置,点击更新系统-恢复,重置此电脑点开始。02选择仅保留我的文件,删除应用和设置,提示窗口会显示出将被删除的应用,点击下一步...
- 最强视频播放器(2020视频播放器排行榜前十名)
-
应该是MXPlayer。他是一款安卓版上十分强悍的视频播放器,他以解码性能强、兼容性高而闻名,并且,对视频字幕的支持更是堪称一绝,支持在线匹配,对特效字幕的支持也是非常的高的。作为一款优质的手机视频播...
- 三星固态驱动官网(三星固态官方软件)
-
三星手机序列号查询官网是http://www.samsung110.com/。手机序列号(S/N号)查询方法:设置-关于手机-状态-序列号(序号)。或通过以下方式查询:通过机器包装盒上的标贴查询用...
- 雨林木风u盘装机教程(雨林木风u盘装系统,步骤)
-
电脑系统安装步骤:1、用【u启动u盘启动盘制作工具】制作u启动盘,重启电脑等待出现开机画面按下启动快捷键,选择u盘启动进入到u启动主菜单,选取“【02】Win8PE装机维护版(新机器)”选项2、进...
- 无法连接到这个网络是怎么回事
-
有可能是网络本身有问题,需要联系运营商解决。也有可能是因为网卡驱动问题,首先鼠标右击开始按钮,然后点击设备管理器,双击网络适配器,最后查看网卡驱动有没有出现黄色的感叹号,如果有的话,右击选择更新驱动程...
- 刷机精灵怎么解除锁屏密码(刷机精灵怎么解除锁屏密码设置)
-
刷机精灵解锁手机锁屏密码方法:下载好刷机精灵。打开链接手机,之后在刷机精灵页面里能看到“实用工具”的选项。解除手机解锁图案要获取root权限,若没有获取的可以在这里点击获取root权限的选项。获取了...
- 联想云服务官网(联想云服务官网查找手机)
-
华为手机也是可以下载云服务软件安装然后使用联想账号登陆云服务的。部分云服务功能将无法使用。登录联想云服务方法:点开云服务软件,选择立即使用,即出现:手机号码登入,邮箱登入,第三方登入;手机号码登入,邮...
- 宏基笔记本系统重装快捷键(宏基笔记本重装系统步骤)
-
如果用系统u盘、光盘安装:1、需要在Bios中设置从u盘或光盘启动。2、启动电脑,dcer一般默认按Del键(有些型号F2、F12)进入Bios设置界面。F2键。宏碁笔记本重装系统按F2键,进入BIO...
- windows10官网打不开(win10系统官网打不开)
-
你可以通过以下步骤在Windows10官网上更新操作系统:1.打开windows官网,进入“下载和工具”页面。2.单击“立即下载工具”按钮,将下载“Windows10更新助手”。3.运行“...
- win7无线网卡插上没反应(win7无线网卡插上没反应怎么回事)
-
1、如果是路由器的问题,如果原来可以用,暂时不能用了,在有就是恢复出厂设置,从新设置就可以用了(这是在物理连接正确的前提下)。2、如果是宽带本身的问题,首先直接联接宽带网线测试,如果是宽带的问题,联系...
- 下载爱奇艺安装(下载爱奇艺安装包)
-
如果你的电脑无法安装爱奇艺,可能有以下原因,第一种原因可能是你的电脑系统版本太低,升级你的电脑操作系统,可以促进爱奇艺的下载,第二种情况是你下载的爱奇艺可能捆绑一些病毒软件,系统的杀毒软件识别有霸王软...
- 5000元左右的电脑配置单(5000左右的电脑配置推荐2021)
-
五千元至六千元价位电脑主机,如果组装机,可以配置配置很高的档次,电脑主机主板可以配置不低于十二代产品,可以设四个内存条插槽,相应的内存可以配置128GB内存条2至四根,电脑处理器也同样不低于十二代产品...
-
- 快速关机(快速关机按什么键)
-
1、我们直接长按手机右侧的电源键,大概5秒的时间,这时候手机页面会直接显示是否关机,选择关机就可以直接关机了。2、找到手机一侧的音量“+”键,再找到电源按键,之后只需同时按住音量“+”键和电源按钮,直到手机屏幕关闭即可强制关机。3、点击【设...
-
2025-12-25 08:05 liuian
- 云电脑免登录破解版(“云电脑破解版”)
-
虎牙YOWA云游戏平台便是一款完全免费的产品,只要玩家在自己的账号上购买过相关的产品即可通过云游戏平台直接登陆。但云游戏平台终归只是改变玩家的游戏方式,用户最终还是要回归于游戏中,如果难以保证游戏体验...
- 联想家庭版win7(联想家庭版笔记本电脑)
-
1、开机到欢迎界面时,按Ctrl+Alt+Delete,跳出帐号窗口,输入用户名:administrator,回车。2、如果这个帐号也有密码采用开机启动时按F8选“带命令行的安全模式”。3、选“Ad...
- 一周热门
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
