Python数据分析之Pandas第二练:十分钟掌握DataFrame运算
liuian 2025-04-09 17:51 36 浏览
背景
在上一篇《Python数据分析之Pandas第一练:十分钟学会创建、查看和选择数据》中,我们练习了Pandas数据对象Series和DataFrame的基础操作,本篇将再用十分钟的时间继续相关运算的练习。
运算
Pandas主要使用值np.nan表示缺失的数据。默认情况下不包含在计算中。这次的练习对象还是使用上篇中生成的df,详细的生成过程可以到上篇文章中回顾。
df1 = df.reindex(index=dates[0:4], columns=list(df.columns) + ["E"])
df1df1.loc[dates[0] : dates[1], "E"] = 1
df1.dropna(how="any") # 丢弃所有缺少数据的行
df1.fillna(value=5) # 填充丢失值
pd.isna(df1) # 获取nan值的布尔判断结果
df.mean(0) # 默认值为0,按列进行统计
df.mean(1) # 1按行进行统计当运算对象具有不同的维度并且需要形状一致时,Pandas会自动按照指定的维数进行广播.
s = pd.Series([1, 3, 5, np.nan, 6, 8], index=dates).shift(2)
df.sub(s, axis="index") # 计算df - sdf.apply(np.cumsum) # 将NumPy的累加函数应用到df上
df.apply(lambda x: x.max() - x.min()) # 计算最大、最小值之差
s.value_counts() # 统计每类值的频数str属性中配备了一些序列数据(Series)的字符串处理方法,使得在数组的每个元素上操作时非常简单。需要注意的是,默认情况下,str中的模式匹配通常使用正则表达式(在某些情况下总是使用它们)。
s = pd.Series(["A", "B", "C", "Aaba", "Baca", np.nan, "CABA", "dog", "cat"])
s.str.lower() # 将s的值转变为小写,空值不生效Pandas提供了各种功能,可以在join / merge-type操作的情况下将串联和数据框对象与各种索引和关系代数功能的设置逻辑相结合。
df = pd.DataFrame(np.random.randn(10, 4))
pieces = [df[:3], df[3:7], df[7:]]
pd.concat(pieces)left = pd.DataFrame({"key": ["foo", "foo"], "lval": [1, 2]})
right = pd.DataFrame({"key": ["foo", "foo"], "rval": [4, 5]})
pd.merge(left, right, on="key")left1 = pd.DataFrame({"key": ["foo", "bar"], "lval": [1, 2]})
right1 = pd.DataFrame({"key": ["foo", "bar"], "rval": [4, 5]})
pd.merge(left1, right1, on="key")聚合操作涉及到下面步骤中的一个或者多个内容:
- 按照条件把数据分成多个组
- 对每个数据组单独用函数处理
- 把处理后的数据结果整合到一起
df = pd.DataFrame(
{
"A": ["foo", "bar", "foo", "bar", "foo", "bar", "foo", "foo"],
"B": ["one", "one", "two", "three", "two", "two", "one", "three"],
"C": np.random.randn(8),
"D": np.random.randn(8)
}
)
df.groupby("A").sum()
df.groupby(["A", "B"]).sum()熟练使用Excel的伙伴们会觉得这个操作跟透视表如出一辙,确实是这样的。
一起练习吧
以上就是这次练习的主要内容,大家一起练习来吧。如有问题可随时留言交流~~~
相关推荐
- 十大最好用的浏览器(市面上最好用的浏览器)
-
1、谷歌chrone 谷歌美国Google公司开发的一款浏览器,谷歌浏览器的特点就是界面简洁,速度快不卡顿,内容全面,你想要找到内容上面都有,就是在安装插件的方面会比较麻烦,不过看在它那么好用的份...
- ipad充不上电了怎么办(ipad充不上电怎么办但显示在充电)
-
原因和解决办法: 1、ipad充不进去电很可能是充电线的原因,假如大家在给ipad充电的时候以前经常有过接触不良的情况,那么,你就需要考虑更换充电线了。 2、第二,就是接口问题了,或者说是充电...
- 怎样取消开机启动项目(如何取消开机启动程序)
-
在Windows操作系统中,有一些程序或服务可能会在计算机启动时自动运行,这些程序或服务也被称为开机启动项。如果您希望在启动Windows时减少计算机运行的程序或服务数量,您可以关闭一些开机启...
- 纯净版win7完整版ghost下载(纯净版的win7)
-
1、去微软官方网站下载。2、去系统之家下载,我自己的win10就是从哪里下载安装的,你可以试试哈。ghost镜像的使用一、备份主分区--C盘:假设你的操作系统安装在主分区--C盘,当系统重装不久,或...
- 联想台式机重装系统按哪个键
-
联想电脑第一部,如果像进入装系统的界面,必须按f8,if8进入装系统的界面,这时候把下载好的U盘系统安装包直接插在主机上,直接就可以安装系统了,大概20分钟后就可以安装系统,安装系统就可以正常使用了...
- 360无法卸载怎么办(360卸载不了最简单三个步骤)
-
开启了自我保护,关闭即可。解决方法如下:准备材料:360安全卫士、电脑1、在电脑上打开安全卫士,进去之后,点击右上方的列表图标,选择设置,2、进去安全卫士设置界面之后,点击安全防护中心,3、进去安全防...
- 戴尔笔记本电脑没有声音怎么解决
-
右击“我的电脑”----“属性”---“硬件”----“设备管理器”,打开“声音、视频和游戏控制器”有无问题,即看前面有没有出现黄色的小图标,如有,重新安装这个设备的驱动程序进行解决。加强麦克风:右...
- 如何给无线路由器设置密码(如何给无线路由器设置密码教程)
-
1、使用路由器的管理界面,找到密码设置选项,输入想要设置的新密码。 2、再次输入新密码,以便确认输入的密码正确无误。 3、保...
- windows7旗舰版激活序列号(win7旗舰 激活码)
-
一、Windows7旗舰版激活密钥零售版:Windows7UltimateRetail永久序列号【尝试联网激活,如果不能激活,可电话激活】[Key]:RHTBY-VWY6D-QJRJ9-JGQ...
- 联想电脑如何重置系统(联想电脑 重置系统)
-
联想进入bios界面重置系统方法:1、将电脑关机,按下一键恢复按钮(需确保笔记本屏盖在打开状态),不同的联想笔记本机型按钮位置不同,操作也不一样1)如果是此按钮,按住5秒钟等待出现还原界面2)针孔式按...
- 电脑加密文件夹怎么弄(电脑加密文件夹怎么弄出来)
-
要在电脑中加密文件夹,可以使用加密软件或操作系统提供的加密功能。使用加密软件,你可以选择文件夹并设置密码来保护其内容。这样,只有输入正确密码的人才能访问文件夹中的文件。另外,某些操作系统也提供了加密文...
- win11打游戏现在稳定吗(win11玩游戏流畅吗)
-
win11适合打游戏的。主要原因如下:1、win11的升级并不会丢失原本系统中的文件和软件,因此用户可以在升级后直接玩原本的游戏。2、win11虽然是一款新系统,但是在游戏性能的表现上已经有着非常好的...
- 无法连接到共享打印机(无法连接到共享打印机是啥情况)
-
这个有多种原因,主要是要启动来宾guest帐户,装好驱动,设置同一工作组,在同一局域网条件下,重新添加打印机就可以了。1、依次展开“计算机管理(本地)—系统工具—本地用户和组—用户”,找到G...
- 注册qq号免费立即申请不用手机号
-
1、先在网页上搜索安装谷歌浏览器2、安装完成后,不要在电脑上登录任何一个QQ,打开QQ登录的界面,点击注册账号。3、在注册账号的页面,填上相应要求的信息,手机号码的部分先不要填。4、点击谷歌浏览器右上...
- office2016破解版安装教程(office2016下载破解版)
-
microsoftoffice2016激活与破解的区别是版本不同。①尽量使用官方的原版程序、原版软件,避免使用来路不明的"XX"版。②若程序对非正版授权用户有功能或使用期限制,但仍能满...
- 一周热门
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
