百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

Pandas第1课:吃透Series,你就算Pandas入门了!

liuian 2025-02-15 16:31 11 浏览

Numpy和Pandas是Python在AI领域里最最核心的两个库,对这两个库的掌握程度直接决定了你用Python进军AI的困难程度,我有另外一个合集专门是练习Numpy的,有兴趣的可以去看一下,在本合集中,我将用 10 篇左右的小文章将Pandas的理论知识让大家吃透,至于Pandas的100练,我也会开一个新的合集。

这篇文章我只讲跟Pandas的Series相关的话题,因为到现在我才意识到,Pandas的两大数据结构,DataFrame是基于Series构建的,而Series又是基于Numpy构建的,所以Series就是连接Pandas和Numpy的桥梁!

先看看Pandas中的Series长什么样:

上面两段代码分别用了一个整数型的Python列表和字符串型的Python列表构建了Pandas中的Series对象。

上面的代码是先通过Python的列表构建了一个Numpy数组,然后又用Numpy数组构建了一个Pandas的Series对象。

上面的代码直接通过一个Python的字典构建了一个新的Pandas的Series对象,通过这三种构建方式,你是否已对Series的“外观”有了感觉?

Series的基本概念【序列】

Pandas库的Series数据结构是一个一维标签化数组,可以存储任意数据类型(整数、字符串、浮点数、Python对象等)。每个元素都有一个与之关联的标签,也称为索引。默认情况下,每个元素的索引是从0开始的整数序列,但是也可以明确地指定索引的值。

Pandas的Series数据结构是基于Numpy数组构建的。这意味着Series在内部使用Numpy数组来存储数据,因此它继承了Numpy数组的许多特性,如元素级运算、广播等。但是,与Numpy数组不同的是,Series能够存储具有不同数据类型的元素,并且每个元素都有一个标签(在Numpy数组中,所有元素必须具有相同的数据类型,并且没有标签)。

Series的应用场景:

  1. 时间序列数据:Series非常适合处理时间序列数据,比如股票价格、天气数据等。可以将时间戳设置为索引,方便地进行时间序列相关的操作,如时间范围切片、频率转换等。
  2. 任何需要一维标签数组的场景:无论是存储人员名单、考试分数还是其他任何类型的有序或无序数据,Series都能够提供一个方便且效率高的解决方案。
  3. 替代Python字典:与字典相比,Series提供了更丰富的功能和更高的性能,特别是在处理大数据集时。可以使用Series来进行快速的查找、更新和删除操作。

Pandas的Series提供了一个灵活且高效的数据结构,适用于处理各种一维数据,尤其是时间序列数据。借助于其基于Numpy的设计,Series不仅能够提供高性能的数值计算,还能够轻松地与其他Pandas数据结构(如DataFrame)集成,使得数据处理和分析变得更加方便快捷。

Series的选择操作

我们先构建一个新的Series对象,然后在其基础之上看一看Series都有哪些常用的基本操作:

按索引选择一个:

选择一个时相当于直接去取值,可以使用经典的[]方法,也可以使用内置的loc方法。

按位置选择一个:

当要按位置进行选择的时候,经典的[]操作便不再生效,需要使用loc函数的位置变体iloc函数。

标签切片选择:

标签切片选择时可使用经典的[]切片方式,也可以使用loc函数的切片方式。

位置切片选择:

位置切片选择时采用的方式跟标签切片选择的方式类似,只不过要明白loc函数和iloc函数的区别,iloc前面添加了一个字母i用于表示“位置”,故凡是涉及到通过位置的相关操作,需要使用 iloc函数,凡是需要通过标签的操作,需要使用 loc函数。

Series的赋值操作

上面的代码通过使用[]和loc函数的方式,基于标签的选择或基于标签的切片实现了Series的赋值操作。

上面的代码通过位置的方式选择了一个元素或通过位置切片选择了多个元素进行赋值,注意,使用[]进行切片选择在Pandas的当前版本中被视为过期的操作,后续大家在通过位置对Series进行切片选择时,请统一使用iloc函数来完成。

Series的删除

通过使用drop方法可以在传入标签列表的情况下进行Series内部元素的删除,注意drop方法接收的是标签的列表,不支持在此直接进行标签切片进行选择,也不直接支持按位置进行选择,如果想实现切片选择删除或位置选择删除,需要借助比如loc或iloc方法先选择出要删除的元素标签列表,传递进drop方法再进行删除:

Series的排序

Series的排序支持按索引排序,也支持按元素值排序,Pandas给我们提供了两个堪称完美的方法,我们直接使用即可:

Series的基本统计

Series重置索引

在Pandas中,你可以使用 Series.reindex() 方法来重新设置Series的索引。这个方法允许你按照新的索引顺序来调整Series的数据。如果新索引中包含原始Series中不存在的标签,则会在相应的位置上引入缺失值(NaN)。

小结

读到这里,我相信你对Pandas中的Series应该有了一个直观的了解,而且有了一种想现在上手直接去实际操作一下Series的冲动,因为你已经通过对Series的了解发现了Pandas的魅力!你的直觉是对的,如果你也想进军 AI 领域,现在就抓紧实操起来吧!

相关推荐

x-cmd install | jellex - 用 Python 语法在终端里玩转 JSON 数据!

还在为命令行下处理JSON数据烦恼吗?jellex来了!它是一款基于终端的交互式JSON和JSONLines数据处理工具,让你用熟悉的Python语法,轻松过滤、转换和探索JSO...

一篇长文带你在Python里玩转Json数据

Json简介Json(JavaScriptObjectNotation)很多网站都会用到Json格式来进行数据的传输和交换,就像上篇我提到的网易云音乐接口,它们返回的数据都是Json格式的。这因为...

Python JSON 魔法手册:数据转换的终极艺术

对话实录小白:(崩溃)我从API拿到了JSON数据,怎么变成Python对象?专家:(掏出魔法书)用json模块,轻松实现数据转换!JSON基础三连击1.字符串Python对...

Python JSON 详解教程(python json())

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式(lightweightdatainterchangeformat)常用于Web应用、配置文件(co...

Python 数据的 JSON 格式序列化及反序列化

在Python中,将数据转换为JSON格式非常简单,可以使用内置的json模块。json模块提供了json.dumps()和json.dump()方法,用于将Python对象...

如何使Python类可JSON序列化(python json 类)

技术背景在Python开发中,JSON(JavaScriptObjectNotation)是一种常用的数据交换格式。然而,Python的json模块默认只能序列化一些基本数据类型,如字典、列表、字...

详细介绍一下Python如何对JSON格式数据进行处理?

在Python中对于JSON数据的处理是在日常开发中的常见需求之一。通常情况下,对JSON数据的处理主要涉及到如下的的几个步骤对于JSON数据的解析操作对于JSON数据的处理操作对于JSON数据的格式...

Python 字典l转换成 JSON(python转化字典)

本文需要5分钟。如果对您有用可以点赞评论关注.Python字典到JSONJSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式,它基于ECMAScrip...

打造熟悉的VS界面风格(vs界面设计美化)

用惯了老机子的VS界面,换新机子时,各种不适应。现在重新打造老款样式:1)下载VisualStudio2013ColorThemeEditorhttps://marketplace.vis...

办公小技巧:全部亮相 让Excel单元格完全显示文本

平时我们在使用Excel制作表格的时候,经常会遇到由于文本内容较多,导致这些内容无法在一个单元格中完全显示。常规的方法是将单元格设置为“自动换行”,但是这样会影响整个文件的美观。下例是某小区的入住登记...

WinForms 中的 CheckBox 控件使用指南

在WinForms中,CheckBox控件是一个允许用户选择或取消选择的单选按钮。它通常用于表示布尔值(真/假)或允许多选的情况。以下是如何使用CheckBox控件的一些基本信息和示例代码。创建...

图片转文字--四种OCR工具的安装和使用

本文仅测试简单的安装和使用,下一步应该是测试不同数据集下的检测准确率和检测效率,敬请期待。作者的系统环境是:笔记本:ThindPadP520OS:win11显卡:QuadroP520一、EasyO...

C# 给Word每一页设置不同图片水印

Word中设置水印时,可加载图片设置为水印效果,但通常添加水印效果时,会对所有页面都设置成统一效果,如果需要对每一页或者某个页面设置不同的水印效果,则可以参考本文中的方法。下面,将以C#代码为例,对W...

集成的面向对象控件Xtreme Controls正式发布v17.0.0

CodejockXtremeControls为Windows图形用户软件工程师提供众多的有关MFC的控件产品,该产品是通过完全测试并专门为图形用户设计的一款专业控件。它是一款集成了面向对象的控件被...

Win10 Build 10061老问题修复新问题来

|责编:刘菲菲【中关村在线软件资讯】4月23日消息:微软今天正式推送了Windows10Build10061预览版这个版本除了正常的功能更新和调整外,还修复了多个bug。其中一部分对于开发者开...