百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

Pandas第1课:吃透Series,你就算Pandas入门了!

liuian 2025-02-15 16:31 27 浏览

Numpy和Pandas是Python在AI领域里最最核心的两个库,对这两个库的掌握程度直接决定了你用Python进军AI的困难程度,我有另外一个合集专门是练习Numpy的,有兴趣的可以去看一下,在本合集中,我将用 10 篇左右的小文章将Pandas的理论知识让大家吃透,至于Pandas的100练,我也会开一个新的合集。

这篇文章我只讲跟Pandas的Series相关的话题,因为到现在我才意识到,Pandas的两大数据结构,DataFrame是基于Series构建的,而Series又是基于Numpy构建的,所以Series就是连接Pandas和Numpy的桥梁!

先看看Pandas中的Series长什么样:

上面两段代码分别用了一个整数型的Python列表和字符串型的Python列表构建了Pandas中的Series对象。

上面的代码是先通过Python的列表构建了一个Numpy数组,然后又用Numpy数组构建了一个Pandas的Series对象。

上面的代码直接通过一个Python的字典构建了一个新的Pandas的Series对象,通过这三种构建方式,你是否已对Series的“外观”有了感觉?

Series的基本概念【序列】

Pandas库的Series数据结构是一个一维标签化数组,可以存储任意数据类型(整数、字符串、浮点数、Python对象等)。每个元素都有一个与之关联的标签,也称为索引。默认情况下,每个元素的索引是从0开始的整数序列,但是也可以明确地指定索引的值。

Pandas的Series数据结构是基于Numpy数组构建的。这意味着Series在内部使用Numpy数组来存储数据,因此它继承了Numpy数组的许多特性,如元素级运算、广播等。但是,与Numpy数组不同的是,Series能够存储具有不同数据类型的元素,并且每个元素都有一个标签(在Numpy数组中,所有元素必须具有相同的数据类型,并且没有标签)。

Series的应用场景:

  1. 时间序列数据:Series非常适合处理时间序列数据,比如股票价格、天气数据等。可以将时间戳设置为索引,方便地进行时间序列相关的操作,如时间范围切片、频率转换等。
  2. 任何需要一维标签数组的场景:无论是存储人员名单、考试分数还是其他任何类型的有序或无序数据,Series都能够提供一个方便且效率高的解决方案。
  3. 替代Python字典:与字典相比,Series提供了更丰富的功能和更高的性能,特别是在处理大数据集时。可以使用Series来进行快速的查找、更新和删除操作。

Pandas的Series提供了一个灵活且高效的数据结构,适用于处理各种一维数据,尤其是时间序列数据。借助于其基于Numpy的设计,Series不仅能够提供高性能的数值计算,还能够轻松地与其他Pandas数据结构(如DataFrame)集成,使得数据处理和分析变得更加方便快捷。

Series的选择操作

我们先构建一个新的Series对象,然后在其基础之上看一看Series都有哪些常用的基本操作:

按索引选择一个:

选择一个时相当于直接去取值,可以使用经典的[]方法,也可以使用内置的loc方法。

按位置选择一个:

当要按位置进行选择的时候,经典的[]操作便不再生效,需要使用loc函数的位置变体iloc函数。

标签切片选择:

标签切片选择时可使用经典的[]切片方式,也可以使用loc函数的切片方式。

位置切片选择:

位置切片选择时采用的方式跟标签切片选择的方式类似,只不过要明白loc函数和iloc函数的区别,iloc前面添加了一个字母i用于表示“位置”,故凡是涉及到通过位置的相关操作,需要使用 iloc函数,凡是需要通过标签的操作,需要使用 loc函数。

Series的赋值操作

上面的代码通过使用[]和loc函数的方式,基于标签的选择或基于标签的切片实现了Series的赋值操作。

上面的代码通过位置的方式选择了一个元素或通过位置切片选择了多个元素进行赋值,注意,使用[]进行切片选择在Pandas的当前版本中被视为过期的操作,后续大家在通过位置对Series进行切片选择时,请统一使用iloc函数来完成。

Series的删除

通过使用drop方法可以在传入标签列表的情况下进行Series内部元素的删除,注意drop方法接收的是标签的列表,不支持在此直接进行标签切片进行选择,也不直接支持按位置进行选择,如果想实现切片选择删除或位置选择删除,需要借助比如loc或iloc方法先选择出要删除的元素标签列表,传递进drop方法再进行删除:

Series的排序

Series的排序支持按索引排序,也支持按元素值排序,Pandas给我们提供了两个堪称完美的方法,我们直接使用即可:

Series的基本统计

Series重置索引

在Pandas中,你可以使用 Series.reindex() 方法来重新设置Series的索引。这个方法允许你按照新的索引顺序来调整Series的数据。如果新索引中包含原始Series中不存在的标签,则会在相应的位置上引入缺失值(NaN)。

小结

读到这里,我相信你对Pandas中的Series应该有了一个直观的了解,而且有了一种想现在上手直接去实际操作一下Series的冲动,因为你已经通过对Series的了解发现了Pandas的魅力!你的直觉是对的,如果你也想进军 AI 领域,现在就抓紧实操起来吧!

相关推荐

教你把多个视频合并成一个视频的方法

一.情况介绍当你有一个m3u8文件和一个目录,目录中有连续的视频片段,这些片段可以连成一段完整的视频。m3u8文件打开后像这样:m3u8文件,可以理解为播放列表,里面是播放视频片段的顺序。视频片段像这...

零代码编程:用kimichat合并一个文件夹下的多个文件

一个文件夹里面有很多个srt字幕文件,如何借助kimichat来自动批量合并呢?在kimichat对话框中输入提示词:你是一个Python编程专家,完成如下的编程任务:这个文件夹:D:\downloa...

Java APT_java APT 生成代码

JavaAPT(AnnotationProcessingTool)是一种在Java编译阶段处理注解的工具。APT会在编译阶段扫描源代码中的注解,并根据这些注解生成代码、资源文件或其他输出,...

Unit Runtime:一键运行 AI 生成的代码,或许将成为你的复制 + 粘贴神器

在我们构建了UnitMesh架构之后,以及对应的demo之后,便着手于实现UnitMesh架构。于是,我们就继续开始UnitRuntime,以用于直接运行AI生成的代码。PS:...

挣脱臃肿的枷锁:为什么说Vert.x是Java开发者手中的一柄利剑?

如果你是一名Java开发者,那么你的职业生涯几乎无法避开Spring。它如同一位德高望重的老国王,统治着企业级应用开发的大片疆土。SpringBoot的约定大于配置、SpringCloud的微服务...

五年后,谷歌还在全力以赴发展 Kotlin

作者|FredericLardinois译者|Sambodhi策划|Tina自2017年谷歌I/O全球开发者大会上,谷歌首次宣布将Kotlin(JetBrains开发的Ja...

kotlin和java开发哪个好,优缺点对比

Kotlin和Java都是常见的编程语言,它们有各自的优缺点。Kotlin的优点:简洁:Kotlin程序相对于Java程序更简洁,可以减少代码量。安全:Kotlin在类型系统和空值安全...

移动端架构模式全景解析:从MVC到MVVM,如何选择最佳设计方案?

掌握不同架构模式的精髓,是构建可维护、可测试且高效移动应用的关键。在移动应用开发中,选择合适的软件架构模式对项目的可维护性、可测试性和团队协作效率至关重要。随着应用复杂度的增加,一个良好的架构能够帮助...

颜值非常高的XShell替代工具Termora,不一样的使用体验!

Termora是一款面向开发者和运维人员的跨平台SSH终端与文件管理工具,支持Windows、macOS及Linux系统,通过一体化界面简化远程服务器管理流程。其核心定位是解决多平台环境下远程连接、文...

预处理的底层原理和预处理编译运行异常的解决方案

若文章对您有帮助,欢迎关注程序员小迷。助您在编程路上越走越好![Mac-10.7.1LionIntel-based]Q:预处理到底干了什么事情?A:预处理,顾名思义,预先做的处理。源代码中...

为“架构”再建个模:如何用代码描述软件架构?

在架构治理平台ArchGuard中,为了实现对架构的治理,我们需要代码+模型描述所要处理的内容和数据。所以,在ArchGuard中,我们有了代码的模型、依赖的模型、变更的模型等,剩下的两个...

深度解析:Google Gemma 3n —— 移动优先的轻量多模态大模型

2025年6月,Google正式发布了Gemma3n,这是一款能够在2GB内存环境下运行的轻量级多模态大模型。它延续了Gemma家族的开源基因,同时在架构设计上大幅优化,目标是让...

比分网开发技术栈与功能详解_比分网有哪些

一、核心功能模块一个基本的比分网通常包含以下模块:首页/总览实时比分看板:滚动展示所有正在进行的比赛,包含比分、比赛时间、红黄牌等关键信息。热门赛事/焦点战:突出显示重要的、关注度高的比赛。赛事导航...

设计模式之-生成器_一键生成设计

一、【概念定义】——“分步构建复杂对象,隐藏创建细节”生成器模式(BuilderPattern):一种“分步构建型”创建型设计模式,它将一个复杂对象的构建与其表示分离,使得同样的构建过程可以创建...

构建第一个 Kotlin Android 应用_kotlin简介

第一步:安装AndroidStudio(推荐IDE)AndroidStudio是官方推荐的Android开发集成开发环境(IDE),内置对Kotlin的完整支持。1.下载And...