百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

Python数据处理利器:Pandas核心用法详解

liuian 2025-04-06 18:06 104 浏览

一、Pandas简介

Pandas是Python最强大的数据处理库,专为处理结构化数据设计。名称源自"Panel Data"(面板数据),具备以下核心优势:

  • 高效处理百万级数据
  • 支持CSV/Excel/SQL等多种数据源
  • 提供清洗、转换、分析的完整工具链

二、环境准备

# 安装命令
pip install pandas

# 基础导入方式(行业标准)
import pandas as pd
import numpy as np  # 常配合使用

三、核心数据结构

1. Series(一维数据)

创建示例:

# 从列表创建
scores = pd.Series([90, 85, 92, 88], 
                  index=['Alice', 'Bob', 'Charlie', 'David'],
                  name='Math Scores')
print(scores) 

输出结果:

复制代码Alice       90
Bob         85
Charlie     92
David       88
Name: Math Scores, dtype: int64

2. DataFrame(二维表格)

创建方式:

# 字典方式创建
data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 28],
    'City': ['New York', 'London', 'Paris']
}
df = pd.DataFrame(data)

# 设置索引
df.set_index('Name', inplace=True) 

生成的DataFrame:

Name

Age

City

Alice

25

New York

Bob

30

London

Charlie

28

Paris


四、数据操作实战

案例:电商销售数据分析

1. 数据加载

# 读取CSV文件
sales = pd.read_csv('sales_data.csv', 
                   parse_dates=['order_date'])

# 显示前3行
print(sales.head(3)) 

2. 数据清洗

# 处理缺失值
sales['price'] = sales['price'].fillna(sales['price'].mean())

# 删除重复记录
sales.drop_duplicates(inplace=True)

# 类型转换
sales['quantity'] = sales['quantity'].astype(int) 

3. 数据分析

常用操作示例:

# 筛选2023年Q1数据
q1_sales = sales[sales['order_date'].between('2023-01-01', '2023-03-31')]

# 按品类统计销售额
category_sales = sales.groupby('category')['total'].sum().sort_values(ascending=False)

# 计算移动平均
sales['7d_avg'] = sales['total'].rolling(window=7).mean() 

4. 数据合并

# 合并订单与用户信息
user_info = pd.read_csv('users.csv')
merged_data = pd.merge(sales, user_info, on='user_id', how='left')

# 横向拼接季度报表
full_year = pd.concat([q1, q2, q3, q4], axis=0) 

五、进阶技巧

1. 时间序列处理

# 设置时间索引
sales.set_index('order_date', inplace=True)

# 按周重采样
weekly_sales = sales.resample('W').sum() 

2. 高效数据筛选

# 多条件查询
high_value = sales[(sales['total'] > 1000) & 
                  (sales['category'].isin(['Electronics', 'Furniture']))]

# 使用query方法
luxury_orders = sales.query("price > 500 and payment_type == 'Credit'") 

3. 内存优化

# 类型转换减少内存占用
sales['category'] = sales['category'].astype('category')
sales['user_id'] = sales['user_id'].astype('int32')

# 查看内存使用
print(sales.info(memory_usage='deep')) 

六、可视化集成

import matplotlib.pyplot as plt

# 绘制月度趋势图
monthly_sales.plot(kind='line', 
                  title='Monthly Sales Trend',
                  figsize=(12,6))
plt.xlabel('Month')
plt.ylabel('Sales Amount')
plt.show()

七、性能优化建议

  1. 尽量使用向量化操作替代循环
  2. 适当使用astype转换数据类型
  3. 大数据集使用dask并行处理
  4. 避免链式赋值,使用.loc明确索引

八、学习资源推荐

  • 官方文档:pandas.pydata.org
  • 经典书籍:《Python for Data Analysis》
  • 实战项目:Kaggle泰坦尼克生存预测
  • 可视化工具:Pandas+Seaborn组合

掌握Pandas需要持续实践,建议从实际项目入手,逐步探索更多高级功能。记住:数据质量决定分析结果,清洗步骤不可忽视!


希望这篇全面解析能帮助您快速掌握Pandas核心技能。如有疑问,欢迎在评论区交流讨论!

相关推荐

usb驱动程序在哪里(usb驱动叫什么名字)
usb驱动程序在哪里(usb驱动叫什么名字)

U盘添加驱动号或路径的方法如下在我的电脑上按右键,在快捷菜单里,选择“管理”,打开“计算机管理”窗口。在计算机管理窗口里,选择“存储”下面的“磁盘管理”,如果看得到没有盘符的U盘,那么在这个U盘上按鼠标右键,选择“更改驱动器名称和路径”选项...

2026-01-11 05:05 liuian

windows 10专业版怎么激活(windows十专业版怎么激活)
  • windows 10专业版怎么激活(windows十专业版怎么激活)
  • windows 10专业版怎么激活(windows十专业版怎么激活)
  • windows 10专业版怎么激活(windows十专业版怎么激活)
  • windows 10专业版怎么激活(windows十专业版怎么激活)
美德少年事迹材料(美德少年事迹材料500字左右)

就写平时做了什么好事就可以了。他们分别是许昌市文化街小学六(1)班学生谭天、许昌市第一中学七(12)班学生安家宝。现年12岁的谭天是一个阳光男孩儿,他性格活泼,热情开朗,富有爱心,品学兼优,有较强的集...

手机改无线路由器密码(手机改路由器密码怎么改教程)
  • 手机改无线路由器密码(手机改路由器密码怎么改教程)
  • 手机改无线路由器密码(手机改路由器密码怎么改教程)
  • 手机改无线路由器密码(手机改路由器密码怎么改教程)
  • 手机改无线路由器密码(手机改路由器密码怎么改教程)
win7万能网卡驱动离线版安装包

要使用Win7网卡驱动离线包,首先将离线包下载到计算机上。然后,打开设备管理器,找到你的网卡设备。右键点击该设备,选择“更新驱动程序软件”。在弹出的对话框中,选择“浏览计算机以查找驱动程序软件”。然后...

音频驱动器怎么安装(音频驱动程序怎么安装)
音频驱动器怎么安装(音频驱动程序怎么安装)

1、在浏览器中输入并搜索,然后下载并安装。2、安装完成后打开360驱动大师,它就会自动检测你的电脑需要安装或升级的驱动。3、检测完毕后,我们可以看到我们的声卡驱动需要安装或升级,点击安装或升级,就会开始自动安装或升级声卡了。4、升级过程中会...

2026-01-11 02:55 liuian

硬盘分区win10(硬盘分区win7)
  • 硬盘分区win10(硬盘分区win7)
  • 硬盘分区win10(硬盘分区win7)
  • 硬盘分区win10(硬盘分区win7)
  • 硬盘分区win10(硬盘分区win7)
win11要不要升级

答案是:不必强更,稍安勿躁。  没错,Windows11系统的确是微软的最新力作,其中安卓APP可以在桌面系统中直接使用的“噱头”也极有吸引力,但是,按照win10更新后bug层出不穷的情况来看,正...

windows7联想旗舰版(联想win7旗舰版配置)

你好!联想Windows7旗舰版并不是一个显示设备,而是一个操作系统。因此,无法用英寸来描述其大小。旗舰版是指Windows7操作系统的最高版本,具有更多的功能和特性与其他版本不同。Windows...

手机刷win10(手机刷win10系统)

要给普通的手机刷win10,首先需要确保手机型号支持win10系统,并且进行备份重要数据。然后下载win10系统文件并通过USB连接手机与电脑,使用刷机工具将系统文件刷入手机中。在此过程中需要注意手机...

万能网卡驱动离线版xp(万能网卡驱动xp电脑版离线)

使用网卡版的驱动精灵或者驱动人生,安装后即可驱动无线网卡。安装网卡驱动是连接网络的关键步骤,即使在没有网络连接的情况下,也可以通过以下步骤来安装网卡驱动:1.下载网卡驱动程序:首先,你需要知道你的网...

手机五笔输入法哪个软件最好用

百度输入法。百度手机输入法是由百度(中国)有限公司推出的一款安装于手机和平板中的人工智能输入法工具,旨在帮助用户快速、精准的完成多内容输入,使用百度手机输入法,更懂用户的表达。百度手机输入法支持拼音、...

电脑公司社会实践内容(电脑店社会实践)

办公室社会实践有以下几方面内容:1、环保类:“植树”“清扫公共设施”“社区宣传”等。2、科普类“参观学习科研机构”“动手小发明”等。3、爱心类“帮扶老人”“义捐灾区”“募集贫困儿童”等。4、成长类“义...

windows7旗舰版怎么升级到windows10

Windows7旗舰版32位,可以用U盘升级为windows10吗?这个是肯定可以的呀。Windows7升级为windows10,这是一定是可以的。关键一点。你会用U盘升级系统才可以的呀。如果你不...

华为服务器安装系统教程(华为服务器安装步骤)

1.准备安装环境:检查服务器的电源、网络连接及其他配件是否正常。2.安装软件:将光盘或U盘中的安装文件拷贝到服务器上,然后执行安装命令。3.配置服务器:根据业务需要对服务器进行IP地址、DNS、...