每天一个 Python 库:pandas 办公利器,数据处理效率翻倍!
liuian 2025-08-31 03:57 5 浏览
在日常办公中,如果你还在用 Excel 手动处理上千条数据,不如试试 Python 的数据神器——pandas。它可以一行代码读取表格、筛选关键数据、批量导出结果,轻松替代人工处理,提高效率数倍!
本期关键词:Excel 表格读取、字段筛选、数据统计、导出新表。
适用人群:测试开发、数据分析、财务统计、自动化办公人员。
一、为什么选择 pandas?
pandas 是 Python 中最强大的数据分析库之一,主要特点:
- 支持 Excel、CSV、数据库等多种格式
- 提供类 Excel 的表格操作体验(DataFrame)
- 可轻松完成数据清洗、统计、分组、透视等操作
- 与 numpy、matplotlib、openpyxl 高度集成
一句话总结:如果你会用 Excel,就能很快学会 pandas。
学习本来就不是一蹴而就的事,不过只要你肯练、敢用,坚持一阵子,你一定能看到变化!
二、快速上手:读取 Excel 表格
#!/usr/bin/env python
# -*- coding: UTF-8 -*-
"""
@Project :Fish
@File :D14.py
@Date :2025/5/13
@Author : malijie
"""
import warnings
import pandas as pd
warnings.filterwarnings("ignore", category=UserWarning)
file = "总账和预算比较.xlsx"
sheet = "本年累计预算汇总"
df = pd.read_excel(file, sheet_name=sheet)
print("读取成功!前5行数据如下:")
print(df.head())
输出示例:
三、常见操作汇总(适合办公场景)
1. 指定列读取,减小内存压力
#!/usr/bin/env python
# -*- coding: UTF-8 -*-
"""
@Project :Fish
@File :D14.py
@Date :2025/5/13
@Author : malijie
"""
import warnings
import pandas as pd
warnings.filterwarnings("ignore", category=UserWarning)
file = "总账和预算比较.xlsx"
sheet = "本年累计预算汇总"
df = pd.read_excel(file, sheet_name=sheet, usecols=["会计科目", "预算", "实际金额"])
print("读取成功!前5行数据如下:")
print(df.head())
2. 过滤:找出预算为 0 的项
#!/usr/bin/env python
# -*- coding: UTF-8 -*-
"""
@Project :Fish
@File :D14.py
@Date :2025/5/13
@Author : malijie
"""
import warnings
import pandas as pd
warnings.filterwarnings("ignore", category=UserWarning)
file = "总账和预算比较.xlsx"
sheet = "本年累计预算汇总"
df = pd.read_excel(file, sheet_name=sheet)
zero_budget = df[df["预算"] == 0]
print("预算为 0 的数据:")
print(zero_budget)
3. 数据类型与缺失值检查
#!/usr/bin/env python
# -*- coding: UTF-8 -*-
"""
@Project :Fish
@File :D14.py
@Date :2025/5/13
@Author : malijie
"""
import warnings
import pandas as pd
warnings.filterwarnings("ignore", category=UserWarning)
file = "总账和预算比较.xlsx"
sheet = "本年累计预算汇总"
df = pd.read_excel(file, sheet_name=sheet)
print("是否存在缺失值:")
print(df.isnull().sum())
4. 基础统计(均值、中位数、方差等)
#!/usr/bin/env python
# -*- coding: UTF-8 -*-
"""
@Project :Fish
@File :D14.py
@Date :2025/5/13
@Author : malijie
"""
import warnings
import pandas as pd
warnings.filterwarnings("ignore", category=UserWarning)
file = "总账和预算比较.xlsx"
sheet = "本年累计预算汇总"
df = pd.read_excel(file, sheet_name=sheet)
print("快速描述性统计:")
print(df.describe())
字段说明
字段 | 含义说明 |
count | 非空值的数量(剩余百分比 有缺失) |
mean | 平均值 |
std | 标准差(反映波动程度) |
min | 最小值 |
25% | 25 分位点(第一四分位数) |
50% | 中位数(50 分位点) |
75% | 75 分位点(第三四分位数) |
max | 最大值 |
四、导出处理结果
将处理好的数据保存成新文件,方便分享或归档:
#!/usr/bin/env python
# -*- coding: UTF-8 -*-
"""
@Project :Fish
@File :D14.py
@Date :2025/5/13
@Author : malijie
"""
import warnings
import pandas as pd
warnings.filterwarnings("ignore", category=UserWarning)
file = "总账和预算比较.xlsx"
sheet = "本年累计预算汇总"
df = pd.read_excel(file, sheet_name=sheet)
df.to_excel("分析结果.xlsx", index=False)
print("分析结果已导出为 Excel 文件:分析结果.xlsx")
五、实战封装一个小工具函数
#!/usr/bin/env python
# -*- coding: UTF-8 -*-
"""
@Project :Fish
@File :D14.py
@Date :2025/5/13
@Author : malijie
"""
import warnings
import pandas as pd
warnings.filterwarnings("ignore", category=UserWarning)
def analyze_excel(file_path, sheet_name):
df = pd.read_excel(file_path, sheet_name=sheet_name)
print("数据读取成功!")
print("字段统计:")
print(df.describe())
# 过滤预算为 0 的记录
filtered = df[df["预算"] == 0]
filtered.to_excel("预算为0记录.xlsx", index=False)
print("已导出预算为0记录!")
if __name__ == '__main__':
file = "总账和预算比较.xlsx"
sheet = "本年累计预算汇总"
analyze_excel(file, sheet)
六、小结:办公数据分析利器非它莫属!
功能 | pandas 实现方式 |
读取 Excel | pd.read_excel() |
选取列 | usecols=[...] |
条件筛选 | df[df["预算"] == 0] |
查看结构 | df.info() |
统计分析 | df.describe() |
导出数据 | df.to_excel("out.xlsx") |
七、可视化预告:数据图表,下期见!
在真实业务中,我们还可以将 pandas 的结果结合 matplotlib 绘图,比如:
- 柱状图对比各部门预算
- 折线图展示月度支出趋势
- 饼图展示成本占比
下期预告:matplotlib 实战教学,用代码画出有颜值的图表!
写在最后
学习是一场长期主义,pandas 的应用远不止这些。
点赞关注不迷路,不错过每一期实战技巧!
后续还有更多自动化测试经验分享~评论区欢迎唠嗑交流!
点头像,发现更多精彩内容!
相关推荐
- Html中Css样式Ⅱ_html+css+
-
元素的定位(方式五种定位方式):静态定位:position:static;相对定位:position:relative;绝对定位:position:absolute;固定定位:position...
- HTML 标签和属性值的基本格式_html标签及属性的语法规则
-
HTML:HyperTextMarkupLanguage超文本标记语言HTML代码不区分大小写,包括HTML标记、属性、属性值都不区分大小写;任何空格或回车键在代码中都无效,插入空格或回车有...
- C#中使用Halcon开发视觉检测程序教程
-
一、环境准备1.安装Halcon从Halcon官方网站下载适合你操作系统的安装包,按照安装向导完成安装。安装过程中,记住安装路径,后续配置环境时会用到。2.配置VisualStudio项目打开V...
- 【开源】C#功能强大,灵活的跨平台开发框架 - Uno Platform
-
前言今天给广大网友分享一个基于C#开源、功能强大、灵活的跨平台开发框架,她就是:UnoPlatform。通过UnoPlatform,开发者可以利用单一代码库实现多平台兼容,极大地提高了开发效率和...
- C# 的发展简史_c#的发展前景
-
1.C#的诞生和初期(2000-2005)2000年:在微软的PDC大会上,由AndersHejlsberg首次公开展示了C#语言。2002年:微软发布了.NETFramework1.0,其...
- Visual Studio 2010-C#跟西门子1200(Sharp7)窗体控制②-启动按钮
-
VisualStudio2010--C#跟西门子1200(Sharp7)窗体控制②--启动按钮上期回顾(上期主要是新建窗体应用程序,添加sharp7的类库并引用,建立一个button按钮):本期将...
- Visual Studio窗口布局混乱后的恢复与优化指南
-
在使用VisualStudio进行开发时,我们常因误操作(如拖拽窗口、关闭面板、多显示器切换)导致界面布局混乱,代码编辑器、解决方案资源管理器、属性面板等组件“错位”,严重影响开发效率。本文将针对布...
- 使用Visual Studio 2017为AutoCAD创建一个c#模板
-
本教程的目标是展示如何在VisualStudio2017中创建AutoCAD的c#项目模板,该模板允许在调试模式下从VisualStudio加载DLL来自动启动AutoCAD。本文展示的示例使用...
- IT科技-续3Visual Studio2019-C#实战练习
-
上次完成了登录页面的窗体设计,本次完成管理界面的设计。第一步ComBox控制深度操作点击编辑选项,加入预定选项,完成操作。第二步复制Buttons控件依次为保存、删除、重置、编辑按钮属性设置,参考...
- 如何在 C# 中将文本转换为 Word 以及将 Word 转换为文本
-
在现代软件开发中,处理文档内容是一个非常常见的需求。无论是生成报告、存储日志,还是处理用户输入,开发者都可能需要在纯文本与Word文档之间进行转换。有时需要将文本转换为Word,以便生成结构化的...
- 简短的C#入门教程 # C# 入门教程 C#(读作...
-
简短的C#入门教程#C#入门教程C#(读作CSharp)是一种由Microsoft开发的多范式编程语言,它具有广泛的应用,特别是在Windows平台上。本教程将介绍C#的基础知识,以帮助您入门这...
- JavaScript中this指向各种场景_前端中this的指向
-
在JavaScript中,this的指向是一个核心概念,其值取决于函数的调用方式,而非定义位置(箭头函数除外)。以下是this指向的常见场景及具体说明:1.全局作用域中的this在全局作用域(非...
- 微信WeUI设计规范文件下载及使用方法
-
来人人都是产品经理【起点学院】,BAT实战派产品总监手把手系统带你学产品、学运营。WeUI是一套同微信原生视觉体验一致的基础样式库,由微信官方设计团队为微信Web开发量身设计,可以令用户的使用感知...
- JavaScript技术:如何动态添加事件?
-
随着前端技术的不断发展,JavaScript已经成为了不可或缺的一部分,它可以让网页变得更加流畅和美观。但是,在JavaScript中动态添加事件还是一个比较困难的问题,为此,本文将从入门到精通,介绍...
- 一周热门
-
-
【验证码逆向专栏】vaptcha 手势验证码逆向分析
-
Python实现人事自动打卡,再也不会被批评
-
Psutil + Flask + Pyecharts + Bootstrap 开发动态可视化系统监控
-
一个解决支持HTML/CSS/JS网页转PDF(高质量)的终极解决方案
-
再见Swagger UI 国人开源了一款超好用的 API 文档生成框架,真香
-
网页转成pdf文件的经验分享 网页转成pdf文件的经验分享怎么弄
-
C++ std::vector 简介
-
飞牛OS入门安装遇到问题,如何解决?
-
系统C盘清理:微信PC端文件清理,扩大C盘可用空间步骤
-
10款高性能NAS丨双十一必看,轻松搞定虚拟机、Docker、软路由
-
- 最近发表
-
- Html中Css样式Ⅱ_html+css+
- HTML 标签和属性值的基本格式_html标签及属性的语法规则
- 基于Visual Studio C#语言开发上位机,做定制设计后有多好看
- C#中使用Halcon开发视觉检测程序教程
- 【开源】C#功能强大,灵活的跨平台开发框架 - Uno Platform
- C# 的发展简史_c#的发展前景
- Visual Studio 2010-C#跟西门子1200(Sharp7)窗体控制②-启动按钮
- Visual Studio窗口布局混乱后的恢复与优化指南
- 使用Visual Studio 2017为AutoCAD创建一个c#模板
- IT科技-续3Visual Studio2019-C#实战练习
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)