百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

WPS收费功能免费用!Pandas实现多层级多Sheet的Excel文件合并!

liuian 2025-05-02 11:47 28 浏览

文章的开始我们先研究一下WPS的表格合并,这是一个收费功能。

可以看到,他按照相同的列名,将表格按行合并。

Pandas作为一个强大的数据分析工具,此功能轻而易举。那么我们就来实现一个将某个文件夹下所有Excel文件合并的程序,包括子文件夹、 包括单文件的多Sheet。

首先,我们先看下此次模拟数据,我们C盘下有个文件夹叫demo,其下有两个文件和一个文件夹。

其中,测试数据1文件中有两个Sheet有示例数据,其他所有文件均只有一个Sheet有数据。

demo1下也有两个文件,他们只有Sheet1有数据且和上述图中示例数据相同。


这样合并结果应是示例数据重复5次(4个文件的Sheet1数据+测试数据1的Sheet2数据)。

1. 安装依赖

# 必选依赖
pip install pandas

# 操作Excel时,必选依赖
pip install "pandas[excel]"

2. 读取文件夹下所有Excel文件的路径

import os

root_dir = r"C:\demo"
def get_file_paths(root_dir):
    file_paths = []
    for root, dirs, files in os.walk(root_dir):
        for file in files:
            if ("xls" in file) or ("xlsx" in file):
                file_path = os.path.join(root, file)
                file_paths.append(file_path)
    return file_paths
# ['C:\\demo\\测试数据1.xlsx',
# 'C:\\demo\\测试数据2.xlsx',
# 'C:\\demo\\demo1\\测试数据3.xlsx',
# 'C:\\demo\\demo1\\测试数据4.xlsx']
print(get_file_paths(root_dir))

3. 遍历所有文件,遍历Sheet,读出内容并合并

df = pd.DataFrame()
for file_path in get_file_paths(root_dir):
    excel_file = pd.ExcelFile(file_path)
    for sheet_name in excel_file.sheet_names:
        df_temp = pd.read_excel(file_path, sheet_name=sheet_name)
        df = pd.concat([df, df_temp])
df.to_excel(r"C:\demo\合并结果.xlsx")

打开合并结果文件可以看到,非常简洁的几行代码,就完成了多层次,多Sheet的表格合并功能!

4. 总结

Pandas库是Python最强的数据分析库之一,使用它可以很方便汇总和统计数据,提高工作效率。在日常工作中,您有什么繁琐的Excel操作需求呢?欢迎交流!

#Python##Excel##Pandas数据分析#

相关推荐

使用Assembly打包和部署Spring Boot工程

SpringBoot项目的2种部署方式目前来说,SpringBoot项目有如下2种常见的部署方式一种是使用docker容器去部署。将SpringBoot的应用构建成一个docke...

java高级用法之:调用本地方法的利器JNA

简介JAVA是可以调用本地方法的,官方提供的调用方式叫做JNI,全称叫做javanativeinterface。要想使用JNI,我们需要在JAVA代码中定义native方法,然后通过javah命令...

Linux中如何通过Shell脚本来控制Spring Boot的Jar包启停服务?

SpringBoot项目在为开发者带来方便的同时,也带来了一个新的问题就是Jar包如何启动?在一般情况下我们都是采用了最为经典的java-jar命令来进行启动。然后通过ps命令找到对应的应用线程通...

牛逼!自己手写一个热加载(人民币手写符号一个横还是两个横)

热加载:在不停止程序运行的情况下,对类(对象)的动态替换JavaClassLoader简述Java中的类从被加载到内存中到卸载出内存为止,一共经历了七个阶段:加载、验证、准备、解析、初始化、使用、...

java 错误: 找不到或无法加载主类?看看怎么解决吧!

问题扫述:项目名称调整,由原来的com.mp.qms.report.biz调整为com.mp.busicen.mec.qms.report.biz后。项目在IDEA直接运行,但打包部署到服务器...

如何将 Spring Boot 工程打包成独立的可执行 JAR 包

导语:通过将SpringBoot项目打包成独立的可执行JAR包,可以方便地在任何支持Java环境的机器上运行项目。本文将详细介绍如何通过Maven构建插件将SpringBoot...

class 增量发包改造为 jar 包方式发布

大纲class增量发包介绍项目目录结构介绍jar包方式发布落地方案class增量发包介绍当前项目的迭代修复都是通过class增量包来发版本的将改动的代码class增量打包,如下图cla...

Jar启动和IDE里启动Sprintboot的区别

想聊明白这个问题,需要补充一些前提条件,比如Fatjar、类加载机制等1、Fatjar我们在开发业务程序的时候,经常需要引用第三方的jar包,最终程序开发完成之后,通过打包程序,会把自己的代码和三...

Java 20年,以后将往哪儿走?(java还能流行多久)

在今年的Java20周年的庆祝大会中,JavaOne2015的中心议题是“Java的20年”。甲骨文公司Java平台软件开发部的副总裁GeorgesSaab的主题演讲就将关注点放在了java...

Spring Boot Jar 包秒变 Docker 镜像实现多环境部署

你是否在互联网大厂后端开发工作中,遇到过这样的困扰?当完成一个SpringBoot项目开发,准备将Jar包部署到不同环境时,却发现各个环境依赖不同、配置复杂,部署过程繁琐又容易出错,不仅耗费...

从0开始,让你的Spring Boot项目跑在Linux服务器

1搭建Linux服务器1.1购买阿里云服务器或安装虚拟机这里建议是CentOS7.X或CentOS8.X,当然其他的Linux如deepin、Ubuntu也可以,只是软件环境的安装包和安装方式...

【技术】Maven 上传第三方jar包到私服

通过nexus后台上传私服以NexusRepositoryManagerOSS2.14.5-02为例。登录nexus后台。定义Maven坐标Maven坐标有两种方式:1.自定义参数;2....

JVM参数、main方法的args参数使用

一、前言我们知道JVM参数分为自定义参数、JVM系统参数,Javamain方法的参数。今天就谈谈怎么使用吧。二、查看jvm参数定义自定义参数我们打开cmd窗口,输入java,就能看到自定义参数的格式...

Maven项目如何发布jar包到Nexus私服

Maven项目发布jar包到Nexus私服在编码过程中,有些通用的代码模块,有时候我们不想通过复制粘贴来粗暴地复用。因为这样不仅体现不了变化,也不利于统一管理。这里我们使用mavendeploy的方...

干货丨Hadoop安装步骤!详解各目录内容及作用

Hadoop是Apache基金会面向全球开源的产品之一,任何用户都可以从ApacheHadoop官网下载使用。今天,播妞将以编写时较为稳定的Hadoop2.7.4版本为例,详细讲解Hadoop的安...