百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

10分钟实现PDF转Word神器!看DeepSeek如何用Python解放打工人

liuian 2025-05-24 15:27 18 浏览

开篇痛点
每个被PDF折磨过的职场人都懂——领导发来的扫描件要修改,手动抄到Word需要2小时;网上下载的报告想复制数据,却变成乱码…今天我们用Python+DeepSeek,10分钟打造一个智能转换工具,从此告别格式灾难。

给deepseek提需求:用python写一个pdf转换可编辑word的程序,有操作界面。


使用说明

  1. 需要先安装依赖库:
pip install pdf2docx 
  1. 运行程序后会显示图形界面
  2. 点击"选择PDF文件"按钮选择要转换的PDF文件
  3. 点击"转换为Word"按钮开始转换
  4. 转换进度会显示在进度条和状态标签中
  5. 转换完成后会弹出提示框,转换后的Word文件将保存在原PDF文件同目录下

功能特点:

  • 支持图形化界面操作
  • 显示转换进度
  • 自动生成输出路径(原文件名加"_converted.docx")
  • 错误处理机制
  • 进度条显示转换进度

注意事项:

  1. 转换效果取决于PDF文件本身的质量,扫描版PDF可能无法转换为可编辑文本
  2. 复杂格式的PDF(包含大量图表、特殊字体等)转换效果可能不理想
  3. 大文件转换需要较长时间,请耐心等待
  4. 输出的Word文档可能需要人工调整格式

可以根据需要扩展的功能:

  • 添加输出路径选择功能
  • 支持批量转换
  • 添加格式设置选项
  • 支持其他格式转换(如Word转PDF)
  • 添加文件预览功能

上代码,亲测有效快速好用

import tkinter as tk
from tkinter import filedialog, messagebox, ttk
from pdf2docx import Converter
import os
import threading

class PDFtoWordConverter:
    def __init__(self, master):
        self.master = master
        master.title("PDF转Word工具 v1.0")
        
        # 创建界面组件
        self.create_widgets()
    
    def create_widgets(self):
        # 输入文件选择
        tk.Label(self.master, text="选择PDF文件:").grid(row=0, column=0, padx=5, pady=5)
        self.input_entry = tk.Entry(self.master, width=40)
        self.input_entry.grid(row=0, column=1, padx=5, pady=5)
        tk.Button(self.master, text="浏览...", command=self.select_input_file).grid(row=0, column=2, padx=5, pady=5)

        # 输出文件选择
        tk.Label(self.master, text="输出Word路径:").grid(row=1, column=0, padx=5, pady=5)
        self.output_entry = tk.Entry(self.master, width=40)
        self.output_entry.grid(row=1, column=1, padx=5, pady=5)
        tk.Button(self.master, text="浏览...", command=self.select_output_file).grid(row=1, column=2, padx=5, pady=5)

        # 进度条
        self.progress = ttk.Progressbar(self.master, orient=tk.HORIZONTAL, length=300, mode='determinate')
        self.progress.grid(row=2, column=0, columnspan=3, pady=10)

        # 转换按钮
        self.convert_btn = tk.Button(self.master, text="开始转换", command=self.start_conversion)
        self.convert_btn.grid(row=3, column=1, pady=10)

        # 状态标签
        self.status_label = tk.Label(self.master, text="准备就绪", fg="gray")
        self.status_label.grid(row=4, column=0, columnspan=3)

    def select_input_file(self):
        filepath = filedialog.askopenfilename(
            title="选择PDF文件",
            filetypes=[("PDF文件", "*.pdf"), ("所有文件", "*.*")]
        )
        if filepath:
            self.input_entry.delete(0, tk.END)
            self.input_entry.insert(0, filepath)
            # 自动生成输出路径
            if not self.output_entry.get():
                output_path = os.path.splitext(filepath)[0] + ".docx"
                self.output_entry.insert(0, output_path)

    def select_output_file(self):
        filepath = filedialog.asksaveasfilename(
            title="保存Word文件",
            defaultextension=".docx",
            filetypes=[("Word文件", "*.docx"), ("所有文件", "*.*")]
        )
        if filepath:
            self.output_entry.delete(0, tk.END)
            self.output_entry.insert(0, filepath)

    def update_progress(self, progress):
        self.progress['value'] = progress * 100
        self.master.update_idletasks()

    def conversion_thread(self):
        try:
            pdf_path = self.input_entry.get()
            docx_path = self.output_entry.get()
            
            if not pdf_path or not docx_path:
                messagebox.showwarning("警告", "请先选择输入和输出路径!")
                return

            cv = Converter(pdf_path)
            cv.convert(docx_path, progress_callback=self.update_progress)
            cv.close()
            
            messagebox.showinfo("完成", "文件转换成功!")
            self.status_label.config(text="转换完成", fg="green")
            self.progress['value'] = 0
            
        except Exception as e:
            messagebox.showerror("错误", f"转换失败: {str(e)}")
            self.status_label.config(text="转换失败", fg="red")
        finally:
            self.convert_btn.config(state=tk.NORMAL)

    def start_conversion(self):
        if not self.input_entry.get() or not self.output_entry.get():
            messagebox.showwarning("警告", "请先选择输入和输出路径!")
            return
        
        self.convert_btn.config(state=tk.DISABLED)
        self.status_label.config(text="转换中...", fg="blue")
        threading.Thread(target=self.conversion_thread).start()

if __name__ == "__main__":
    root = tk.Tk()
    app = PDFtoWordConverter(root)
    root.mainloop()

相关推荐

Springboot 整合 Websocket 轻松实现IM及时通讯

一、方案实践集成分为三步:添加依赖、增加配置类和消息核心类、前端集成。1.1、添加依赖<dependency><groupId>org.springframework...

SpringBoot扩展——应用Web Socket!

应用WebSocket目前,网络上的即时通信App有很多,如QQ、微信和飞书等,按照以往的技术来说,即时功能通常会采用服务器轮询和Comet技术来解决。HTTP是非持久化、单向的网络协议,在建立连接...

【Spring Boot】WebSocket 的 6 种集成方式

介绍由于前段时间我实现了一个库【SpringCloud】一个配置注解实现WebSocket集群方案以至于我对WebSocket的各种集成方式做了一些研究目前我所了解到的就是下面这些了(就一个破w...

SpringBoot生产级WebSocket集群实践,支持10万连接!

1、问题背景智慧门诊系统旨在从一定程度上解决患者面临的三长一短(挂号、看病、取药时间长,医生问诊时间短)的问题。实现“诊前、诊中、诊后”实时智能一体化,整合完善医院工作流程。围绕门诊看病的各个环节,让...

Spring Boot3 中 WebSocket 实现数据实时通信全解析

各位互联网大厂的开发同仁们,在如今的互联网应用开发中,实时通信功能越来越重要。比如在线聊天、数据推送、实时通知等场景,都离不开高效的实时通信技术。而WebSocket作为一种高效的双向通信协议,在...

Java WebSocket 示例(java nio websocket)

一、环境准备1.依赖配置(Maven)在pom.xml中添加WebSocket依赖:xml<!--SpringBootWebSocket--><dependen...

Spring Boot整合WebSocket:开启实时通信之旅

SpringBoot整合WebSocket:开启实时通信之旅今天咱们来聊聊SpringBoot整合WebSocket这件大事儿。说到实时通信,你是不是第一时间想到QQ、微信这些聊天工具?没错,We...

Spring Boot3 竟能如此轻松整合 WebSocket 技术,你还不知道?

在当今互联网大厂的软件开发领域,实时通信的需求愈发迫切。无论是在线聊天应用、实时数据更新,还是协同办公系统,都离不开高效的实时通信技术支持。而WebSocket作为一种能够实现浏览器与服务器之间持...

Spring Boot集成WebSocket(springboot集成websocket)

一、基础配置依赖引入<dependency><groupId>org.springframework.boot</groupId><artifactId>...

Springboot下的WebSocket开发(springboot websocket server)

今天遇到一个需求,需要对接第三方扫码跳转。一种方案是前端页面轮询后端服务,但是这种空轮询会虚耗资源,实时性比较差而且也不优雅。所以决定使用另一种方案,websocket。以前就知道websocket,...

springboot websocket开发(java spring boot websocket)

maven依赖SpringBoot2.0对WebSocket的支持简直太棒了,直接就有包可以引入<dependency><groupId>org....

Python界面(GUI)编程PyQt5窗体小部件

一、简介在Qt(和大多数用户界面)中,“小部件”是用户可以与之交互的UI组件的名称。用户界面由布置在窗口内的多个小部件组成。Qt带有大量可用的小部件,也允许您创建自己的自定义和自定义小部件。二、小部件...

实战PyQt5: 014-下拉列表框控件QComboBox

QComboBox简介QComboBox下拉列表框,是一个集按钮和下拉列表选项于一体的部件。QComboBox提供了一种向用户呈现选项列表的方式,其占用最小量的屏幕空间。QComboBox中的常用方法...

Python小白逆袭!7天吃透PyQt6,独立开发超酷桌面应用

PythonGUI编程:PyQt6从入门到实战的全面指南在Python的庞大生态系统中,PyQt6作为一款强大的GUI(GraphicalUserInterface,图形用户界面)编程框架,为开...

如何用 PyQt6 打造一个功能完善的 SQLite 数据库管理工具

如何使用PyQt6和qt_material库,打造一个功能完善的SQLite数据库管理工具,轻松管理和查询SQLite数据库。一、目标数据库连接与表管理:支持连接SQLite数据库...