百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

如何把网页秒变 PDF,然后慢慢看?

liuian 2024-12-29 04:28 35 浏览

瑞士军刀?

不知道你对各种文件的格式转换需求大不大,对于我来说是挺需要的,比如有时候我在 MarkDown 写的文章或者文档,我需要将它们转化成不同的文件形式来给别人阅读,比如网页,比如 PDF,电子书的 epub 等等的格式,甚至我还想要它们在不同的格式之间能够互相转换。

你想不想,把在线的网页变成 PDF, 然后慢慢看?

今天小帅b想要给你介绍的是一个开源的神器——pandoc。

它自称是一把文件格式转换的「瑞士军刀」,因为几乎你能够想到的用标记语言写的文件,都能通过 pandoc 进行转换。

If you need to convert files from one markup format into another, pandoc is your swiss-army knife.

那么,怎么通过 pandoc 来实现我们需要的文件格式转化呢?

安装一波呗~

根据你使用的操作系统,你可以到 GitHub 上下载相应的版本:

https://github.com/jgm/pandoc/releases/tag/2.11.3.2

你也可以使用命令的方式进行安装:

Mac OS 可以这样安装:

brew install pandoc

如果你是 Windows 用户也可以使用 choco 进行安装:

choco install pandoc

Ubuntu 可以这么安装:

sudo apt-get install pandoc

然后你输入以下命令,可以看到版本号就说明你安装成功了:

pandoc --version

如何使用 pandoc ?

pandoc 的命令是这样使用的:

pandoc [选项] [输入文件] ...

将 markdown 转化为 HTML

比如我想把我现在写的 markdown 是这样的:



想要把它转化成 HTML,就可以这样:

pandoc -s --metadata title='帅b讲pandoc' -o out.html Desktop/pandoc.md

这样就可以把我桌面上的 md 直接转出 html 文件了:



一行命令就搞定了,其中 「 -s --metadata title='帅b讲pandoc' -o out.html 」就是「选项」:

  • -s 指的是告诉pandoc我要生成有效的 HTML 文件
  • --metadata title 指的是说明 HTML 的 title
  • -o 指的是我们要输出的文件

而在最后面的 「Desktop/pandoc.md」就是「输入文件」。

pandoc 选项在哪啊?

可能你要问了,这些「选项」在哪里可以得到,分别都是什么意思?

有两个地方你可以查询得到,一个是在你的终端中使用 man 命令:

man pandoc

往下拉你就可以看到各种选项的意思:

另一个地方你可以通过在线文档查询,地址在这:

https://pandoc.org/MANUAL.html#options

内容都是一样的,不过网页更加方便查阅。

将 HTML 转化为 PDF

我们再来玩一下,将 HTML 文件转化为 PDF,因为 pandoc 在转化为 PDF 文件的时候,需要用到 pdf 引擎,pandoc 默认使用的是 pdflatex,如果你没有安装可以先安装一波。

brew install basictex

pandoc 支持的 pdf 引擎有很多,比如:

pdflatex, lualatex, xelatex, latexmk, tectonic, wkhtmltopdf, weasyprint, prince, context

你可以根据自己的需要,选择对应的引擎,比如我们把刚刚生成的 HTML 文件直接转化为 PDF,就可以这样:

pandoc --pdf-engine=xelatex -o out.pdf out.html -V mainfont=STXihei

这里我们使用的 pdf 引擎是 xelatex,使用的中文字体是细黑,运行得到的 pdf 是这样子的:

是不是很方便,还有很多其他的文件格式,你都可以通过 pandoc 进行转化,你还可以对其指定样式,模板等操作,你都可以在这里找到:https://pandoc.org/MANUAL.html。

Python 使用 Pandoc

如果你想在 Python 中使用 pandoc ,也不是不行,你可以安装 pypandoc 这个库,然后使用也是很简单,像这样:


OK,以上就是今天小帅b给你带来的分享,希望对你有帮助!

最后,一直坚持原创分享不易,如果对你有帮助的话点个赞支持一下呗,这样我才有动力给你一直分享个不停嘛,好了,我们下回见,peace!

相关阅读

我是怎么通过 Python 排版公众号的?

你真的会使用 Python 命令吗?

使用终端命令行的一些技巧

相关推荐

打开新世界,教你用RooCode+Copliot+Mcp打造一个自己的Manus

本文耗时两天打造,想要一遍走通需要花点时间,建议找个专注的时间开搞!这不仅是个免费使用claude3.5的方案,也是一个超级智能体方案,绝对值得一试!最近Manus真是赚足了眼球,然而我还是没有邀请码...

Git仓库(git仓库有哪些)

#Git仓库使用方法流程详解##一、环境搭建与基础配置###1.1安装与初始化-**安装Git**:官网下载安装包,默认配置安装-**配置全局信息**:```bashgitconfig...

idea版的cursor:Windsurf Wave 7(ideawalk)

在企业环境中,VisualStudioCode和JetBrains系列是最常用的开发工具,覆盖了全球绝大多数开发者。这两类IDE各有优势,但JetBrains系列凭借其针对特定语言和企业场景的深度...

Ai 编辑器 Cursor 零基础教程:推箱子小游戏实战演练

最近Ai火的同时,Ai编辑器Cursor同样火了一把。今天我们就白漂一下Cursor,使用免费版本搞一个零基础教程,并实战演练一个“网页版的推箱子小游戏”。通过这篇文章,让你真正了解cursor是什么...

ChatGPT深度集成于苹果Mac软件 编码能力得到提升

【CNMO科技消息】近日,OpenAI发布了针对MacOS的桌面应用程序,并宣布了一系列与各类应用程序的互操作性功能,标志着ChatGPT正在从聊天机器人向AI智能体工具进化。此次发布的MacOS桌面...

日常开发中常用的git操作命令和使用技巧

日常开发中常用的git操作命令,从配置、初始化本地仓库到提交代码的常用git操作命令使用git前的配置刚使用git,先要在电脑上安装好git,接着我们需要配置一下帐户信息:用户名和邮箱。#设置用户名...

Trae IDE 如何与 GitHub 无缝对接?

TraeIDE内置了GitHub集成功能,让开发者可以直接在IDE里管理代码仓库和版本控制。1.直接从GitHub克隆项目如果你想把GitHub上的代码拉到本地,Trae提供了...

China's diplomacy to further provide strong support for country's modernization: FM

BEIJING,March7(Xinhua)--ChineseForeignMinisterWangYisaidFridaythatChina'sdiplomacywil...

三十分钟入门基础Go(Java小子版)(java入门级教程)

前言Go语言定义Go(又称Golang)是Google的RobertGriesemer,RobPike及KenThompson开发的一种静态、强类型、编译型语言。Go语言语法与...

China will definitely take countermeasures in response to arbitrary pressure: FM

BEIJING,March7(Xinhua)--Chinawilldefinitelytakecountermeasuresinresponsetoarbitrarypre...

Go操作etcd(go操作docker实现沙箱)

Go语言操作etcd,这里推荐官方包etcd/clientv3。文档:https://pkg.go.dev/go.etcd.io/etcd/clientv3etcdv3使用gRPC进行远程过程调...

腾讯 Go 性能优化实战(腾讯游戏优化软件)

作者:trumanyan,腾讯CSIG后台开发工程师项目背景网关服务作为统一接入服务,是大部分服务的统一入口。为了避免成功瓶颈,需要对其进行尽可能地优化。因此,特别总结一下golang后台服务...

golang 之JWT实现(golang gin jwt)

什么是JSONWebToken?JSONWebToken(JWT)是一个开放标准(RFC7519),它定义了一种紧凑且自包含的方式,用于在各方之间以JSON方式安全地传输信息。由于此信息是经...

一文看懂 session 和 cookie(session cookie的区别)

-----------cookie大家应该都熟悉,比如说登录某些网站一段时间后,就要求你重新登录;再比如有的同学很喜欢玩爬虫技术,有时候网站就是可以拦截住你的爬虫,这些都和cookie有关。如果...

有望取代 java?GO 语言项目了解一下

GO语言在编程界一直让人又爱又恨,有人说“GO将统治下一个十年”,“几乎所有新的、有趣的东西都是用Go写的”;也有人说它过于死板,使用感太差。国外有Google、AWS、Cloudflar...