如何把网页秒变 PDF,然后慢慢看?
liuian 2024-12-29 04:28 74 浏览
瑞士军刀?
不知道你对各种文件的格式转换需求大不大,对于我来说是挺需要的,比如有时候我在 MarkDown 写的文章或者文档,我需要将它们转化成不同的文件形式来给别人阅读,比如网页,比如 PDF,电子书的 epub 等等的格式,甚至我还想要它们在不同的格式之间能够互相转换。
你想不想,把在线的网页变成 PDF, 然后慢慢看?
今天小帅b想要给你介绍的是一个开源的神器——pandoc。
它自称是一把文件格式转换的「瑞士军刀」,因为几乎你能够想到的用标记语言写的文件,都能通过 pandoc 进行转换。
If you need to convert files from one markup format into another, pandoc is your swiss-army knife.
那么,怎么通过 pandoc 来实现我们需要的文件格式转化呢?
安装一波呗~
根据你使用的操作系统,你可以到 GitHub 上下载相应的版本:
https://github.com/jgm/pandoc/releases/tag/2.11.3.2
你也可以使用命令的方式进行安装:
Mac OS 可以这样安装:
brew install pandoc
如果你是 Windows 用户也可以使用 choco 进行安装:
choco install pandoc
Ubuntu 可以这么安装:
sudo apt-get install pandoc
然后你输入以下命令,可以看到版本号就说明你安装成功了:
pandoc --version
如何使用 pandoc ?
pandoc 的命令是这样使用的:
pandoc [选项] [输入文件] ...
将 markdown 转化为 HTML
比如我想把我现在写的 markdown 是这样的:
想要把它转化成 HTML,就可以这样:
pandoc -s --metadata title='帅b讲pandoc' -o out.html Desktop/pandoc.md
这样就可以把我桌面上的 md 直接转出 html 文件了:
一行命令就搞定了,其中 「 -s --metadata title='帅b讲pandoc' -o out.html 」就是「选项」:
- -s 指的是告诉pandoc我要生成有效的 HTML 文件
- --metadata title 指的是说明 HTML 的 title
- -o 指的是我们要输出的文件
而在最后面的 「Desktop/pandoc.md」就是「输入文件」。
pandoc 选项在哪啊?
可能你要问了,这些「选项」在哪里可以得到,分别都是什么意思?
有两个地方你可以查询得到,一个是在你的终端中使用 man 命令:
man pandoc
往下拉你就可以看到各种选项的意思:
另一个地方你可以通过在线文档查询,地址在这:
https://pandoc.org/MANUAL.html#options
内容都是一样的,不过网页更加方便查阅。
将 HTML 转化为 PDF
我们再来玩一下,将 HTML 文件转化为 PDF,因为 pandoc 在转化为 PDF 文件的时候,需要用到 pdf 引擎,pandoc 默认使用的是 pdflatex,如果你没有安装可以先安装一波。
brew install basictex
pandoc 支持的 pdf 引擎有很多,比如:
pdflatex, lualatex, xelatex, latexmk, tectonic, wkhtmltopdf, weasyprint, prince, context
你可以根据自己的需要,选择对应的引擎,比如我们把刚刚生成的 HTML 文件直接转化为 PDF,就可以这样:
pandoc --pdf-engine=xelatex -o out.pdf out.html -V mainfont=STXihei
这里我们使用的 pdf 引擎是 xelatex,使用的中文字体是细黑,运行得到的 pdf 是这样子的:
是不是很方便,还有很多其他的文件格式,你都可以通过 pandoc 进行转化,你还可以对其指定样式,模板等操作,你都可以在这里找到:https://pandoc.org/MANUAL.html。
Python 使用 Pandoc
如果你想在 Python 中使用 pandoc ,也不是不行,你可以安装 pypandoc 这个库,然后使用也是很简单,像这样:
OK,以上就是今天小帅b给你带来的分享,希望对你有帮助!
最后,一直坚持原创分享不易,如果对你有帮助的话点个赞支持一下呗,这样我才有动力给你一直分享个不停嘛,好了,我们下回见,peace!
相关阅读
我是怎么通过 Python 排版公众号的?
你真的会使用 Python 命令吗?
使用终端命令行的一些技巧
相关推荐
- 电脑截屏的快捷按键(“电脑截屏的快捷键”)
-
电脑截图快捷键是Ctrl+PrScrn。电脑上截图的方法一般有这4种方式:1、Ctrl+PrScrn使用这个组合键截屏,获得的是整个屏幕的图片;2、Alt+PrScrn这个组合键截屏,获得的结果是当...
-
- qq空间为什么打不开了怎么办
-
1、首先我们需要在自己的手机上下载并安装最新版本的QQ空间,安装完成后打开QQ空间,登录自己的账号。2、首先我们尝试打开QQ空间,打不开在手机上找到设置,点击进入设置界面,在这里我们可以对手机进行部分设置。3、进入设置界面后,我们需要在其中...
-
2026-01-07 10:55 liuian
- 联想怎么恢复系统(联想电脑系统恢复怎么操作)
-
如果电脑重新分区,安装了操作系统就无法恢复到预装系统。 安装了系统,没有做系统备份也是无法恢复的,只能够重新安装。 联想电脑的一键还原系统在需要使用的时候直接按下一键还原按键即可,系统会自动进...
- 台式机无线网卡连不上wifi怎么办
-
1、无线网卡驱动没更新或者不匹配;解决办法:开始→控制面板→系统→硬件→设备管理器→网络适配器→右击无线网卡→更新驱动程序软件→按部就班完成更新;2、无线网络服务未开通;解决办法:开始→控制面板→管理...
- 126官方邮箱登录入囗(126邮箱登录入口手机版官网)
-
126邮箱是网易的一个免费邮箱登录入口在浏览器输入:mail.126.com浏览器进入126邮箱网站之后,即可自行登录126邮箱账号。如何在手机上登录126邮箱1、打开手机,找到并打开网易邮箱软件。2...
- 耐用笔记本电脑排行(最耐用笔记本排名)
-
最耐用的笔记本电脑是联想牌子。联想绝对是最耐用的,质量最好的轻薄本,也是最好用的轻薄本之一。联想笔记本电脑的质量和做工在世界上能称第一。十大公认最耐用笔记本如下1、华硕灵耀x14第12代英特尔酷睿i...
- 固态硬盘量产工具下载(固态硬盘量产工具下载合集)
-
固态硬盘量产工具好用的依次是:SLC颗粒最好,MLC颗粒其次,TLC颗粒再次,QLC颗粒现在最次;但是颗粒也分原厂颗粒,黑片,白片;原厂最好,黑片就是淘汰下来的渣渣。slc最好寿命长速度快也最贵...
- 文件夹怎么显示隐藏的文件夹
-
查找隐藏文件夹的方式如下:1、点击桌面的“计算机”,双击打开计算机2、在计算机页面中,点开自己存储文件夹的盘,这里以c盘为例。其他盘也可以依据这样的方式进行查找。3、找到左上角的“组织”,在其下拉的菜...
-
- 电脑硬盘怎么格式化干净(电脑硬盘格式化详细过程)
-
用普通格式化硬盘最干净,采用普通格式化,可以将硬盘中的内容删除掉,同时做上标志,而快速格式化只是对硬盘做了格式化标志,而没有删除内容硬盘格式化步骤:1,打开“我的电脑”,可以看到已经分区好但需要重新格式化的硬盘。2,用右键点击需要格式化的硬...
-
2026-01-07 06:55 liuian
- 下载的歌曲怎么转换成mp3格式
-
一般酷狗音乐下载的都是MP3格式的啊,如果不是的话,也可以通过以下方法来转换。;1、打开浏览器搜索关键词,找到该软件后下载并安装,然后双击打开,再点击“添加文件”。;2、添加后,在右下角选择转换格式为...
- 所有cpu性能天梯图(所有cpu性能天梯图都一样吗)
-
1、英特尔(Intel)i59400F酷睿六核盒装CPU处理器;2、英特尔(Intel)i7-9700K酷睿八核盒装CPU处理器;3、英特尔(Intel)i78700酷睿六核盒装...
- 电脑无故占用大量内存(电脑无故占用大量内存怎么办)
-
一种可能是后台运行太多,可能是你最近进行了很多任务,导致电脑占用内存变大。也可能是内在任务,类似于你引入了潜在任务,即电脑程序负荷太重,且程序存在不稳定因素,任务自动执行以缓解电脑压力。这个一般没事的...
-
- 控制自家wifi的软件防止蹭网
-
软件防蹭网是一种可以帮助用户保护无线网络安全的工具。它可以通过识别和阻止未授权的设备接入无线网络,保护用户的网络免受未经授权的访问和攻击。这些软件通常提供一些安全功能,如MAC地址过滤、WPA2加密、访客网络等,以确保只有授权的设备可以接入...
-
2026-01-07 04:55 liuian
- 电脑假死机解决方法(电脑假死现象)
-
1、看看你笔记本是否是双显卡的配置.在玩游戏和看视频时系统一般会自动启动独立显卡。所以可能就独显运行正常。问题可能和集显有关。2、你先到你笔记本官网,下载型号一致最新版本的主板、双显卡、声卡启动安...
- 一周热门
-
-
飞牛OS入门安装遇到问题,如何解决?
-
如何在 iPhone 和 Android 上恢复已删除的抖音消息
-
Boost高性能并发无锁队列指南:boost::lockfree::queue
-
大模型手册: 保姆级用CherryStudio知识库
-
用什么工具在Win中查看8G大的log文件?
-
如何在 Windows 10 或 11 上通过命令行安装 Node.js 和 NPM
-
威联通NAS安装阿里云盘WebDAV服务并添加到Infuse
-
Trae IDE 如何与 GitHub 无缝对接?
-
idea插件之maven search(工欲善其事,必先利其器)
-
如何修改图片拍摄日期?快速修改图片拍摄日期的6种方法
-
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
