Python 中的 PDFKit 模块 – 将 HTML 转换为 PDF

在这篇文章中我们来了解一下PDFKit,它是一个PDF文档生成开源库。这是使用 Python 将任何网页转换为 PDF 的最简单方法。

将 HTML 转换为 PDF 的先决条件

在开始使用 python 代码之前,请确保安装 PDFKit。要安装 PDFKit,请使用以下命令。

$ pip install pdfkit  (or pip3 for python3)

安装库后,安装wkhtmltopdf. 它是一个开源命令行工具,用于使用 Qt WebKit 渲染引擎将 HTML 渲染为 PDF 和各种图像格式。

对于 Debian/Ubuntu:

$ sudo apt-get install wkhtmltopdf

对于 macOS

$ brew install homebrew/cask/wkhtmltopdf

对于 Windows,请单击此处。

请记住将路径添加 wkhtmltopdf 到环境变量中以避免错误。

使用 Python 将 HTML 转换为 PDF

在实现时,如果您的编辑器抛出“ImportError:没有名为 pdfkit 的模块”之类的错误,请尝试配置当前目录中的路径。这可以通过预先在编辑器中执行以下代码来完成。

path_wkthmltopdf = 'C:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe'
config = pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf)

将网站 URL 转换为 PDF

import pdfkit
 
pdfkit.from_url("https://www.askpython.com/", "sample_url.pdf")

输出

PDF套件1

将 HTML 文件转换为 PDF

  • 请记住,您要转换为 PDF 的文件应采用.HTML 格式。
  • 此外,该文件应该存在于同一目录中。
import pdfkit
 
pdfkit.from_file("sample.html", "sample_file.pdf")

输出

PDF套件2

将字符串转换为 PDF

import pdfkit
 
pdfkit.from_string('AskPython :)','sample_string.pdf')

输出

PDF套件3

概括

在本文中,我们讨论了 PDFKit 包装器或库。PDFKit for python 是 ruby​​ PDFKit 库的改编版本。此外,我们还学习了在 python 中将网页、HTML 文件或字符串转换为 PDF 的最简单方法。