在这篇文章中我们来了解一下PDFKit,它是一个PDF文档生成开源库。这是使用 Python 将任何网页转换为 PDF 的最简单方法。
将 HTML 转换为 PDF 的先决条件
在开始使用 python 代码之前,请确保安装 PDFKit。要安装 PDFKit,请使用以下命令。
$ pip install pdfkit (or pip3 for python3)
安装库后,安装wkhtmltopdf
. 它是一个开源命令行工具,用于使用 Qt WebKit 渲染引擎将 HTML 渲染为 PDF 和各种图像格式。
对于 Debian/Ubuntu:
$ sudo apt-get install wkhtmltopdf
对于 macOS
$ brew install homebrew/cask/wkhtmltopdf
对于 Windows,请单击此处。
请记住将路径添加 wkhtmltopdf
到环境变量中以避免错误。
使用 Python 将 HTML 转换为 PDF
在实现时,如果您的编辑器抛出“ImportError:没有名为 pdfkit 的模块”之类的错误,请尝试配置当前目录中的路径。这可以通过预先在编辑器中执行以下代码来完成。
path_wkthmltopdf = 'C:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe' config = pdfkit.configuration(wkhtmltopdf = path_wkthmltopdf) |
将网站 URL 转换为 PDF
import pdfkit pdfkit.from_url( "https://www.askpython.com/" , "sample_url.pdf" ) |
输出
将 HTML 文件转换为 PDF
- 请记住,您要转换为 PDF 的文件应采用
.HTML
格式。 - 此外,该文件应该存在于同一目录中。
import pdfkit pdfkit.from_file( "sample.html" , "sample_file.pdf" ) |
输出
将字符串转换为 PDF
import pdfkit pdfkit.from_string( 'AskPython :)' , 'sample_string.pdf' ) |
输出
概括
在本文中,我们讨论了 PDFKit 包装器或库。PDFKit for python 是 ruby PDFKit 库的改编版本。此外,我们还学习了在 python 中将网页、HTML 文件或字符串转换为 PDF 的最简单方法。