如何使用Python将HTML转换为PDF

在现代互联网时代，网页成为了人们获取各类信息、交流以及展示自我的重要平台之一。在一些特定的场合，我们还需要将网页交付给客户，而这时需要一个跨平台的文件格式，这时，PDF文件格式成为了最好的选择。因此，将HTML转换为PDF文件格式已经成为了一项在IT行业和文档处理中普遍存在的需求。本文主要介绍如何使用Python将HTML转换为PDF，在此之前，我们首先介绍几个相关的Python库。

更多Python文章，请阅读：Python 教程

相关Python库

wkhtmltopdf
wkhtmltopdf是一个基于Webkit、Qt和Python的HTML到PDF转换工具。它提供了在命令行下的操作，所以我们可以在Python中使用subprocess库来调用它，实现将HTML文件转换成PDF文件。

使用方式：

   wkhtmltopdf http://www.baidu.com output.pdf

这样就可以将百度的网页转换成PDF文件。

pdfkit
pdfkit是一个Python库，它是wkhtmltopdf的Python封装版本。pdfkit使用起来更加方便，同时它还支持从字符串、url、本地文件中生成PDF。pdfkit是一个基于wkhtmltopdf的PDF生成库，同时它的应用场景更加广泛。

使用方式：

   import pdfkit

   pdfkit.from_url('http://www.baidu.com', 'out.pdf')

以上代码将百度的网页转换成PDF文件，并保存在当前目录的out.pdf文件中。

weasyprint
weasyprint是一个Python库，它可以将HTML和CSS转换成PDF文件。同时，weasyprint还提供了一些高级的特性，例如支持生成页眉、页脚、页面断点等等。

使用方式：

   from weasyprint import HTML

   HTML('http://www.baidu.com').write_pdf('out.pdf')

以上代码同样将百度的网页转换成PDF文件，并保存在当前目录的out.pdf文件中。

HTML转换为PDF

通过以上介绍，我们可以知道，Python有多种方式将HTML文件转换为PDF文件，接下来，我们将通过代码的方式介绍一下三种库的转换方式。

使用wkhtmltopdf进行转换。

   import subprocess

   def convert_using_wkhtmltopdf(input_html_path, output_pdf_path):
       args = ['wkhtmltopdf', input_html_path, output_pdf_path]
       subprocess.call(args)

   input_html_path = '/path/to/input.html'
   output_pdf_path = '/path/to/output.pdf'
   convert_using_wkhtmltopdf(input_html_path, output_pdf_path)

以上代码可以将输入的HTML文件转换成相应的PDF文件。

使用pdfkit进行转换。

   import pdfkit

   def convert_using_pdfkit(input_html_path, output_pdf_path):
       pdfkit.from_file(input_html_path, output_pdf_path)

   input_html_path = '/path/to/input.html'
   output_pdf_path = '/path/to/output.pdf'
   convert_using_pdfkit(input_html_path, output_pdf_path)

以上代码中，我们使用pdfkit中的from_file函数直接将HTML文件进行转换。

使用weasyprint进行转换。

   from weasyprint import HTML

   def convert_using_weasyprint(input_html_path, output_pdf_path):
       HTML(filename=input_html_path).write_pdf(output_pdf_path)

   input_html_path = '/path/to/input.html'
   output_pdf_path = '/path/to/output.pdf'
   convert_using_weasyprint(input_html_path, output_pdf_path)

以上代码中，我们通过weasyprint将HTML文件进行转换。