一、PyPDF2 模塊介紹
PyPDF2是一個用於操作PDF文件的Python庫,它可以合併、裁剪、旋轉、分割、加密、解密、轉換PDF頁到圖像(JPEG,JPG,PNG等),以及將HTML轉化為PDF格式等。PyPDF2提供了創建、閱讀和更新PDF文檔的功能,並且容易使用。
import PyPDF2
pdf_file = open('example.pdf', 'rb')
read_pdf = PyPDF2.PdfFileReader(pdf_file)
# 獲取PDF頁數
pages = read_pdf.getNumPages()
print(pages)
# 獲取PDF頁內容
for page_num in range(pages):
page = read_pdf.getPage(page_num)
content = page.extractText()
print(content)
pdf_file.close()
二、pdfkit 模塊介紹
pdfkit是一個Python模塊,它使用WebKit來將HTML內容轉換成PDF文件。該模塊可以讓你輕鬆地將HTML文件轉換成PDF文件,並支持表格、圖像和其他HTML元素。pdfkit還支持設置生成PDF文件的頁面大小和方向。
import pdfkit
# HTML轉PDF
pdfkit.from_file('example.html', 'example.pdf')
# 設置頁面大小
pdfkit.from_file('example.html', 'example.pdf', options={
'page-size': 'Letter',
'margin-top': '0.75in',
'margin-right': '0.75in',
'margin-bottom': '0.75in',
'margin-left': '0.75in'
})
三、WeasyPrint 模塊介紹
WeasyPrint是一個純Python模塊,它將HTML/CSS文檔轉換為PDF文件。可以使用WeasyPrint輕鬆地將HTML格式的文件轉換為精美的PDF格式。
WeasyPrint是一個開放源代碼項目,可以在Linux、macOS、Windows等各種平台上運行。它使用WebKit來呈現HTML/CSS,並將其轉換為PDF文件。
import weasyprint
# HTML轉PDF
weasyprint.HTML('example.html').write_pdf('example.pdf')
# 指定頁面大小
weasyprint.HTML('example.html').write_pdf('example.pdf', stylesheets=[
weasyprint.CSS('styles.css'),
], size=(800, 600))
四、Conclusion
以上就是Python中常見的HTML轉換PDF方法。使用這些模塊,您可以輕鬆地將HTML內容轉換成高質量的PDF文件,並將其保存在本地或上傳到服務器。如果您需要將HTML格式的數據轉換成PDF格式,那麼這些模塊就是您的選擇。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/154225.html