一、在線PDF文件壓縮
1、PDF文件中圖像或文字過多時,文件大小會變得很大,傳輸、存儲都會帶來麻煩。在線PDF文件壓縮工具可以幫助我們壓縮文件大小,使其更便於傳輸。
2、例如我們使用PDF壓縮器的API功能,實現如下:
from pdfcompressor import compress_pdf_file compress_pdf_file('input.pdf', 'compressed_output.pdf')
3、這個API會將「input.pdf」文件壓縮後,輸出到「compressed_output.pdf」文件中。
二、下載學籍在線驗證報告PDF文件
1、在某些情況下,我們需要向學校或教育機構提供學籍在線驗證報告的PDF文件。這時,我們需要找到可靠的下載鏈接進行下載。
2、例如,我們可以使用以下代碼從學籍在線驗證網站下載PDF文件:
import requests url = 'https://www.xuejiqianzhi.com/find' data = { 'name': '姓名', 'idcard': '身份證號', } resp = requests.post(url, params=data) with open('report.pdf', 'wb') as f: f.write(resp.content)
3、根據個人情況填寫姓名和身份證號,並將網站提供的URL替換為上述代碼中的URL,就可以下載學籍在線驗證報告的PDF文件。
三、在線PDF文件怎麼下載
1、有時候我們在網上看到一篇PDF文章或者文檔,想將其下載下來保存,這時我們需要知道其下載鏈接。
2、這裡以chrome瀏覽器為例,只需要在文件鏈接上右鍵,選擇「複製鏈接地址」即可得到下載鏈接,然後將鏈接粘貼至下載工具中即可進行下載。
四、PDF文件在線壓縮免費
1、有些在線PDF文件壓縮工具需要收費才能使用,但是我們同樣可以找到免費的在線PDF文件壓縮工具。
2、例如,我們可以使用Soda PDF提供的在線PDF壓縮器:
import requests url = 'https://www.sodapdf.com/upload/' files = {'file': open('input.pdf', 'rb')} resp = requests.post(url, files=files) with open('compressed_output.pdf', 'wb') as f: f.write(resp.content)
3、這個API會將「input.pdf」文件壓縮後,輸出到「compressed_output.pdf」文件中。
五、在線PDF文件轉換txt格式
1、有時候我們需要將PDF文檔轉換成txt格式,這時我們可以使用PDFminer來實現。
2、下面是使用PDFminer將PDF轉換成txt的例子:
from pdfminer.high_level import extract_text text = extract_text("input.pdf") with open("output.txt", "w", encoding="utf-8") as f: f.write(text)
3、這個API會將「input.pdf」文件轉換成txt格式,並輸出到「output.txt」文件中。
六、PDF文件在線轉圖片
1、如果我們需要將PDF文件的每一頁轉換成圖片,就需要使用PDF轉圖片的工具。
2、例如,我們可以使用pdftoppm工具來完成轉換:
import subprocess subprocess.call(['pdftoppm', '-png', 'input.pdf', 'output'])
3、這個API會將「input.pdf」文件轉換成PNG格式的圖片,輸出到名字為「output」的文件夾中。這個文件夾中包含PDF文檔中所有頁面的圖片。
七、在線PDF文件瘦身
1、有時候我們需要將PDF文件的體積變小,以便於傳輸和存儲。
2、PDF文件瘦身的工具有很多,例如Ghostscript,可以通過以下方式來實現:
import subprocess subprocess.call(['gs', '-sDEVICE=pdfwrite', '-dCompatibilityLevel=1.4', '-dPDFSETTINGS=/default', '-dNOPAUSE', '-dBATCH', '-sOutputFile=output.pdf', 'input.pdf'])
3、這個API將會使用Ghostscript將「input.pdf」文件瘦身並輸出到「output.pdf」文件中。
八、在線拆分PDF文件
1、有時候我們需要將一個大的PDF文件拆分成多個小的PDF文件。
2、例如,我們可以使用PyPDF2來實現:
import PyPDF2 pdf_file = open('input.pdf', 'rb') pdf_reader = PyPDF2.PdfFileReader(pdf_file) for i in range(pdf_reader.getNumPages()): pdf_writer = PyPDF2.PdfFileWriter() pdf_writer.addPage(pdf_reader.getPage(i)) with open(f'output_{i+1}.pdf', 'wb') as pdf_output_file: pdf_writer.write(pdf_output_file)
3、這個API會將「input.pdf」文件拆分成多個名字為「output_X.pdf」的文件,其中X為拆分後的頁碼。
九、在線PDF文件分割器
1、有時候我們需要將PDF文件分割成多個部分,這時我們可以使用Pypdf2。
2、例如,下面的代碼可以將「input.pdf」文件的前兩頁轉換成一個單獨的PDF文件:「output.pdf」:
import PyPDF2 pdf_file = open('input.pdf', 'rb') basic_pdf_reader = PyPDF2.PdfFileReader(pdf_file) pdf_writer = PyPDF2.PdfFileWriter() pdf_writer.addPage(basic_pdf_reader.getPage(0)) pdf_writer.addPage(basic_pdf_reader.getPage(1)) with open('output.pdf', 'wb') as pdf_output_file: pdf_writer.write(pdf_output_file)
3、這個API會將「input.pdf」文件的前兩頁轉換成一個單獨的PDF文件:「output.pdf」。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/236611.html