在線PDF文件的各種操作

一、在線PDF文件壓縮

1、PDF文件中圖像或文字過多時,文件大小會變得很大,傳輸、存儲都會帶來麻煩。在線PDF文件壓縮工具可以幫助我們壓縮文件大小,使其更便於傳輸。

2、例如我們使用PDF壓縮器的API功能,實現如下:

from pdfcompressor import compress_pdf_file
compress_pdf_file('input.pdf', 'compressed_output.pdf')

3、這個API會將「input.pdf」文件壓縮後,輸出到「compressed_output.pdf」文件中。

二、下載學籍在線驗證報告PDF文件

1、在某些情況下,我們需要向學校或教育機構提供學籍在線驗證報告的PDF文件。這時,我們需要找到可靠的下載鏈接進行下載。

2、例如,我們可以使用以下代碼從學籍在線驗證網站下載PDF文件:

import requests

url = 'https://www.xuejiqianzhi.com/find'

data = {
    'name': '姓名',
    'idcard': '身份證號',
}

resp = requests.post(url, params=data)

with open('report.pdf', 'wb') as f:
    f.write(resp.content)

3、根據個人情況填寫姓名和身份證號,並將網站提供的URL替換為上述代碼中的URL,就可以下載學籍在線驗證報告的PDF文件。

三、在線PDF文件怎麼下載

1、有時候我們在網上看到一篇PDF文章或者文檔,想將其下載下來保存,這時我們需要知道其下載鏈接。

2、這裡以chrome瀏覽器為例,只需要在文件鏈接上右鍵,選擇「複製鏈接地址」即可得到下載鏈接,然後將鏈接粘貼至下載工具中即可進行下載。

四、PDF文件在線壓縮免費

1、有些在線PDF文件壓縮工具需要收費才能使用,但是我們同樣可以找到免費的在線PDF文件壓縮工具。

2、例如,我們可以使用Soda PDF提供的在線PDF壓縮器:

import requests

url = 'https://www.sodapdf.com/upload/'

files = {'file': open('input.pdf', 'rb')}

resp = requests.post(url, files=files)

with open('compressed_output.pdf', 'wb') as f:
    f.write(resp.content)

3、這個API會將「input.pdf」文件壓縮後,輸出到「compressed_output.pdf」文件中。

五、在線PDF文件轉換txt格式

1、有時候我們需要將PDF文檔轉換成txt格式,這時我們可以使用PDFminer來實現。

2、下面是使用PDFminer將PDF轉換成txt的例子:

from pdfminer.high_level import extract_text

text = extract_text("input.pdf")

with open("output.txt", "w", encoding="utf-8") as f:
    f.write(text)

3、這個API會將「input.pdf」文件轉換成txt格式,並輸出到「output.txt」文件中。

六、PDF文件在線轉圖片

1、如果我們需要將PDF文件的每一頁轉換成圖片,就需要使用PDF轉圖片的工具。

2、例如,我們可以使用pdftoppm工具來完成轉換:

import subprocess

subprocess.call(['pdftoppm', '-png', 'input.pdf', 'output'])

3、這個API會將「input.pdf」文件轉換成PNG格式的圖片,輸出到名字為「output」的文件夾中。這個文件夾中包含PDF文檔中所有頁面的圖片。

七、在線PDF文件瘦身

1、有時候我們需要將PDF文件的體積變小,以便於傳輸和存儲。

2、PDF文件瘦身的工具有很多,例如Ghostscript,可以通過以下方式來實現:

import subprocess

subprocess.call(['gs', '-sDEVICE=pdfwrite', '-dCompatibilityLevel=1.4', '-dPDFSETTINGS=/default', '-dNOPAUSE', '-dBATCH', '-sOutputFile=output.pdf', 'input.pdf'])

3、這個API將會使用Ghostscript將「input.pdf」文件瘦身並輸出到「output.pdf」文件中。

八、在線拆分PDF文件

1、有時候我們需要將一個大的PDF文件拆分成多個小的PDF文件。

2、例如,我們可以使用PyPDF2來實現:

import PyPDF2

pdf_file = open('input.pdf', 'rb')
pdf_reader = PyPDF2.PdfFileReader(pdf_file)

for i in range(pdf_reader.getNumPages()):
    pdf_writer = PyPDF2.PdfFileWriter()

    pdf_writer.addPage(pdf_reader.getPage(i))

    with open(f'output_{i+1}.pdf', 'wb') as pdf_output_file:
        pdf_writer.write(pdf_output_file)

3、這個API會將「input.pdf」文件拆分成多個名字為「output_X.pdf」的文件,其中X為拆分後的頁碼。

九、在線PDF文件分割器

1、有時候我們需要將PDF文件分割成多個部分,這時我們可以使用Pypdf2。

2、例如,下面的代碼可以將「input.pdf」文件的前兩頁轉換成一個單獨的PDF文件:「output.pdf」:

import PyPDF2

pdf_file = open('input.pdf', 'rb')
basic_pdf_reader = PyPDF2.PdfFileReader(pdf_file)

pdf_writer = PyPDF2.PdfFileWriter()
pdf_writer.addPage(basic_pdf_reader.getPage(0))
pdf_writer.addPage(basic_pdf_reader.getPage(1))

with open('output.pdf', 'wb') as pdf_output_file:
    pdf_writer.write(pdf_output_file)

3、這個API會將「input.pdf」文件的前兩頁轉換成一個單獨的PDF文件:「output.pdf」。

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/236611.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-12 12:00
下一篇 2024-12-12 12:01

相關推薦

發表回復

登錄後才能評論