Python讀取Doc表格
數碼 1
本文將為大家介紹如何使用Python讀取Doc表格。
在使用Python讀取Doc表格之前,需要先安裝Python Docx庫。
pip install python-docx
安裝完成後即可開始使用。
使用Python Docx庫讀取文件非常簡單,只需要調用”docx.Document()”即可。
import docx
document = docx.Document('example.docx')
上述代碼將打開”example.docx”文件並將其存儲在一個名為”document”的對象中。
讀取表格需要使用”tables”屬性,並使用”rows”和”cells”屬性來訪問表格中的行和單元格。
import docx
document = docx.Document('example.docx')
# 遍歷所有表格
for table in document.tables:
# 遍歷表格中的所有行
for row in table.rows:
# 遍歷行中的所有單元格
for cell in row.cells:
print(cell.text)
上述代碼將打印出每個單元格的文本內容。
如果只需要讀取表格中的特定單元格,可以使用索引來訪問。
import docx
document = docx.Document('example.docx')
# 獲取第一個表格中的第二行第二列單元格
cell = document.tables[0].rows[1].cells[1]
print(cell.text)
上述代碼將打印出第一個表格中第二行第二列單元格的文本內容。
如果需要讀取整個表格,可以將表格中的所有單元格存儲在一個列表中。
import docx
document = docx.Document('example.docx')
# 獲取第一個表格中的所有單元格
table_cells = []
for row in document.tables[0].rows:
for cell in row.cells:
table_cells.append(cell.text)
print(table_cells)
上述代碼將打印出第一個表格中所有單元格的文本內容,並將其存儲在一個列表中。
如果一個Doc文件中包含多個表格,可以使用索引來分別讀取每個表格。
import docx
document = docx.Document('example.docx')
# 獲取第一個表格中的所有單元格
table_cells1 = []
for row in document.tables[0].rows:
for cell in row.cells:
table_cells1.append(cell.text)
# 獲取第二個表格中的所有單元格
table_cells2 = []
for row in document.tables[1].rows:
for cell in row.cells:
table_cells2.append(cell.text)
print(table_cells1)
print(table_cells2)
上述代碼將打印出第一個表格和第二個表格中所有單元格的文本內容,並將其分別存儲在兩個列表中。
通過本文,我們了解了如何使用Python Docx庫讀取Doc文件中的表格。首先,我們需要安裝Python Docx庫。然後,我們可以使用”docx.Document()”命令打開文件。接着,我們可以使用”tables”屬性遍歷所有表格,並使用”rows”和”cells”屬性訪問表格中的行和單元格。如果需要讀取特定單元格,可以使用索引。如果需要讀取整個表格,可以將表格中的所有單元格存儲在一個列表中。如果一個Doc文件中包含多個表格,可以使用索引來分別讀取每個表格。