簡體   English   中英

從word文檔中提取表格

[英]Extracting tables from a word doc

是否有任何工具可以從 word 文檔中提取所有表格並將它們轉換為 csv 文件或任何 excel 擴展文件,使用 python 或 Z2E47AED18ABB27191

請注意,word 文件包含文本和表格。

您可以將pandaspython-docx一起使用。 根據這個答案,您可以從文檔中提取所有表格並將它們放在一個列表中:

from docx import Document
import pandas as pd
document = Document('test.docx')

tables = []
for table in document.tables:
    df = [['' for i in range(len(table.columns))] for j in range(len(table.rows))]
    for i, row in enumerate(table.rows):
        for j, cell in enumerate(row.cells):
            if cell.text:
                df[i][j] = cell.text
    tables.append(pd.DataFrame(df))

然后,您可以通過遍歷列表將表保存到 csv 文件:

for nr, i in enumerate(tables):
    i.to_csv("table_" + str(nr) + ".csv")

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM