[英]How to copy each paragraph from .docx file to new row in .csv file?
我是python的新手。 我正在嘗試解析.docx文件,並將每個段落復制到新.csv文件中的單獨行中。
我能夠准確地計算出段落的數量,以及打印整個文檔,但是在嘗試遍歷文檔以解析每個段落時遇到錯誤。
因此,您可以從安裝名為“ docx”的軟件包開始(如果您具有python2或在python3中使用“ pip install python-docx”,請在終端或命令行上執行“ pip install docx”)。
然后,您可以運行以下代碼:
from docx import Document
import pandas as pd
document = Document('text.docx')
df = pd.DataFrame(columns=['paragraph'])
for para in document.paragraphs:
print(para.text)
df.loc[len(df)] = para.text
print(df)
希望對您有所幫助。 BR
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.