[英]Extracting Table Data from RTF files in Python
我需要從 RTF 文件中提取表數據,但我似乎無法獲得與此相關的任何解決方案。 任何人都可以提出解決方案或以前做過這個並且願意向我展示dawae嗎? 我目前正在探索將我定義為表的開始和結束的內容更改為諸如抑揚符之類的內容。
我只導出了表格的開頭,就像
\par \ltrrow}
但是對於表的末尾,我似乎找不到合適的語法....
提前致謝。 :)
這是使用正則表達式將 rtf 格式轉換為純文本的示例
import re
text = r"{\rtf1\ansi\ansicpg1252\deff0\deflang1033{\fonttbl{\f0\fnil\fcharset0 MS Shell Dlg 2;}{\f1\fnil MS Shell Dlg 2;}} {\colortbl ;\red0\green0\blue0;} {\*\generator Msftedit 5.41.15.1507;}\viewkind4\uc1\pard\tx720\cf1\f0\fs20 can u send me info for the call plsssss\f1\par }"
x = re.sub(r"{\*?\\.+(;})|\s?\\[A-Za-z0-9]+|\s?{\s?\\[A-Za-z0-9]+\s?|\s?}\s?", "", text)
print(x)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.