簡體   English   中英

python regex匹配任何有效的英語句子

[英]python regex to match any valid english sentence

我想知道是否可以編寫python regex使其與任何可以包含字母數字字符和特殊字符的有效英語句子匹配。
基本上,我想從XML文件中提取一些特定的元素。 這些特定元素將具有以下形式:

<p o=<Any Number>> <Any English sentence> </p>  

例如:

<p o ="1"> The quick brown fox jumps over the lazy dog </p>

要么

<p o ="2">  And This is a number 12.90! </p>

我們可以輕松地為

<p o=<Any Number>>

</p>標簽。 但是我有興趣通過編寫正則表達式組來提取這些標簽之間的句子。

誰能建議使用正則表達式解決以上問題?

另外,如果您可以提出一種解決方法,那么它對我也真的很有幫助。

使用像lxml這樣的XML解析器,正則表達式不適用於此任務。 例:

import lxml.etree
// First we parse the xml
doc = lxml.etree.fromstring('<p o ="2">  And This is a number 12.90! </p>')
// Then we use xpath to extract the element we need
doc.xpath('/p/text()')

您可以在以下位置閱讀有關XPATH的更多信息: Xpath教程

您應該真正使用xml解析器。 此處的示例http://www.travisglines.com/web-coding/python-xml-parser-tutorial

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM