[英]Python regular expression; match on the last instance
我有一堆正在嘗試處理的html。 我想刪除我的最后一半標簽。 基本上我是從:
</div></div><div class="_3o-d" id="education
並希望以:
</div></div>
我試過了:
workSection = re.split('<.*?$',workSection)[0]
但這與第一個'<'相匹配,並給我留下了一個空字符串。 有沒有辦法只匹配最后一個實例? 還是以某種方式從頭開始?
我也知道,先拆分然后采取第一個選擇可能不是這樣做的最佳方法,並且准備立即采取行動。
只需使用[^<]
代替即可.
>>> re.split('<[^<]*$', '</div></div><div class="_3o-d" id="education')
['</div></div>', '']
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.