[英]how do I split parsed html output using python?
我有這個HTML
<tr class="BgWhite">
<td headers="th6" valign="top">
0070648261<br/>QTY: 3
</td>
</tr>
我想分別獲得“ 0070648261”和“ 3”,如ID = 0070648261和數量=3。我能夠使用下面的代碼
container1.find("td", {"headers": "th6"}).text.strip()
產生這個輸出
0070648261<br/>QTY: 3
但是我如何拆分和輸出得到
ID = 0070648261數量= 3?
嘗試這個。
a="0070648261<br/>QTY: 3"
a=a.split("<br/>")
a="ID = "+a[0]+" quantity ="+a[1].split(':')[1]
輸出:
'ID = 0070648261 quantity = 3'
為什么不使用正則表達式呢?
import re
s = '<tr class="BgWhite"> <td headers="th6" valign="top">0070648261<br/>QTY: 3</td></tr>'
res = re.findall(r'(\d+)<br/>QTY: (\d+)', s)[0]
print('ID = {} quantity = {}'.format(res[0], res[1]))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.