如何使用python拆分已解析的html輸出？

Question

我有這個HTML

<tr class="BgWhite"> 
 <td headers="th6" valign="top">
    0070648261<br/>QTY: 3
 </td>
</tr>

我想分別獲得“ 0070648261”和“ 3”，如ID = 0070648261和數量=3。我能夠使用下面的代碼

container1.find("td", {"headers": "th6"}).text.strip()

產生這個輸出

   0070648261<br/>QTY: 3

但是我如何拆分和輸出得到

ID = 0070648261數量= 3？

Answer 1

嘗試這個。

a="0070648261<br/>QTY: 3"
a=a.split("<br/>")
a="ID = "+a[0]+" quantity ="+a[1].split(':')[1]

輸出：

'ID = 0070648261 quantity = 3'

Answer 2

為什么不使用正則表達式呢？

import re
s = '<tr class="BgWhite"> <td headers="th6" valign="top">0070648261<br/>QTY: 3</td></tr>'

res = re.findall(r'(\d+)<br/>QTY: (\d+)', s)[0]
print('ID = {} quantity = {}'.format(res[0], res[1]))

如何使用python拆分已解析的html輸出？

問題描述

2 個解決方案

解決方案1
1 2017-09-07 23:34:59

解決方案2
1 2017-09-07 23:55:53

如何使用python拆分已解析的html輸出？

問題描述

2 個解決方案

解決方案1 1 2017-09-07 23:34:59

解決方案2 1 2017-09-07 23:55:53

解決方案1
1 2017-09-07 23:34:59

解決方案2
1 2017-09-07 23:55:53