Python-美麗的湯-刪除標簽

Question

我已使用Beautiful Soup提取了以下基於Web的數據作為列表。 在原始網站上是一張數字表：

[<td class="right">113</td>, <td class="right">
 89 </td>, <td class="right last">
<b>117</b> </td>, <td class="right">113</td>, <td class="right">
 85 </td>, <td class="right last">
<b>114</b> </td>, <td class="right">100</td>, <td class="right">
 56 </td>, <td class="right last">
<b>84</b> </td>]

從此數據創建數字列表的最有效方法是什么？ 理想情況下，我想使用Beautiful Soup提取標簽，但是我無法從文檔中弄清楚如何做到這一點。

我原來的湯代碼是：

print soup.find_all('td', 'right')             #printing this produces the above data

numbers_data = []                              #my attempt to extract tags
for e in soup.find_all('td', 'right'):
    numbers_data.append(e.extract())

print numbers_data

兩者都返回相同的列表。

Answer 1

numbers_data = [int(e.text) for e in soup.find_all('td', 'right')]

print numbers_data

Python-美麗的湯-刪除標簽

問題描述

1 個解決方案

解決方案1
1 已采納 2013-09-25 22:46:43

Python-美麗的湯-刪除標簽

問題描述

1 個解決方案

解決方案1 1 已采納 2013-09-25 22:46:43

解決方案1
1 已采納 2013-09-25 22:46:43