簡體   English   中英

用beautifulsoup刮桌子

[英]scraping tables with beautifulsoup

我似乎被卡住了,如果我有下表:

<table align=center cellpadding=3 cellspacing=0 border=1>
<tr bgcolor="#EEEEFF">
   <td align="center">
   40   </td>
   <td align="center">
   44   </td>
   <td align="center">
   <font color="green"><b>+4</b></font>
   </td>
   <td align="center">
   1,000</td>
   <td align="center">
   15,000   </td>
   <td align="center">
   44,000   </td>
   <td align="center">
   <font color="green"><b><nobr>+193.33%</nobr></b></font>
   </td>

</tr> 

使用find_all從表中提取44,000 td的理想方法是什么?

如果它是表的重復位置,您想刮一下,您想刮一下,我將使用漂亮的湯來提取表中的所有元素,然后提取該數據。 請參閱下面的偽代碼。

known_position = 5
tds = bs4.find_all('td')
number = tds[known_position].text()

另一方面,如果您要專門搜索給定的數字,則只需要遍歷列表即可。

tds = bs4.find_all('td')
for td in tds:
    if td.text = 'number here':
        # do your stuff

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM