我如何用美丽的汤提取嵌套的跨度类值？

Question

我正在努力弄清楚我需要告诉 Beautiful Soup抓取标签“amount”值的元素是什么，在此代码示例中为“1,56”。

我正在粘贴我想要抓取的网页的代码摘录：

<td class="line-content">
      <span class="html-tag">
       &lt;div
       <span class="html-attribute-name">
        class
       </span>
       ='
       <span class="html-attribute-value">
        the-price
       </span>
       '
       <span class="html-attribute-name">
        style
       </span>
       ='
       <span class="html-attribute-value">
        margin-top:20px;
       </span>
       '&gt;
      </span>
     </td>
    </tr>
    <tr>
     <td class="line-number" value="447">
     </td>
     <td class="line-content">
      <span class="html-tag">
       &lt;span
       <span class="html-attribute-name">
        class
       </span>
       ='
       <span class="html-attribute-value">
        currency
       </span>
       '&gt;
      </span>
      €
      <span class="html-tag">
       &lt;/span&gt;
      </span>
      <span class="html-tag">
       &lt;span
       <span class="html-attribute-name">
        class
       </span>
       ='
       <span class="html-attribute-value">
        amount
       </span>
       '&gt;
      </span>
      1,56
      <span class="html-tag">
       &lt;/span&gt;
      </span>
     </td>
    </tr>

你能启发我吗？ 我真的很感激任何帮助。

Answer 1

您可以像这样定位数量（ data是您的 HTML 字符串）：

from bs4 import BeautifulSoup
soup = BeautifulSoup(data, 'html.parser')

span_with_amount = soup.find(lambda tag: tag.name == 'span' and tag.get_text(strip=True) == 'amount')
value = span_with_amount.parent.find_next_sibling(text=True)
print(value.strip())

印刷：

1,56

首先，我们将找到带有文本“amount”的<span> ，然后我们将找到此<span>的父级旁边的文本。

我如何用美丽的汤提取嵌套的跨度类值？

问题描述

1 个解决方案

解决方案1
1 已采纳 2019-12-02 21:53:47

我如何用美丽的汤提取嵌套的跨度类值？

问题描述

1 个解决方案

解决方案1 1 已采纳 2019-12-02 21:53:47

解决方案1
1 已采纳 2019-12-02 21:53:47