如何在 BeautifulSoup 對象中搜索字符串？

Question

我正在檢查 Craigslist 的帖子，看看它們是否已被標記為刪除。 我的腳本非常簡單：

import requests
from bs4 import BeautifulSoup

def check_if_flagged(url):
    page = requests.get (url)
    soup = BeautifulSoup(page.content, 'html.parser')
    return ('flagged for removal' in soup)

問題是，我有一個 url，我知道一個事實已被標記為刪除，但check_if_flagged返回False 。 這是在 BeautifulSoup 對象中搜索子字符串的正確方法嗎？ 有沒有更優化的方法？ 如果您重現此錯誤，請告訴我。

這是供參考的網址：'https://newyork.craigslist.org/brk/apa/d/brooklyn-1-bedroom-1-bath-apt-located/7206865558.html'

Answer 1

要搜索湯中的文本，您可以使用text=屬性。 或者您可以將返回的 HTML 代碼搜索為字符串：

import requests
from bs4 import BeautifulSoup

def check_if_flagged(url):
    page = requests.get(url).text
    return 'this posting has been flagged for removal' in page.lower()

def check_if_flagged2(url):
    page = requests.get(url)
    soup = BeautifulSoup(page.content, 'html.parser')
    return bool(soup.find(text=lambda t: 'this posting has been flagged for removal' in t.lower()))

url = 'https://newyork.craigslist.org/brk/apa/d/brooklyn-1-bedroom-1-bath-apt-located/7206865558.html'
print(check_if_flagged(url))
print(check_if_flagged2(url))

印刷：

True
True

如何在 BeautifulSoup 對象中搜索字符串？

問題描述

1 個解決方案

解決方案1
0 2020-10-27 17:47:57

如何在 BeautifulSoup 對象中搜索字符串？

問題描述

1 個解決方案

解決方案1 0 2020-10-27 17:47:57

解決方案1
0 2020-10-27 17:47:57