Python Web Scraping 同一个类

Question

我正在寻找一些帮助，所以我在网络抓取方面很糟糕，我仍在学习基础知识和东西。 所以我正在开发一个应用程序，你可以把你的问题放在应用程序中，它会从谷歌获取答案并返回/打印（）答案。 所以当你在谷歌中输入一个问题，比如“什么是字母？” 谷歌返回两种解释：

代表语音中使用的一种或多种声音的字符； 字母表的任何符号。 “大写字母”
书面、打印或打印的通信，通过邮寄或信使在信封中发送。 “他给福尔克纳夫人寄了一封信”

现在......在检查元素时两者都得到了相同的类。 这使得 print() 两种解释都无法输出。 因为当我进入两个解释都有的课程时，它只打印出第一个（1.）一个，我不太明白，即使他们有相同的课程，也有什么办法可以打印出来？ 这是我的代码：

import requests
from bs4 import BeautifulSoup

search = input("Search: ")
URL = "https://www.google.co.in/search?q=" + search

headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36 Edg/89.0.774.57'
}

page = requests.get(URL, headers=headers)
soup = BeautifulSoup(page.content, 'html.parser') 
result = soup.find(class_="LTKOO sY7ric").get_text() 
print(result)

Answer 1

这将为您提供这些课程的所有文本。

txts = [ x.get_text() for x in soup.find_all(class_="LTKOO sY7ric")]
print(txts)

Answer 2

您可以运行一个 for 循环，遍历所有具有所需类名的元素的汤检查，然后从类中打印出文本

for(ele in soup.find_all(class_="LTKOO sY7ric")):
    print(ele.get_text())

Answer 3

该循环将帮助您提取所有可能的值：

import requests
from bs4 import BeautifulSoup

search = input("Search: ")
URL = "https://www.google.co.in/search?q=" + search

headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36 Edg/89.0.774.57'
}

page = requests.get(URL, headers=headers)
soup = BeautifulSoup(page.content, 'html.parser') 


results = []

for ele in soup.find_all(class_="LTKOO sY7ric"):
    try:
        result = ele.find(class_="LTKOO sY7ric").text.strip()
        
    except AttributeError:
        result = 'no  data'
        
    results.append(result)
        
print(results)

我希望这有帮助。

Python Web Scraping 同一个类

问题描述

3 个解决方案

解决方案1
0 已采纳 2021-10-15 16:53:34

解决方案2
0 2021-10-15 17:13:34

解决方案3
0 2022-12-22 12:20:56

Python Web Scraping 同一个类

问题描述

3 个解决方案

解决方案1 0 已采纳 2021-10-15 16:53:34

解决方案2 0 2021-10-15 17:13:34

解决方案3 0 2022-12-22 12:20:56

解决方案1
0 已采纳 2021-10-15 16:53:34

解决方案2
0 2021-10-15 17:13:34

解决方案3
0 2022-12-22 12:20:56