
[英]How can I 'uncomment' the contents of a comment with Beautifulsoup?
我正在使用来自 bs4 版本的 BeautifulSoup:'4.10.0' 我正在为我正在开发的项目做一些抓取,我遇到了一个问题,我抓取的一些元素出于某种原因被评论了。<div class="h-[125] js-scroll-hidden" id="link-index-40"> ...
[英]How can I 'uncomment' the contents of a comment with Beautifulsoup?
我正在使用来自 bs4 版本的 BeautifulSoup:'4.10.0' 我正在为我正在开发的项目做一些抓取,我遇到了一个问题,我抓取的一些元素出于某种原因被评论了。<div class="h-[125] js-scroll-hidden" id="link-index-40"> ...
[英]Do double quotes need space inside?
很简单,但我很困惑。 在我的 Python 脚本上,它使用 selenium 进行 web 抓取,所有输入都是 对于国家/地区,内部不需要空格,但是当涉及到输入发送键时,在 " 之后没有空格,它确实会在将其写入网站时删除第一个字母。 是有什么特殊原因还是取决于网站? 对不起我的英语我还在学习。 我 ...
[英]Can't get all results in tripadvisor using python al beautifulsoup due to pagination
我正在尝试获取餐厅的链接,但我只能获取前 30 家,而不能获取所有其他餐厅。 马德里地区的餐厅有100家,分页每页只显示30家,下面的代码只获取这30家 ...
[英]How the change EVERY children tag (of a specific nature) to a different one using BeauifulSoup
在下面的给定HTML中: 现在我想问: 如何更改ANY父级为的子<li>标签对于别的东西,说<SOME> (请不要问我为什么要,我将无法呈现它。我有理由) 简而言之,我希望上面的代码如下所示: 我试过(有和没有tag.decompose : 但它似乎不适用于depth > ...
[英]Fetching the value from the key in Python's dict
我正在从 JSON 中的 'key' 中获取 'value',但我不知道为什么我无法获取目标信息。 下面的代码 下面是本例的JSON。 (链接中的信息是公开的。因此,我不会删除 1194452 的详细信息)。 问题由于 type(x) 是 Python 中的 'dict',为什么我不能获取键的值? ...
[英]How to get text and corresponding tag with BeautifulSoup?
我有一个文本,包含 HTML 个标签,例如: 我使用BeautifulSoup解析了这段文本。 我想用相应的文本和标签提取每个句子。 我试过: 我也试过soup.find_all()并停留在同一点:我可以访问文本但不能访问原始标签。 ...
[英]How to grab URL in "View Deal" and price for deal from kayak.com using BeautifulSoup
我有一个 Kayak URL 列表,我想在“查看交易”中获取“最佳”和“最便宜”HTML 卡片的价格和链接,基本上是前两个结果,因为我已经在网址( 这里是 URL 的示例)。 我无法使用 beautifulsoup 获取这些数据,我需要一些帮助! 这是我尝试提取价格信息的方法,但我得到的是一个空的p ...
[英]Finding href in "https://www.baseball-reference.com/" webpage using a Python webscraper
我想通过网络抓取在下面“requests.get”中突出显示的网页中找到的所有“boxscore”超链接,并将其打印到 excel 电子表格中。 但是,下面的程序打印了网页中 class“游戏”下找到的所有文本。 需要更改什么以便它仅打印在 class“游戏”下的“em”元素中找到的 href-b ...
[英]Find all tags containing a string in BeautifulSoup
在 BeautifulSoup 中,我可以使用find_all(string='example')查找与字符串或正则表达式匹配的所有 NavigableString。 有没有办法使用get_text()而不是string来执行此操作,以便搜索匹配一个字符串,即使它跨越多个节点? 即我想做类似的事情: ...
[英]How to store elements of a list of HTML tags fetched with BeautifulSoup within a dataframe separated in alphabetically columns with pandas?
我对 Jupiter Notebook、Python、Webscraping 等完全陌生。 我看了看不同的答案,但似乎没有人遇到同样的问题(而且我不擅长采用“类似”的方法,稍微改变一下以便我可以将其用于我的目的)。 我想创建一个包含所有现有 HTML 标签的数据网格。 作为来源,我正在使用 MDN ...
[英]How to get a text of certain elements BeautifulSoup Python
我有这种 html 代码 我需要获取每个tr的第 3 个和第 5 个td的文本显然这不起作用:) ...
[英]Beautifulsoup - Python For loop only runs 8 times then exits with code 0 in visual studio code
我有一个 python 脚本,可以抓取拍卖网站的第一页。 它正在抓取的页面是 trademe.co.nz - 类似于 ebay/amazon 等。它的目的是抓取第一页上的所有列表 - 只有当它不在我的数据库中时。 它按预期工作,但有一个警告 - 它只抓取前 8 个列表(不管 trademe url) ...
[英]Is there an error in this web-scraping script?
这个脚本有什么错误?from bs4 import BeautifulSoup import requests years = [2000, 2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011, 2012, 2013 ...
[英]python scraping - How can I Loop between Dates in OddsPortal
我正在尝试抓取 Oddsportal 和下面的代码,但是当我运行它时,我得到了IndexError 代码: 错误: 虽然循环是在可用日期之间抓取,但我无法让它完整地工作。 我不想检查a_tags = [] if span is None else span.find_all('a')因为它不符合我 ...
[英]Beautifulsoup. Result long random string
我正在学习 web 抓取,但是,我在准备汤时遇到了问题。 它甚至不像我在检查页面时看到的 HTML 代码。 结果是这样的:结果,汤我试图搜索整个 inte.net,但我认为我目前的知识太少,无法找到解决方案。 这个随机字符串是结果的 85%。 我会很高兴能提供每一点帮助。 ...
[英]How to scrape just one text value on one p tag from bs4
实际上该网站有一个<p>但里面有两个文本值,我只想抓取其中一个文本。 网址HTML如下: 在上面的 HTML 中,如果我们以<p>为目标,则有两个文本值(“Great Clips”和“Request Info”)。 我只想抓取“Great Clips”而不是两者,我将如何使用 ...
[英]How to scrape table data with th and td with BeautifulSoup?
我是编程新手,一直在尝试练习 web 报废。 找到一个示例,其中我希望在我的输出中包含的列之一是表 header 的一部分。我能够提取我想要的所有表数据,但无法显示年份日期。 ...
[英]scrape fiba stats box score
我在 python 只是一个初学者,我想要一个我最喜欢的当地篮球队的数据集,这就是为什么我搜索一个代码抓取 fiba 统计框得分,我在 stackoverflow 上找到了一个,我试图编辑标题但是它只是生成一个空的 csv 文件,想知道是否有人可以帮助我编辑下面的代码并抓取每个团队的 box 分数 ...
[英]How to crawl multiple pages and create a dataframe with parsing?
我想从一个网站加载多个页面,并从不同的类中提取特定属性,如下所示。 然后我想用来自多个页面的解析信息创建一个 dataframe。 从多个页面中提取 解析 至 DataFrame ...
[英]Why soup. find_all() only returning one result
我正在抓取一些信息,下面是我的代码 为什么这条线 只返回第一个元素? ...