cost 416 ms
如何“取消评论”Beautifulsoup 的评论内容?

[英]How can I 'uncomment' the contents of a comment with Beautifulsoup?

我正在使用来自 bs4 版本的 BeautifulSoup:'4.10.0' 我正在为我正在开发的项目做一些抓取,我遇到了一个问题,我抓取的一些元素出于某种原因被评论了。<div class="h-[125] js-scroll-hidden" id="link-index-40"> ...

双引号里面需要空格吗?

[英]Do double quotes need space inside?

很简单,但我很困惑。 在我的 Python 脚本上,它使用 selenium 进行 web 抓取,所有输入都是 对于国家/地区,内部不需要空格,但是当涉及到输入发送键时,在 " 之后没有空格,它确实会在将其写入网站时删除第一个字母。 是有什么特殊原因还是取决于网站? 对不起我的英语我还在学习。 我 ...

如何使用 BeauifulSoup 将每个子标签(特定性质的)更改为不同的标签

[英]How the change EVERY children tag (of a specific nature) to a different one using BeauifulSoup

在下面的给定HTML中: 现在我想问: 如何更改ANY父级为的子<li>标签对于别的东西,说<SOME> (请不要问我为什么要,我将无法呈现它。我有理由) 简而言之,我希望上面的代码如下所示: 我试过(有和没有tag.decompose : 但它似乎不适用于depth &gt ...

从 Python 字典中的键中获取值

[英]Fetching the value from the key in Python's dict

我正在从 JSON 中的 'key' 中获取 'value',但我不知道为什么我无法获取目标信息。 下面的代码 下面是本例的JSON。 (链接中的信息是公开的。因此,我不会删除 1194452 的详细信息)。 问题由于 type(x) 是 Python 中的 'dict',为什么我不能获取键的值? ...

如何用 BeautifulSoup 获取文本和对应的标签?

[英]How to get text and corresponding tag with BeautifulSoup?

我有一个文本,包含 HTML 个标签,例如: 我使用BeautifulSoup解析了这段文本。 我想用相应的文本和标签提取每个句子。 我试过: 我也试过soup.find_all()并停留在同一点:我可以访问文本但不能访问原始标签。 ...

如何在“查看交易”中获取 URL 以及使用 BeautifulSoup 从 kayak.com 获取交易价格

[英]How to grab URL in "View Deal" and price for deal from kayak.com using BeautifulSoup

我有一个 Kayak URL 列表,我想在“查看交易”中获取“最佳”和“最便宜”HTML 卡片的价格和链接,基本上是前两个结果,因为我已经在网址( 这里是 URL 的示例)。 我无法使用 beautifulsoup 获取这些数据,我需要一些帮助! 这是我尝试提取价格信息的方法,但我得到的是一个空的p ...

使用 Python webscraper 在“https://www.baseball-reference.com/”网页中查找 href

[英]Finding href in "https://www.baseball-reference.com/" webpage using a Python webscraper

我想通过网络抓取在下面“requests.get”中突出显示的网页中找到的所有“boxscore”超链接,并将其打印到 excel 电子表格中。 但是,下面的程序打印了网页中 class“游戏”下找到的所有文本。 需要更改什么以便它仅打印在 class“游戏”下的“em”元素中找到的 href-b ...

在 BeautifulSoup 中查找所有包含字符串的标签

[英]Find all tags containing a string in BeautifulSoup

在 BeautifulSoup 中,我可以使用find_all(string='example')查找与字符串或正则表达式匹配的所有 NavigableString。 有没有办法使用get_text()而不是string来执行此操作,以便搜索匹配一个字符串,即使它跨越多个节点? 即我想做类似的事情: ...

如何存储用 BeautifulSoup 获取的 HTML 标签列表中的元素,用 pandas 按字母顺序列分隔的 dataframe 中?

[英]How to store elements of a list of HTML tags fetched with BeautifulSoup within a dataframe separated in alphabetically columns with pandas?

我对 Jupiter Notebook、Python、Webscraping 等完全陌生。 我看了看不同的答案,但似乎没有人遇到同样的问题(而且我不擅长采用“类似”的方法,稍微改变一下以便我可以将其用于我的目的)。 我想创建一个包含所有现有 HTML 标签的数据网格。 作为来源,我正在使用 MDN ...

Beautifulsoup - Python For 循环仅运行 8 次,然后在 visual studio 代码中以代码 0 退出

[英]Beautifulsoup - Python For loop only runs 8 times then exits with code 0 in visual studio code

我有一个 python 脚本,可以抓取拍卖网站的第一页。 它正在抓取的页面是 trademe.co.nz - 类似于 ebay/amazon 等。它的目的是抓取第一页上的所有列表 - 只有当它不在我的数据库中时。 它按预期工作,但有一个警告 - 它只抓取前 8 个列表(不管 trademe url) ...

python 抓取 - 我如何在 OddsPortal 中的日期之间循环

[英]python scraping - How can I Loop between Dates in OddsPortal

我正在尝试抓取 Oddsportal 和下面的代码,但是当我运行它时,我得到了IndexError 代码: 错误: 虽然循环是在可用日期之间抓取,但我无法让它完整地工作。 我不想检查a_tags = [] if span is None else span.find_all('a')因为它不符合我 ...

Beautifulsoup. 结果长随机字符串

[英]Beautifulsoup. Result long random string

我正在学习 web 抓取,但是,我在准备汤时遇到了问题。 它甚至不像我在检查页面时看到的 HTML 代码。 结果是这样的:结果,汤我试图搜索整个 inte.net,但我认为我目前的知识太少,无法找到解决方案。 这个随机字符串是结果的 85%。 我会很高兴能提供每一点帮助。 ...

如何从 bs4 的一个 p 标签上只抓取一个文本值

[英]How to scrape just one text value on one p tag from bs4

实际上该网站有一个<p>但里面有两个文本值,我只想抓取其中一个文本。 网址HTML如下: 在上面的 HTML 中,如果我们以<p>为目标,则有两个文本值(“Great Clips”和“Request Info”)。 我只想抓取“Great Clips”而不是两者,我将如何使用 ...

抓取 FIBA 统计框分数

[英]scrape fiba stats box score

我在 python 只是一个初学者,我想要一个我最喜欢的当地篮球队的数据集,这就是为什么我搜索一个代码抓取 fiba 统计框得分,我在 stackoverflow 上找到了一个,我试图编辑标题但是它只是生成一个空的 csv 文件,想知道是否有人可以帮助我编辑下面的代码并抓取每个团队的 box 分数 ...


 
粤ICP备18138465号  © 2020-2023 STACKOOM.COM