cost 324 ms
如何“取消评论”Beautifulsoup 的评论内容?

[英]How can I 'uncomment' the contents of a comment with Beautifulsoup?

我正在使用来自 bs4 版本的 BeautifulSoup:'4.10.0' 我正在为我正在开发的项目做一些抓取,我遇到了一个问题,我抓取的一些元素出于某种原因被评论了。<div class="h-[125] js-scroll-hidden" id="link-index-40"> ...

双引号里面需要空格吗?

[英]Do double quotes need space inside?

很简单,但我很困惑。 在我的 Python 脚本上,它使用 selenium 进行 web 抓取,所有输入都是 对于国家/地区,内部不需要空格,但是当涉及到输入发送键时,在 " 之后没有空格,它确实会在将其写入网站时删除第一个字母。 是有什么特殊原因还是取决于网站? 对不起我的英语我还在学习。 我 ...

使用 wget 从 Instagram 下载图片

[英]Downloading images from Instagram with wget

我正在尝试从 Instagram 下载图片,代码是: 问题是 wget 不能正常工作,或者我做错了什么,但我想不通, ValueError:没有足够的值来解压(预期 2,得到 1) 我已经在 (image, save_as) 中定义了 url 和目标值,但它一直给我这个错误。 有人能帮助我吗? 完 ...

Python 链接抓取器正则表达式仅在搜索 1 种扩展类型时有效,但在匹配多种扩展类型时失败

[英]Python link scraper regex works when only searching for 1 extension type, but fails when matching more than one extension type

这是我用于该项目的测试链接: https://www.dropbox.com/sh/4cgwf2b6gk4bex4/AADtM1GDYgPDdv8QP6JdSOkba?dl=0 现在,下面的代码仅在匹配 for.mp3 时有效(第 8 行),并按要求将纯链接输出到文本文件。 问题是,上面的测试链接不 ...

尝试从 Clockify 导出数据

[英]Trying to Export the Data from Clockify

我一直在尝试使用 VBA 并使用以下代码将 Clockify 中的所有数据提取到 Excel 中,但该代码中没有 output 非常感谢您的帮助。 运行代码时获得此响应{"code":405,"message":"HTTP 405 Method Not Allowed"} ...

我的 selenium 脚本正确地抓取了谷歌地图第一个链接中的变量,但是当它加载第二个链接时它显示了一些错误

[英]My selenium script is scraping the variables in the first link of google maps correctly , but when it loads the second link it shows some error

`这个脚本的目标是从 excel 文件中获取企业名称,然后在谷歌地图上搜索它并抓取所需的数据,问题是脚本运行正确并在谷歌地图上抓取第一个企业名称的数据。 但是当第二个链接加载并且出现 data.table 时它给出了一些错误,那么我该如何解决它。 随意在您的编译器上运行此脚本。您可以创建一个 ex ...

迭代被覆盖

[英]Iterations are getting overwritten

希望读这篇文章的人一切都好。 我想做的是从 NIST ILThermo 网站上提取关于纯(单一组分)离子液体的粘度及其测量条件的数据表。 我正在使用此代码,由一个名为 HedgeHog 的用户编写,但它会自行覆盖而不显示所有不同的温度及其粘度。 相反,它显示了整个表格的最后温度和粘度。 这是代码:i ...

从 Python 字典中的键中获取值

[英]Fetching the value from the key in Python's dict

我正在从 JSON 中的 'key' 中获取 'value',但我不知道为什么我无法获取目标信息。 下面的代码 下面是本例的JSON。 (链接中的信息是公开的。因此,我不会删除 1194452 的详细信息)。 问题由于 type(x) 是 Python 中的 'dict',为什么我不能获取键的值? ...

python 垂直滚动特定的滚动条

[英]python scroll a specific scrollbar vertically

我正在使用 python selenium 滚动网页,我试图通过单击滚动元素到达页面底部,但它返回此错误: MoveTargetOutOfBoundsException: move target out of bounds 到目前为止我的代码: 还有另一种使用“scrollbar_needed”路径 ...

除非单击文本,否则我无法访问隐藏了 selenium 个元素的文本框

[英]I can not access text box with selenium elements hid unless text clicked

我在 python 和 Selenium 工作。当我点击这条线时 并使用click()或send.keys(8)复制路径,它不会 go 到第 8 页它只是闪烁并继续移动到下一行代码。 但是,作为一个人,如果我单击该框,它会更改元素以显示带有输入部分的第二张图片。 我不知道该怎么办 我也试过 图像 ...

我用Python做webscraping时怎么写两个For循环?

[英]How can I write two For Loops when I do webscraping with Python?

我想写一个代码来抓取多个网页。 但是,问题是网页中有两个数字变体。 正如我们在这里看到的,页码和文档编号同时变化。 到目前为止我写了这个,但它只循环页码,所以它没有给我任何东西。 有什么方法可以为页码和文档编号创建外观吗? ...

尝试使用 BeautifulSoup 从 Kayak 网站获取 href URL

[英]Trying to grab href URLs from Kayak website using BeautifulSoup

我试图从出现在这个 Kayak 网站上的每张卡片中获取 URL,当我尝试运行下面的代码时,我收到了BrokenPipeError: [Errno 32] Broken pipe错误。 有人可以帮助我获得正确的代码以从该页面的航班结果中获取所有 URL 吗? ...

如何用 BeautifulSoup 获取文本和对应的标签?

[英]How to get text and corresponding tag with BeautifulSoup?

我有一个文本,包含 HTML 个标签,例如: 我使用BeautifulSoup解析了这段文本。 我想用相应的文本和标签提取每个句子。 我试过: 我也试过soup.find_all()并停留在同一点:我可以访问文本但不能访问原始标签。 ...

登录墙后面的抓取表

[英]Scraping table behind login wall

我正在努力获取正确的代码片段,以将受密码保护的网站的表格抓取到 excel 工作簿中。 我已经能够获得所有代码来处理表格部分。 当我运行代码时,它打开 IE,登录但随后出错(91:Object 变量或未设置 WITH 块变量)。 代码如下: 我已经包含了我在登录后尝试在重定向页面上抓取的表的 HTM ...

使用 Puppeteer 和 Cheerio 抓取带有图像的卡片列表时缺少数据

[英]Missing data when scraping list of cards with images with Puppeteer and Cheerio

我正在尝试抓取一页卡片项目。 我想从这些卡片中提取标题、价格、图像来源和其他属性。 然而,当我使用 Puppeteer 和 Cheerio 进行抓取时,一些数据丢失了。 见下图: 我怎样才能确保所有数据都通过? 这是我的代码:(async () => { try { const ...

如何在“查看交易”中获取 URL 以及使用 BeautifulSoup 从 kayak.com 获取交易价格

[英]How to grab URL in "View Deal" and price for deal from kayak.com using BeautifulSoup

我有一个 Kayak URL 列表,我想在“查看交易”中获取“最佳”和“最便宜”HTML 卡片的价格和链接,基本上是前两个结果,因为我已经在网址( 这里是 URL 的示例)。 我无法使用 beautifulsoup 获取这些数据,我需要一些帮助! 这是我尝试提取价格信息的方法,但我得到的是一个空的p ...

Python:Webscrape 从网站下载所有数据集

[英]Python: Webscrape to download all datasets from website

我需要从这个网站下载所有数据集: https://www.electionreturns.pa.gov/ReportCenter/Reports (如果你不是从美国搜索,你将被重定向到另一个网站)这个网站有一个下拉菜单,基于您选择的下拉菜单,它会返回复选框。 我需要编写一个程序来访问该网站,从下拉列 ...


 
粤ICP备18138465号  © 2020-2023 STACKOOM.COM