cost 22 ms
python - 使用请求保存某些页面的 html 不起作用 [重复]

这个问题在这里已经有了答案: 请求中的 URL 超出了最大重试次数(20 个答案) Urllib3 错误“SSL:错误的签名类型” 3 个答案 23 分钟前关闭。 requests 库适用于大多数 URL,但有一些特别会引发 SSLE 错误,我认为这是由于来自 web 页面的某种奇怪的重定向 ...

2022-09-27 21:14:37 0 17
如何使用 selenium (python) 找到不在页面源中的元素

目前我正在尝试从网站上抓取一些东西。 为此,我需要 email 的内容,因此我为此使用 yopmail( https://yopmail.com )。 在 yopmail 中,您的邮件位于屏幕左侧,邮件主题位于其下方。 这段文字是我需要的部分。 [邮件视图][1] [devtools 代码][2] ...

2022-09-27 20:51:46 1 11
如果 url 没有改变,重做 function

我正在使用 selenium python 填充两个具有不同 url 的 forms。 该脚本填写第一个表单,然后单击 go 的提交按钮到第二个表单。 有时,它不会 go 到第二种形式,它停留在第一种形式上。 我要做的是检查单击提交按钮后url是否保持不变,脚本重做该过程并再次重新填写第一个表单, ...

2022-09-27 18:55:46 1 29
无法使用 Sys.sleep() 解决 HTTP 错误 429

我尝试了这段代码,但服务器向我发回了 HTTP 429 错误,因为请求太多。如果我为每个汽车属性创建一个 function ,代码就会运行,但我希望它们分开,因为为了在我的分析中进一步移动,我将运行 radnom森林和回归树。请注意,即使有时间睡眠,代码也不会运行。library("robotst ...

2022-09-27 18:38:22 0 18
从 python 中的 selenium 获取多个同名类的所有文本数据

我正在尝试使用 selenium 在 python 中制作 web 刮板,并希望从嵌入的 h3 标签中获取文本以及“a”标签中的文本。 网站的基本结构如下。 我将如何 go 这样做? 我看过 xpath 解决方案以及使用 但我似乎无法得到任何工作。 我正在考虑获取每个 class 位置并分别遍历每个 ...

2022-09-27 18:36:40 1 26
xpath 未获取以“希腊语”编写的全文

我正在尝试获取用希腊语编写的特定产品的标题和描述,我也想要希腊语中的 output。 但它没有显示完整的标题。 为什么? 这是我的 scrapy 代码。 商品名称为“Θρεπτικό πρωτεϊνούχο ρόφημα康宝莱配方 1 υγιεινό γεύμα 拿铁咖啡 550g” 但我收到 ou ...

2022-09-27 18:00:37 2 31
Selenium/Python - 单击“加载更多”后继续向下滚动

我想从 SAP Glossary 网站上抓取带有条款详细信息的条款。 我现在只能获得 50 个条款。 因为我不知道如何点击“加载更多”,然后继续向下滚动以抓取更多条款。 我注意到“加载更多”按钮必须将颜色更改为橙色,以便可以点击 ...

2022-09-27 16:36:52 1 41
列表索引超出范围 - 美丽的汤

PYTHON 新手*** 下面是我用来从网站上提取 zip 文件的代码,但我收到错误消息“列表索引超出范围”。 编写此代码的其他人给了我此代码,但我不得不更改 URL,现在我收到错误消息。 当我打印(list_of_documents)它是空白的。 有人可以帮我弄这个吗? url 需要访问权限, ...

2022-09-27 16:33:24 1 36
Python web 抓取错误“请启用 JavaScript 以查看页面内容。”

当我尝试抓取相关网站时,我收到这样的错误消息,我不知道该怎么办。 我用 selenium 尝试了同一个站点,但不幸的是结果是一样的 这是我找不到解决方案的麻烦错误响应。 同一个请求另一个响应 欢迎任何帮助,因为我不太擅长这个。 ...

2022-09-27 15:32:08 1 28
有没有办法运行多个功能,每个 function 在不同的时间定期运行?

我的 Python 经验很低,想提高自己。 我现在正在做一个有逻辑问题的项目,如果你给我一些建议,我会很高兴。 项目目标:如果任何股票的价格与 Z 小时前的价格相比移动了 +X% 或 -Y%,则获取有关任何股票的电子邮件(通知)。 示例: “在过去 2 小时内,Apple Inc. 从 155,2 ...

2022-09-27 14:38:25 0 17
Python,api_URL

我发布了一个类似的问题并得到了很好的帮助,这有助于我从网站上删除其他数据。 尽管如此,我仍然无法解决如何从网站上删除交易量(交易的股票数量/天)。 url = 'https://bors.e24.no/#./instrument/NHY.OSE' 元素是: 这是我想抓住的数字 1278246。 ...

2022-09-27 13:03:04 0 17
从投资中抓取历史数据。com

我想抓取财务报告的历史数据。 但我不知道该怎么做。 我尝试用谷歌搜索历史价值,但结果是空的。 我想从所有报告中提取,所以为了这个例子,如果有人可以帮助我从这个地址https://www.investing.com/economic-calendar/initial-jobless-claims-2 ...

2022-09-27 11:37:10 1 22
如何获取网站并获取每部电影的标题(https://www.digitaltrends.com/movies/best-movies-on-netflix/)[关闭]

关闭。 这个问题需要更加集中。 它目前不接受答案。 想改进这个问题? 更新问题,使其仅通过编辑此帖子专注于一个问题。 11 分钟前关闭。 改进这个问题我正在学习如何在 Python 上使用 BeautifulSoup 抓取网站。 我想在网站上获得每部电影的标题,但我不知道如何。 有人可以帮忙 ...

2022-09-27 09:46:38 0 11
如何获取重复标签内的元素?

我对 python 和 XML 解析很陌生。 我需要从 Internet 解析一个 XML 文件,我遇到了这个问题,我不知道如何获取我想要的信息,因为它在文档中使用了数百次的通用标签内。 XML 文件遵循以下结构: 这只是文档中的一小部分。 从这里我想得到标签内的所有代码"Codes" ,在这种 ...

2022-09-27 09:12:41 1 11
如何忽略 find 方法给我的第一个选项?

我必须用相同的方法刮掉一个连续两次记录日期的页面。 第一次只用年份登记,第二次用完整的日期登记。 我需要如何抓取整个日期,但 find 方法只显示第一个(我不感兴趣)。 ...

2022-09-27 02:16:02 1 30

 
粤ICP备18138465号  © 2020-2022 STACKOOM.COM