cost 391 ms
For循环使我的程序完全低效 - For loop making my program completely inefficient

使用我当前的代码,它会打印所有 URL,然后进行抓取,因此如果我想抓取所有 109 页,我将不得不等待几分钟让 URL 打印出来,然后它才会开始抓取。 对于计数:= 0; 计数 < 3; count++ { // 页数在此示例中,我将页数更改为仅 go 到 3。然后它会打印 3 个网址,一 ...

在同一行打印 2 条语句 - Printing 2 statements on the same line

我已经成功地制作了一个抓取器,可以抓取 eBay 上 iPhone 部分的所有 109 页。 问题是我需要它们在同一行上打印。 这是它目前的样子 甚至无法浏览这些信息。 有人可以告诉我如何在同一行上获得标题和价格吗? 我考虑过重命名该元素,但没有成功。 我会使用 printf 或 println,但 ...

StackOverflow 的最大速率限制 - Max Rate limit of StackOverflow

我一直在尝试以每秒 30 个请求的数量访问 StackOverflow,但它不起作用。 几秒后就被屏蔽了。 虽然 StackOverflow 的文档说 StackExchange 的 max rate limit 是 30 req /s。 我以前访问的库是 gocolly 这是我的代码: 我希望有一 ...

2023-01-09 07:41:34   1   53    go / go-colly  
Web 使用 Golang Colly 报废,如何处理 XML 找不到路径? - Web scrapping using Golang Colly, How to handle XML path not found?

我正在使用 Colly 来删除电子商务网站。 我将遍历许多产品。 这是我获得副标题的代码片段 但是,并非所有产品都有副标题,因此上述XML路径并不适用于所有情况。 当我到达没有副标题的产品时,我的代码崩溃并返回错误panic: expression must evaluate to a node- ...

如何使用 go-colly 抓取 TLS 证书? - How do I scrape TLS certificates using go-colly?

我正在使用Colly抓取一个网站,并且我也在尝试获取该网站在 TLS 握手期间呈现的 TLS 证书。 我查看了文档和响应对象,但没有找到我要找的东西。 根据文档,我可以通过更改默认的 HTTP roundtripper来自定义一些 http 选项。 我尝试设置自定义 GetCertificate ...

Go Colly 并行性减少了被抓取的链接数量 - Go Colly parallelism decreases the number of links scraped

我正在尝试构建一个 web 抓取器以从 internshala.com 抓取工作。 我正在使用 go colly 构建 web 刮板。 我访问每个页面,然后访问每个作业的后续链接以从中抓取数据。 以顺序方式执行此操作会刮掉几乎所有链接,但如果我尝试使用 colly 的并行刮擦来执行此操作,则刮掉的链 ...

在 golang 中使用 colly 抓取一个简单的网站不返回任何数据 - Scraping a simple website with colly in golang does not return any data

我正在尝试抓取一个看起来像这样的简单网站: 写了一个简单的go代码: 当我运行这段代码时,我得到以下 output: 所以一切都很好。 该网站已成功打开,但我没有从中获取任何数据。 我试图将c.OnHTML更改为pre , body.pre - 但它们都没有像我预期的那样工作。 我在这里错过了什么? ...

Gocolly 只抓取某些链接 - Gocolly scraping only certain links

在抓取此链接时,在此处输入链接描述,我只想抓取库链接,但我编写的代码提取了所有链接,我无法过滤它。 (我正在解析 url 供以后在 github api 中使用 http://api.github.com/repos/[用户名]/[reponame] ,所以我只需要路径部分,但我不想解析对我不起 ...

2022-03-12 10:57:39   1   334    go / go-colly  

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM