繁体   English   中英

提供网页抓取的输入数据

[英]Providing input data for web scraping

我想从以下站点抓取数据:
http://www.upmandiparishad.in/commodityWiseAll.aspx

有两个输入元素, CommodityDate 如何提供这些值并检索结果信息?

要从Java的网页提取数据,可以使用jsoup

要提供输入元素,您需要了解浏览器最初是如何提供输入元素的。 基本上,客户端和服务器之间有两种最常见的请求响应方法:

  • GET-从指定资源请求数据
  • POST-将要处理的数据提交到指定的资源

您可以在此处找到有关它们的更多信息。

选择“ Commodity和“ Date输入值时,可以通过检查网络请求来调查用于向服务器提供这些值的方法。 例如,在Chrome浏览器中,您可以按F12并选择“ Network标签,以检查发送到浏览器和从浏览器发送的信息。

当找到提供数据的方式时,您可以相应地形成HTTP请求,以通过jsoup或类似的库提供相同的数据。
例如,以下是如何为您的请求提供简单的输入字段:

Document doc = Jsoup.connect("http://example.com/")
.data("some_input_1", "some_data_1")
.data("some_input_2", "some_data_2")
.post();

当然,这仅仅是为了入门,它绝不是一个完整的答案。 由于数量众多,您需要全力以赴才能在线搜索答案。

以下是一些入门指南:

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM