簡體   English   中英

如何從不提供寧靜服務的站點中提取數據?

[英]How extract data from a site which does not provide a restful service?

它也包括登錄網站。 嘗試從顯示一些客戶數據分析的站點獲取數據。 如果我的應用程序顯示了這些數據,我需要:

  1. 登錄網站。
  2. 轉到一個網址
  3. 從url頁面獲取數據。

有哪些方法可以實現?
網頁抓取可以做什么?

是的,您會為此使用刮擦。 您的關鍵字中有 node.js。 如果您打算為此使用 Node.js,那么您應該查看Phantom.js

是的,刮擦將是解決此問題的方法。 如果您使用的是 Ruby,那么請查看類似Nokogiri的內容來解析並從各個頁面的 HTML 中抓取內容。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM