簡體   English   中英

通過網絡從Android市場抓取應用程序信息

[英]web crawl the app information from Android market

我想獲取Android應用程序信息的數據集,其中包括應用程序名稱,程序包名稱,版本,請求的權限等。

官方的Android應用程序市場是Google Play。 市場上有數百萬個應用程序。 我想從中至少獲取數以萬計的應用程序信息,並將其存儲到一個csv文件中。 例如,這是應用程序的鏈接: https : //play.google.com/store/apps/details?id=de.ralphsapps.snorecontrol

  • 問題是如何獲取應用程序的URL列表?
  • 如何解析網頁信息?

有沒有適合這種工作的網絡爬蟲? 還是有任何腳本語言(例如python)具有這種爬網功能?

謝謝。

Google Play Store擁有自己的格式,可以HTML格式顯示信息對象。 為所有這些編寫您自己的HTML解析器,以獲取所需的信息。

這是最好的使用JSoup在此作業JSoup.org

或參考我關於JSoup示例教程作為解析器: 使用JSoup解析HTML

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM