[英]web crawl the app information from Android market
我想獲取Android應用程序信息的數據集,其中包括應用程序名稱,程序包名稱,版本,請求的權限等。
官方的Android應用程序市場是Google Play。 市場上有數百萬個應用程序。 我想從中至少獲取數以萬計的應用程序信息,並將其存儲到一個csv文件中。 例如,這是應用程序的鏈接: https : //play.google.com/store/apps/details?id=de.ralphsapps.snorecontrol
有沒有適合這種工作的網絡爬蟲? 還是有任何腳本語言(例如python)具有這種爬網功能?
謝謝。
Google Play Store
擁有自己的格式,可以HTML格式顯示信息對象。 為所有這些編寫您自己的HTML解析器,以獲取所需的信息。
這是最好的使用JSoup在此作業JSoup.org ,
或參考我關於JSoup
示例教程作為解析器: 使用JSoup解析HTML
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.