1

我想获取一个Android应用信息的数据集,其中包括应用名称、包名称、版本、请求的权限等。

官方的 Android 应用市场是 Google Play。市场上有数以百万计的应用程序。我想从中获取至少数万条应用信息,并将其存储到 csv 文件中。例如,这是一个应用程序的链接: https ://play.google.com/store/apps/details?id=de.ralphsapps.snorecontrol

  • 问题是如何获取应用程序的 url 列表?
  • 如何解析网页中的信息?

有没有适合这种工作的好的网络爬虫?或者有没有脚本语言,比如python,有这样的爬取功能?

谢谢。

4

1 回答 1

0

Google Play Store有自己的格式来显示 HTML 中的信息对象。为所有这些编写您自己的 HTML 解析器以获取您需要的信息。

最好在 JSoup.org 上使用JSoup完成这项工作,

JSoup或作为解析器 参考我的示例教程: Parsing HTML using JSoup

于 2012-10-17T02:18:44.050 回答