我想获取一个Android应用信息的数据集,其中包括应用名称、包名称、版本、请求的权限等。
官方的 Android 应用市场是 Google Play。市场上有数以百万计的应用程序。我想从中获取至少数万条应用信息,并将其存储到 csv 文件中。例如,这是一个应用程序的链接: https ://play.google.com/store/apps/details?id=de.ralphsapps.snorecontrol
- 问题是如何获取应用程序的 url 列表?
- 如何解析网页中的信息?
有没有适合这种工作的好的网络爬虫?或者有没有脚本语言,比如python,有这样的爬取功能?
谢谢。