我想下载已知 URL 的特定目录中的所有文件。这些文件的名称不一定是已知的,但它们的名称都包含一个通用关键字,并且具有相同的扩展名 (.xml)。
urllib2 是否有等效的“os.walk”,这样我就可以简单地浏览目录中存在的任何文件并打开它们进行解析?
我在网上看到的唯一示例涉及一个已知名称的文件,其中包含目录中所有文件名的列表。我不想这样做...
其他可能相关的信息:这些文件位于 apache 服务器上,并且可以公开访问。
如果不知道文件名,这是不可能的 - 您必须随机尝试所有可能的名称,因为您知道是否存在具有此名称的文件的唯一方法是请求 url 并查看是否得到响应。但是您可以让 Apache 网络服务器为您生成一个目录索引(使用mod_autoindex)并解析它以获取文件名。