0

与在 Python 中处理从源目录到目标目录的一组文件一样,我想知道是否可以创建一个函数,当给定一个 web 目录时,它将列出所述目录中的文件。就像是...

files[]

for file in urllib.listdir(dir):
    if file.isdir:
        # handle this as directory
    else:
        # handle as file

我假设我需要使用 urllib 库,但似乎没有一种简单的方法可以做到这一点,至少我见过。

4

2 回答 2

2

什么是网络目录?

网页有链接。带有链接的页面可能会或可能不会由 Web 服务器根据目录的内容生成。

在这里可以找到自动生成链接的示例,它可能是Web 服务器 Apache 中的mod_dir配置之类的结果。

wget 和 curl 之类的工具所做的是获取一个页面并下载该页面上的所有链接,可能是递归的。我认为这是你能做到的最好的。而且我感觉在 SO 中关于 python + curl 的问题很多。

于 2010-05-25T19:15:53.393 回答
1

你可能会混淆这个概念。目录是文件系统的概念。URL 没有目录的概念。它看起来类似于文件系统的路径名,并且通常映射到一个目录。但是不需要文件系统支持它。

例如,在 Python 中将一组文件从源目录处理到目标目录可能会映射到一个目录

/htdocs/questions/2593399/

但更有可能它是从数据库查询生成的,并且不映射到文件系统中的任何内容。

于 2010-05-25T23:02:32.993 回答