问题标签 [os.walk]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python Walk,但轻线程
我想递归地遍历一个目录,但是如果 python 遇到一个包含超过 100 个文件的目录,我希望它从任何单个 listdir 中中断。基本上,我正在搜索 (.TXT) 文件,但我想避免使用大型 DPX 图像序列(通常为 10,000 个文件)的目录。由于 DPX 自己存在于没有子目录的目录中,我想尽快打破这个循环。
长话短说,如果 python 遇到匹配“.DPX$”的文件,它会停止列出子目录,退出,跳过该子目录并继续在其他子目录中遍历。
这是否可以在返回所有列表结果之前打破目录列表循环?
python - 从 os.walk 有效地删除 dirnames 中的子目录
在 python 2.7 的 mac 上,当使用 os.walk 遍历目录时,我的脚本会遍历“apps”,即 appname.app,因为这些实际上只是它们自己的目录。后来在处理过程中,我遇到了错误。无论如何我都不想浏览它们,所以为了我的目的,最好忽略那些类型的“目录”。
所以这是我目前的解决方案:
如您所见,第二个 for 循环将针对子目录的每次迭代运行,这是不必要的,因为第一遍删除了我想要删除的所有内容。
必须有更有效的方法来做到这一点。有任何想法吗?
python - 如何使用 os.walk 和 fnmatch 改进搜索
我正在使用os.walk
和fnmatch
过滤器来搜索电脑硬盘中的所有图像文件。这工作得很好,但非常慢,因为搜索 +-70000 张图像大约需要 9 分钟。
关于优化此代码以更快运行的任何想法?还有其他建议吗?
顺便说一句,我正在使用 python 2.7.2。
python - Os.walk 不能与通过“match.group(0).encode('string-escape')”获取的目录一起使用
我正在使用 os.walk 搜索特定目录中的文件。
这是不会做它应该做的测试代码:
如果我像这样在第二个循环中输入目录名
我得到了正确的输出。
目录名有空格。
我输入的正是第一个循环中为匹配而打印的内容。为什么它不起作用?
match.group(0) 不是字符串吗?
如果我这样做:
并使用此功能:
os.walk 也不起作用,但是当我这样做时:
os.walk 作品:
从正则表达式获得的匹配有什么区别
并匹配刚刚写出的字符串
python - Os.walk 不能使用与正则表达式匹配的目录
这是我使用的代码。为什么 os walk 不能处理?
为什么我不能将匹配的文件夹用于新的 os.walk 循环?
python - 在 Python 2.7 中使用 urllib2 从 URL 下载任意数量的文件。相当于 urllib2 的“os.walk”?
我想下载已知 URL 的特定目录中的所有文件。这些文件的名称不一定是已知的,但它们的名称都包含一个通用关键字,并且具有相同的扩展名 (.xml)。
urllib2 是否有等效的“os.walk”,这样我就可以简单地浏览目录中存在的任何文件并打开它们进行解析?
我在网上看到的唯一示例涉及一个已知名称的文件,其中包含目录中所有文件名的列表。我不想这样做...
其他可能相关的信息:这些文件位于 apache 服务器上,并且可以公开访问。
python - 覆盖 os.walk 以返回生成器对象作为第三项
在检查效率的同时os.walk
,我6,00,000
使用字符串创建了文件Hello <number>
(其中 number 只是表示目录中文件编号的数字),例如目录中文件的内容如下所示:-
现在,我运行了以下代码:-
我觉得的问题是a.next()
需要太多时间和内存,因为a.next()
将返回的第三项是目录中的文件列表(其中有 600000 项)。所以,我试图找出一种方法来降低空间复杂度(至少) ,方法是以某种方式a.next()
返回一个生成器对象作为元组的第三项,而不是文件名列表。
降低空间复杂度是个好主意吗?
python - python用正斜杠和反斜杠存储路径名
我有一个程序,即os.walk
sa 目录及其子目录来过滤 pdf 文件,分离出它们的名称和相应的路径名。我遇到的问题是它将扫描最顶层的目录并打印适当的文件名,例如G:/Books/Title.Pdf
,但它扫描子文件夹的第二个,例如G:/Books/Sub Folder/Title.pdf
它将打印以下内容
(这显然是一个无效的路径名)。它还将 \\ 添加到子文件夹中的任何子文件夹。
以下是程序:
我知道我想念的东西很简单,但是为了爱和金钱,我能看到它是什么。一双新鲜的眼睛会有很大帮助!
python - os.walk 是否泄漏内存?
当我在 Windows 中运行这个 Python 脚本时,这个过程会增长,而且看不到明显的结束:
我是不是误会了什么?(我使用的是 Python 2.7.3。)
python - RegEx 基于模式或分隔符替换字符实例
我最近才在学习和利用正则表达式的力量,我有一个从 返回的文件的元组列表os.walk()
,如下所示:
我试图让它看起来像这样:
我试过用这个。
这将返回:
所以我将表达式改为:
给我:
我的p = pad2.sub
功能有问题吗?还是我编译的表达式中存在问题?还是"_"
表达中的存在搞砸了?
我什至尝试在函数内部传递一些表达式pad2.sub
来测试它,当然这并没有真正起作用。我知道我在这里遗漏了一些东西,我有点卡住了。
任何和所有的帮助将不胜感激以及对逻辑的解释。