问题标签 [os.walk]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - os.walk 没有深入到下面的目录
如何限制os.walk
只返回我提供的目录中的文件?
python - Python 目录搜索和 dict 组织
大家好,这是我最近第一次尝试进入 Python 的文件和操作系统部分。我正在尝试搜索一个目录,然后找到所有子目录。如果目录没有文件夹,请将所有文件添加到列表中。并按 dict 组织它们。
例如,一棵树可能看起来像这样
- 起始路径
- 目录 1
- 子目录 1
- 子目录 2
- 子目录 3
- 子目录
- 文件.jpg
- 文件夹1
- 文件1.jpg
- 文件2.jpg
- 文件夹2
- 文件3.jpg
- 文件4.jpg
- 子目录
- 目录 1
即使 subsubdir 中有一个文件,也应该跳过它,因为它里面有文件夹。
现在,如果我知道要查找多少个目录,我通常可以使用 os.listdir 和 os.path.isdir 执行此操作。但是,如果我希望它是动态的,它将必须补偿任何数量的文件夹和子文件夹。我曾尝试使用 os.walk,它会轻松找到所有文件。我遇到的唯一麻烦是使用包含文件的路径名创建所有字典。我需要由 dict 组织的文件夹名称,直到起始路径。
所以最后,使用上面的例子,字典应该看起来像这样,里面有文件:
将不胜感激任何帮助或组织信息的更好的想法。谢谢。
python - os.walk() python: 目录结构的 xml 表示,递归
所以我试图使用 os.walk() 来生成目录结构的 XML 表示。我似乎得到了大量的重复。它将目录正确地放置在彼此之间,并将文件放在 xml 文件第一部分的正确位置;但是,在它正确完成之后,它会继续错误地遍历。我不太清楚为什么....
这是我的代码:
fileToXML 只是简单地解析出列表,因此无需担心。
目录结构很简单:
生成的 xml 文件变为:
任何帮助将非常感激!
python - 如何在 python 中获取 os.walk 的进度?
我有一段代码用于搜索游戏文件的可执行文件并返回目录。我真的很想获得一些关于进展情况的进度指标os.walk
。我将如何完成这样的事情?
我尝试这样做startpt = root.count(os.sep)
并衡量它,但这只是给出os.walk
了目录树的深度。
python - python 中的 os.walk 未使用作为路径传递的 cmd 行参数运行
我需要在系统上的一个文件夹中找到文件的数量。
这是我用的:
当我们将路径指定为引号中的字符串时,这很好用,但是当我输入一个包含路径的变量名时,type(file_count) 是一个生成器对象,因此不能用作整数。
如何解决这个问题以及为什么会发生这种情况?
好的,这就是我正在做的事情:
在终端的命令行中:
在 myProg.py 中:
arg1 作为字符串传递
我检查了 repr(arg1) 和 type(arg1):
错误信息:
我不知道,当我只使用一些虚拟变量输入它时,它在 IDLE python IDE 中运行良好。
python - python处理匹配的完整列表文件
我试图让简单的代码工作,不幸的是我是一个 python 初学者。
我的脚本应该返回一个与模式不匹配的文件列表,更多信息在这里: python grep reverse matching
我的代码正在运行,但没有按应有的方式处理找到的完整文件列表:
此代码返回:
/home/patate/code/project/blabla/blabla/build.xml 没有字符串
没有任何
如果我更改f = str(os.path.join(path, name)) for print str(os.path.join(path, name))
,我可以看到正在打印的整个列表。
我怎样才能按我的意愿处理整个列表?
python - 使用 python 脚本的 multicpu bzip2
我想使用我的 8 核 16 GB ram 工作站快速 bzip2 压缩数百 GB 的数据。目前我正在使用一个简单的 python 脚本来压缩整个目录树,它使用 bzip2 和一个耦合到 os.walk 调用的 os.system 调用。
我看到 bzip2 只使用一个 cpu,而另一个 cpu 保持相对空闲。
我是队列和线程进程的新手。但我想知道如何实现这一点,以便我可以有四个 bzip2 运行线程(实际上我猜是 os.system 线程),每个线程可能使用自己的 cpu ,当他们 bzip 文件时从队列中耗尽文件。
我的单线程脚本粘贴在这里。
python - 我得到 OSError: [Errno 13] Permission denied:, 和 os.walk 退出
我有一个脚本可以向我报告一个目录中的所有文件,以便用户需要删除它们(这是一个管理不善的集群,没有真正的超级用户)。当我运行脚本时,我得到: OSError: [Errno 13] Permission denied: ' ls: : Permission denied 我不能写目录名(公司政策) 代码是:
该脚本不发送电子邮件,但会死掉。感谢您帮助新手。
python - 非递归 os.walk()
我正在寻找一种方法来进行非递归os.walk()
步行,就像os.listdir()
作品一样。但我需要以同样的方式os.walk()
返回。任何的想法?
先感谢您。
macos - 为什么 os.walk 不能识别我的变量名?
我在 TextWrangler 中写了以下内容:
不幸的是,当我在终端中运行它并通过从扩展坞中键入或拖动文件夹来分配目录路径时,什么也没有发生。甚至没有错误消息。另一方面,当我在 TextWrangler 中输入以下内容然后在终端中运行该程序时,它工作正常。
那么我的问题是,为什么 os.walk 不接受变量形式的路径。我正在使用的书建议它应该这样做,就像我在试图解决这个问题时在网上看到的大多数示例一样。