5

我正在练习该os模块,更具体地说os.walk()。我想知道是否有一种更简单/更有效的方法来查找文件的实际路径,考虑到这会产生一个表明文件在os.walk()第一次运行时位于原始文件夹中的路径:

import os

threshold_size = 500

for folder, subfolders, files in os.walk(os.getcwd()):
    for file in files:
        filePath = os.path.abspath(file)
        if os.path.getsize(filePath) >= threshold_size:
            print filePath, str(os.path.getsize(filePath))+"kB"

这是我目前的解决方法:

import os

threshold_size = 500

for folder, subfolders, files in os.walk(os.getcwd()):
    path = os.path.abspath(folder)
    for file in files:
        filePath = path + "\\" + file
        if os.path.getsize(filePath) >= threshold_size:
            print filePath, str(os.path.getsize(filePath))+"kB"

对于 shaktimaan,这是:

for folder, subfolders, files in os.walk(os.getcwd()):
    for file in files:
        filePath = os.path.abspath(file)
        print filePath

产生这个(这些文件中的大多数都在项目的子文件夹中,而不是项目本身):

C:\Python27\projects\ps4.py
C:\Python27\projects\ps4_encryption_sol.py
C:\Python27\projects\ps4_recursion_sol.py
C:\Python27\projects\words.txt
C:\Python27\projects\feedparser.py
C:\Python27\projects\feedparser.pyc
C:\Python27\projects\news_gui.py
C:\Python27\projects\news_gui.pyc
C:\Python27\projects\project_util.py
C:\Python27\projects\project_util.pyc
C:\Python27\projects\ps5.py
C:\Python27\projects\ps5.pyc
C:\Python27\projects\ps5_test.py
C:\Python27\projects\test.py
C:\Python27\projects\triggers.txt
C:\Python27\projects\ps6.py
C:\Python27\projects\ps6_pkgtest.py
C:\Python27\projects\ps6_solution.py
C:\Python27\projects\ps6_visualize.py
C:\Python27\projects\ps6_visualize.pyc
C:\Python27\projects\capitalsquiz1.txt
C:\Python27\projects\capitalsquiz2.txt
C:\Python27\projects\capitalsquiz3.txt
C:\Python27\projects\capitalsquiz4.txt
C:\Python27\projects\capitalsquiz5.txt
C:\Python27\projects\capitalsquiz_answers1.txt
C:\Python27\projects\capitalsquiz_answers2.txt
C:\Python27\projects\capitalsquiz_answers3.txt
C:\Python27\projects\capitalsquiz_answers4.txt
C:\Python27\projects\capitalsquiz_answers5.txt
C:\Python27\projects\quiz.py
C:\Python27\projects\file2.txt
C:\Python27\projects\regexes.txt
C:\Python27\projects\regexsearch.py
C:\Python27\projects\testfile.txt
C:\Python27\projects\renamedates.py
4

3 回答 3

7

我认为你误会了什么abspath。abspath 只是将相对路径转换为完整的绝对文件名。

例如

os.path.abspath(os.path.join(r"c:\users\anonymous\", ".."))
#produces this output : c:\users

没有任何其他信息,abspath只能从它可以知道的唯一目录形成绝对路径,对于您的情况是当前工作目录。所以目前它正在做的是加入os.getcwd()和你的file

所以你需要做的是:

for folder, subfolders, files in os.walk(os.getcwd()):
    for file in files:
        filePath = os.path.join(os.path.abspath(folder), file)
于 2015-05-25T19:05:56.163 回答
2

您的解决方法应该可以正常工作,但更简单的方法是:

import os

threshold_size = 500

root = os.getcwd()
root = os.path.abspath(root) # redunant with os.getcwd(), maybe needed otherwise
for folder, subfolders, files in os.walk(root):
    for file in files:
        filePath = os.path.join(folder, file)
        if os.path.getsize(filePath) >= threshold_size:
            print filePath, str(os.path.getsize(filePath))+"kB"

这里的基本思想是,folder如果参数os.walk为 1,os.path.join则将是绝对规范化路径,如果任何参数是绝对路径并且所有以下参数都已规范化,则将生成绝对规范化路径。

os.path.abspath(file)在您的第一个示例中不起作用的原因是这file是一个裸文件名,例如quiz.py. 因此,当您使用abspath它时,它基本上os.path.join(os.getcwd(), file)会做同样的事情。

于 2015-05-25T19:10:48.577 回答
1

这个简单的例子应该可以解决问题。我将结果存储在一个列表中,因为对我来说,将列表传递给不同的函数并在列表上执行不同的操作非常方便。

import os
directory = os.getcwd()
list1 = []

for root, subfolders, files in os.walk(directory):
  list1.append( [ os.path.join(os.path.abspath(root), elem) for elem in files if elem ])
# clean the list from empty elements
final_list = [ x for x in list1 if x != [] ]
于 2016-12-19T13:23:07.310 回答