9

我使用 python,我需要一个函数或库来搜索我在所有驱动器中的文件,我只给它提供文件的名称,就像F3在 Windows 中搜索计算机中的所有文件夹一样。Windows 操作系统,本地驱动器,,我写了一个代码

import os
import win32api
paths = 'D:/'
def dir_list_folder(paths):
    for folderName in os.listdir(paths):
        if (folderName.find('.') == -1):
            folderPath = os.path.join(paths,folderName );
            dir_list_folder(folderPath);
        else:
            print ('Files is :'+ folderName );

它给了我一个很好的结果,但是某些类型给我一个错误,如果我不需要在 .Zip 或 .RAR 文件中搜索,我该怎么做

4

3 回答 3

10

在 Windows 上,您最好使用该os.walk功能。os.walk返回一个递归遍历源树的生成器。下面的示例显示了正则表达式搜索。

import os
import re
import win32api

def find_file(root_folder, rex):
    for root,dirs,files in os.walk(root_folder):
        for f in files:
            result = rex.search(f)
            if result:
                print os.path.join(root, f)
                break # if you want to find only one

def find_file_in_all_drives(file_name):
    #create a regular expression for the file
    rex = re.compile(file_name)
    for drive in win32api.GetLogicalDriveStrings().split('\000')[:-1]:
        find_file( drive, rex )


find_file_in_all_drives( 'myfile\.doc' )

一些注意事项:

  1. 我正在使用正则表达式来搜索文件。为此,我提前编译 RE,然后将其作为参数传递。请记住规范化表达式 - 特别是如果文件名来自恶意用户。
  2. win32api.GetLogicalDriveStrings返回一个字符串,其中所有驱动程序以 0 分隔。拆分它,然后切出最后一个元素。
  3. 在遍历过程中,您可以从 'dirs' 中删除不需要的文件夹,例如 '.git' 或 '.cvs'。参见os.walk.__doc__,例如。
  4. 为了保持样本简短,我没有传播“找到”。break如果要打印所有文件,请删除。如果您想在找到第一个文件后停止,请传播break到。find_file_in_all_drives
于 2012-10-25T11:55:56.953 回答
2
import os
az = lambda: (chr(i)+":\\" for i in range(ord("A"), ord("Z") + 1))
for drv in az():
    for root, dirs, files in os.walk(drv):
        process_the_stuff()
于 2012-10-25T11:43:14.970 回答
1

您需要指定驱动器,例如 c 驱动器。

def findall(directory):
    files=os.listdir(directory)
    for fl in files:
        path=os.path.join(directory,fl)
        if os.path.isdir(path):
            findall(path)
        else:
            dosomethingwithfile(path)
    return

基本上你遍历文件树。您必须将驱动器作为根目录传递给此方法。例如。findall('c:/')

于 2012-10-25T11:39:10.550 回答