0

我目前正在自学 Python,并且正在编写我的第一个 shell 脚本。它是一个 linux 文件搜索 shell 脚本,使用“md5hash”识别重复文件。它仅用于学习目的,而不是用于实际项目。

这是我的代码:

from subprocess import Popen, PIPE
import os
def index(directory):
    stack = [directory]
    files = []
    while stack:
        directory = stack.pop()
        for file in os.listdir(directory):
            fullname = os.path.join(directory, file)
            if search_term in fullname:
                files.append(fullname)
            if os.path.isdir(fullname) and not os.path.islink(fullname):
                stack.append(fullname)
    return files

from collections import defaultdict

def check(directory):
    files = index(directory)
    if len(files) < 1:
        print("No file(s) meets your search criteria")
    else:
        print ("List of files that match your criteria:")
        for x in files:
            print (x)
        print ("-----------------------------------------------------------------")
    values = []
    for x in files:
        cmd = ['md5sum', x]
        proc = Popen(cmd, stdout=PIPE)
        (out, err) = proc.communicate()
        a = out.split(' ', 1)
        values.append(a[0])
    proc.stdout.close()
    stat = os.waitpid(proc.pid, 0)
    D = defaultdict(list)
    for i,item in enumerate(values):
        D[item].append(i)
    D = {k:v for k,v in D.items() if len(v)>1}
    for x in D:
        if len(D[x]) > 1:
            print ("File", files[D[x][0]], "is same file(s) as:")
            for y in range(1, len(D[x])):
                print (files[D[x][y]]) 

search_term = input('Enter a (part of) file name for search:')
a = input('Where to look for a file? (enter full path)')
check(a)

我关于代码的问题:

1. 有人建议我用 subprocess.Popen() 替换已弃用的 os.popen()

但是我不知道该怎么做。我尝试了几种解决方案,我发现这些解决方案已经存在于 stackoverflow 上,但似乎没有一个适用于我的情况,并且每个都产生某种错误。例如,像这样处理它:

from subprocess import Popen, PIPE
...
cmd = ['md5sum', f]
proc = subprocess.Popen(cmd, stdout=subprocess.PIPE)
proc.stdout.close()
stat = os.waitpid(proc.pid, 0)

我得到了NameError: global name 'subprocess' is not defined错误。

我真的迷失了这一点,因此感谢您提供的任何帮助。

2.如何使这个程序能够从顶部(根)搜索?

如果我输入“/”作为搜索路径,我会得到PermissionError: [Errno 1] Operation not permitted: '/proc/1871/map_files'我的脚本是否需要 sudo 权限?

我正在尝试通过使用 Internet 为自己学习 Python。谢谢你的帮助!

4

1 回答 1

2

1. 如果使用from module import variable语法,可以variable直接访问,本例:

from subprocess import Popen, PIPE
proc = Popen(cmd, stdout=PIPE)

如果您使用import module语法,则需要添加模块名称(就像您在代码中所做的那样):

import subprocess
proc = subprocess.Popen(cmd, stdout=subprocess.PIPE)

有关导入的更多信息,我推荐阅读了解导入和 PYTHONPATH的文章。

2.文件系统中的某些文件只能以root 身份读取,例如目录中的某些文件/proc/。要阅读它们,您的 Python 脚本需要 root 访问权限,例如通过sudo.

于 2013-10-24T19:52:18.060 回答