我目前正在自学 Python,并且正在编写我的第一个 shell 脚本。它是一个 linux 文件搜索 shell 脚本,使用“md5hash”识别重复文件。它仅用于学习目的,而不是用于实际项目。
这是我的代码:
from subprocess import Popen, PIPE
import os
def index(directory):
stack = [directory]
files = []
while stack:
directory = stack.pop()
for file in os.listdir(directory):
fullname = os.path.join(directory, file)
if search_term in fullname:
files.append(fullname)
if os.path.isdir(fullname) and not os.path.islink(fullname):
stack.append(fullname)
return files
from collections import defaultdict
def check(directory):
files = index(directory)
if len(files) < 1:
print("No file(s) meets your search criteria")
else:
print ("List of files that match your criteria:")
for x in files:
print (x)
print ("-----------------------------------------------------------------")
values = []
for x in files:
cmd = ['md5sum', x]
proc = Popen(cmd, stdout=PIPE)
(out, err) = proc.communicate()
a = out.split(' ', 1)
values.append(a[0])
proc.stdout.close()
stat = os.waitpid(proc.pid, 0)
D = defaultdict(list)
for i,item in enumerate(values):
D[item].append(i)
D = {k:v for k,v in D.items() if len(v)>1}
for x in D:
if len(D[x]) > 1:
print ("File", files[D[x][0]], "is same file(s) as:")
for y in range(1, len(D[x])):
print (files[D[x][y]])
search_term = input('Enter a (part of) file name for search:')
a = input('Where to look for a file? (enter full path)')
check(a)
我关于代码的问题:
1. 有人建议我用 subprocess.Popen() 替换已弃用的 os.popen()
但是我不知道该怎么做。我尝试了几种解决方案,我发现这些解决方案已经存在于 stackoverflow 上,但似乎没有一个适用于我的情况,并且每个都产生某种错误。例如,像这样处理它:
from subprocess import Popen, PIPE
...
cmd = ['md5sum', f]
proc = subprocess.Popen(cmd, stdout=subprocess.PIPE)
proc.stdout.close()
stat = os.waitpid(proc.pid, 0)
我得到了NameError: global name 'subprocess' is not defined
错误。
我真的迷失了这一点,因此感谢您提供的任何帮助。
2.如何使这个程序能够从顶部(根)搜索?
如果我输入“/”作为搜索路径,我会得到PermissionError: [Errno 1] Operation not permitted: '/proc/1871/map_files'
我的脚本是否需要 sudo 权限?
我正在尝试通过使用 Internet 为自己学习 Python。谢谢你的帮助!