我正在尝试从特定格式的文档中提取文件名,并将它们放入列表中。该文档包含大量信息,但我关注的行如下所示,“文件名:”始终位于行首:
File Name: C:\windows\system32\cmd.exe
我尝试了以下方法:
xmlfile = open('my_file.xml', 'r')
filetext = xmlfile.read()
file_list = []
file_list.append(re.findall(r'\bFile Name:\s+.*\\.*(?=\n)', filetext))
这file_list
看起来像:
[['File Name: c:\\windows\\system32\\file1.exe',
'File Name: c:\\windows\\system32\\file2.exe',
'File Name: c:\\windows\\system32\\file3.exe']]
我正在寻找我的输出只是:
(file1.exe, file2.exe, file3.exe)
我也尝试ntpath.basename
在上面的输出上使用,但看起来它想要一个字符串作为输入,而不是一个列表。
我对 Python 和一般的脚本编写非常陌生,所以任何建议都将不胜感激。