0

我正在尝试编写一些代码来搜索目录并提取所有以特定数字(由列表定义)开头并以'.labels.txt'结尾的项目。这就是我到目前为止所拥有的。

lbldir = '/musc.repo/Data/shared/my_labeled_images/labeled_image_maps/'

picnum = []
for ii in os.listdir(picdir):
   num = ii.rstrip('.png')
   picnum.append(num)

lblpath = []   
for file in os.listdir(lbldir):
   if fnmatch.fnmatch(file, '*.labels.txt') and fnmatch.fnmatch(file, ii in picnum + '.*'):
       lblpath.append(os.path.abspath(file))

这是我得到的错误

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-10-a03c65e65a71> in <module>()
  3 lblpath = []
  4 for file in os.listdir(lbldir):
----> 5     if fnmatch.fnmatch(file, '*.labels.txt') and fnmatch.fnmatch(file, ii in picnum + '.*'):
  6         lblpath.append(os.path.abspath(file))

TypeError: can only concatenate list (not "str") to list

我意识到 picnum 部分中的 ii 不起作用,但我不知道如何解决它。这可以通过 fnmatch 模块完成还是我需要正则表达式?

4

1 回答 1

1

出现错误是因为您试图将".*"(字符串)添加到 的末尾picnum,这是一个列表,而不是字符串。

另外,ii in picnum不是把 的每一项都还给picnum你,因为你没有迭代ii. 它只是在您的第一个循环中分配的最后一个值。

and您可能有一个嵌套测试,当您找到匹配的文件时,您可能会运行一个嵌套测试,而不是同时测试两者.labels.txt,如下所示。这使用re而不是fnmatch从文件名的开头提取数字,而不是尝试匹配每个picnum. 这取代了你的第二个循环:

import re
for file in os.listdir(lbldir):
    if file.endswith('.labels.txt')
        startnum=re.match("\d+",file)
        if startnum and startnum.group(0) in picnum:
            lblpath.append(os.path.abspath(file))

我认为这应该可行,但如果没有您的实际文件名,它显然未经测试。

于 2013-10-23T18:48:43.763 回答