2

我有 Windows 电脑。我的脚本应该识别文件夹中命令行中传递的文件的序号,即

myscript.py \\network-drive\files\Long-long.file.name.with.numbers.txt

文件夹内容如下:

\\network-drive\files\
    folder1
    folder2
    file1
    file2
    Long.long.file.name.with.numbers.txt
    file3
    file4

我的脚本应该识别命令行中给出的文件的序列号,即应该返回 5(文件夹也将被计算在内;假设文件按名称排序)。

更新。我已经停止了以下操作:

import sys
import os.path

if sys.argv[1]: # regardless of this verification, exception happens if argument is not passed
    head, tail = os.path.split(sys.argv[1])
    print head
    print os.listdir(head)

返回的列表listdir不允许我识别什么是文件夹和什么是文件。所以,我不能正确地对它们进行排序。

4

3 回答 3

3

您正在尝试解决几个问题,以及解决方案的几个选项。

第一 - 您是否正在寻找自然排序的东西,即:

/path/to/folder/
  subfolder01/
  test1.png
  test2.png
  test3.png
  test10.png
  test11.png

如果是这样...您将需要创建一个自然排序方法。如果您对字母数字排序感到满意:

/path/to/folder/
  subfolder01/
  test1.png
  test10.png
  test11.png
  test2.png
  test3.png

然后标准排序将起作用。根据您对文件进行排序的方式,结果的索引会有所不同。

要从系统中获取目录和文件,您可以使用以下两种方法之一 - 不能 100% 确定哪种方法更快,因此请同时测试它们。我将把答案分成几块,这样你就可以把它拼凑起来,看起来最合适:

第 01 部分:初始化

import os
import sys

try:
    searchpath = sys.argv[1]
except IndexError:
    print 'No searchpath supplied'
    sys.exit(0)

basepath, searchname = os.path.split(searchpath)

Part 02:收集文件夹和文件

选项 #1:os.listdir + os.path.isfile

files   = []
folders = []
for filepath in os.listdir(basepath):
    if ( os.path.isfile(filepath) ):
        files.append(filepath)
    else:
        folders.append(folder)

选项#2:os.walk

# we only want the top level list of folders and files,
# so break out of the loop after the first result
for basepath, folders, files in os.walk(basepath):
    break

Part 03:计算索引

选项#1:不排序——你从系统中得到的就是你得到的

# no sorting
try:
    index = len(folders) + files.index(searchname)
except IndexError:
    index = -1

选项 #2:字母数字排序

# sort alpha-numerically (only need to sort the files)
try:
    index = len(folders) + sorted(files).index(searchname)
except IndexError:
    index = -1

选项#3:自然排序

# natural sort using the projex.sorting.natural method
import projex.sorting
sorted_files = sorted(files, projex.sorting.natural)
try:
    index = len(folders) + sorted_files.index(searchname)
except IndexError:
    index = -1

第 04 部分:记录结果

# if wanting a 1-based answer
index += 1
print index

我不打算详细介绍自然排序,因为这不是问题的一部分——我认为这里还有其他论坛,你可以在这方面找到建议。projex.sorting 模块是我编写的模块,如果您想查看它的确切实现,可以在这里找到: http ://dev.projexsoftware.com/projects/projex。

可以说这将是结果的差异:

>>> import pprint, projex.sorting
>>> files = ['test2.png', 'test1.png', 'test10.png', 'test5.png', 'test11.png']
>>> print files.index('test10.png')
2
>>> print sorted(files).index('test10.png')
1
>>> print sorted(files, projex.sorting.natural).index('test10.png')
3
>>> print files
['test2.png', 'test1.png', 'test10.png', 'test5.png', 'test11.png']
>>> print sorted(files)
['test1.png', 'test10.png', 'test11.png', 'test2.png', 'test5.png']
>>> print sorted(files, projex.sorting.natural)
['test1.png', 'test2.png', 'test5.png', 'test10.png', 'test11.png']

因此,当您使用它时,请记住这一点。

干杯!

于 2012-08-02T18:08:01.180 回答
1

看起来像这样的东西应该可以工作:

import os
import glob
import sys
import os.path as path

try:
    directory,file = path.split( sys.argv[1] )
    def sort_func(fname):
        """
        Russian directories , english directories, russian files then english files
        although, honestly I don't know how russian files will actually be sorted ...
        """
        fullname = path.join(directory,fname)
        isRussian = any(ord(x) > 127 for x in fullname)
        isDirectory = path.isdir(fullname)
        return ( not isDirectory, not isRussian, fullname)

    files = sorted( os.listdir(directory), key=sort_func)
    print ( files.index(file) + 1 )

except IndexError:
    print "oops, no commandline arguments"
于 2012-08-02T17:11:00.220 回答
0
from os import listdir
from sys import argv
from os.path import *
print listdir(dirname(argv[1]).index(basename(argv[1]))

但它真的没有任何意义,甚至无法想象你需要的用例。详情请参阅os.path

于 2012-08-02T17:09:44.353 回答