0

我正在尝试从 csv 文件中找到最小值和最大值,并将其输出到文本文件中,目前我的代码将所有数据输出到输出文件中,我不确定如何从多列中获取数据并相应地对它们进行排序。

任何指导将不胜感激,因为我对如何解决这个问题没有很好的指导

read_file = open("riskfactors.csv", 'r')

def create_file():

    read_file = open("riskfactors.csv", 'r')
    write_file = open("best_and_worst.txt", "w")

    for line_str in read_file:
        read_file.readline()
        print (line_str,file=write_file)

    write_file.close()
    read_file.close()
4

2 回答 2

2

假设您的文件是一个标准的 .csv 文件,仅包含用分号分隔的数字:

1;5;7;6;
3;8;1;1;

然后最简单的方法是使用 str.split() 命令,然后将类型转换为 int。您可以将所有值存储在列表中(或更快:设置),然后获得最大值:

valuelist=[]
for line_str in read_file:
     for cell in line_str.split(";"):
         valuelist.append(int(cell))
print(max(valuelist))
print(min(valuelist))

警告:如果您的文件包含非数字条目,则必须将它们过滤掉。.csv 文件也可以有不同的分隔符。

于 2012-10-16T00:14:15.893 回答
1
import sys, csv

def cmp_risks(x, y):
    # This assumes risk factors are prioritised by key columns 1, 3
    # and that column 1 is numeric while column 3 is textual
    return cmp(int(x[0]), int(y[0])) or cmp(x[2], y[2])

l = sorted(csv.reader(sys.stdin), cmp_risks))

# Write out the first and last rows
csv.writer(sys.stdout).writerows([l[0], l[len(l)-1]])

现在,我走捷径,说输入输出文件是sys.stdinsys.stdout. 您可能会将这些替换为您在原始问题中创建的文件对象。(例如read_filewrite_file

但是,就我而言,我可能只是运行它(如果我使用的是 linux):

$ ./foo.py <riskfactors.csv >best_and_worst.txt
于 2012-10-16T01:40:14.653 回答