1

如果我有几个 csv 文件如下:

a,1,2,3
type, max, min, avg
b,4,5,6
<empty line>
c,6,7,8
xxx,4,3,2
d,5,6,7

在使用 csv 阅读器读取上述 csv 文件后,我如何使用 xlwt 模块将数据转储到新的 xls 文件中,但是以一种排列的方式,以便它: - 将标题写入第一行(此行始终具有“类型”为第一项。) - 忽略空行 - 忽略第一项为“xxx”的任何行

我尝试使用以下代码,但空行并没有消失。:(

for filename in glob.glob(p):
     (f_path, f_name) = os.path.split(filename)
     (f_short_name, f_extension) = os.path.splitext(f_name)
     ws = wb.add_sheet(str(f_short_name))
     spamReader = csv.reader(open(filename, 'rb'))

     for row in spamReader:
         pass_count = 0
         if 'type' in row[0]:
             for col in range(len(row)):
                 ws.write(0,col,convert(row[col]))
         else:
             if (((row[0] == 'xxx') or (row[0] == ' ')):
                 pass_count += 1
                 pass
             else:
                 for col in range(len(row)):
                     ws.write(row_count,col,convert(row[col]))

        row_count = row_count+1-pass_count


wb.save(q)

编辑:伙计们,很抱歉误导了最初的 csv 数据。我的 csv 数据文件不包含任何空行。它是包含空行的最终产品,即最终的 xls 文件。空行恰好出现在row[0] - 'type'. 另外,我还集成了一个防止 line1 被覆盖的代码。

例如输入:

a,1,2,3
type, max, min, avg
b,4,5,6
c,6,7,8
xxx,4,3,2
d,5,6,7

输出 xls:

type, max, min, avg
<empty line>
a,1,2,3
b,4,5,6
c,6,7,8
d,5,6,7

在这里,标题被写入第一行,'xxx' 行被忽略,但空行出现在第 2 行,这是输入文件中行 [0]='type' 的行的位置。这就是为什么我引入了“pass_count”来跳过这一行但似乎没有在某个地方找到合适的地方。

4

2 回答 2

3

如果一行是空的,我认为这不是真的:

row[0] == ' '  # A space?

我希望row这是一个空列表,但也许您的数据中有一些我不知道的东西。

此外,与其整理逻辑以跟踪row_count然后减去pass_count,为什么不让事情简单化,row_count每当你写另一个 Excel 行时就增加呢?那将是pass_count不必要的。

于 2011-05-19T11:10:41.143 回答
3

您的“空”行不为空。

如果它是空的,row则将是[]一个空列表,并且所有这些引用中的第一个row[0]将导致引发异常。由于那还没有发生,并且正如您所说,它无法匹配一个空格,因此结论是它必须包含其他一些空格。

为了在真正空行的情况下保持稳健性,您应该首先测试空行:

if not row: continue
row = [x.strip() for x in row] # remove leading and trailing whitespace from all fields
if not row[0] or row[0] == "xxx": continue
if row[0] == "type":
    # code to write headings goes here
else:
    # code to write data goes here
row_count += 1 # pass_count is pointless

顺便说一句,您的示例数据在第二个输入行中有“类型”。这将覆盖输出文件中的第一行,而输出文件的第二行将为空!

更新以响应修订的信息

即使您在当前文件中没有空行,使用类似于我建议的代码来防止完全空行、仅包含空格的行和仅包含空格的字段也是非常好的做法。csv 文件末尾的空白行并不少见。

我应该提到你似乎有一个古董版的xlwt; 更高版本将引发异常,例如Attempt to overwrite cell: sheetname=u'x' rowx=0 colx=0. 这是为了捕获无意覆盖而引入的,并且可以逐页关闭:workbook.add_sheet(u'Some Sheet Name', cell_overwrite_ok=True)

您使用str()in绝对是不必要的,如果文件名已经是一个对象ws = wb.add_sheet(str(f_short_name)),则可能会导致异常。unicode

于 2011-05-19T11:36:39.767 回答