1

我有一个将 csv 转换为 xml 到 csv 的程序。但是,当我将其转换回 csv 时,格式出现了错误。最初的csv文件是这样的:

x1    y1    z1    x2    y2    z2    cost
 1     2     3     4     5     6       7

等等等等。此数据也使用 excel 表示。然后我将其转换为 xml,如下所示:

<Solution version="1.0">
  <DrillHoles total_holes="238">
    <description>
      <hole hole_id="1">
        <collar>1, 2, 3</collar>
        <toe>4, 5, 6</toe>
        <cost>7</cost>
      </hole>

*请注意,这只是整个事情的一部分,但对于这个例子来说已经足够了。因此,当我将其转换回 csv 格式时,它似乎是这样的:

 x1    y1     z1    x2    y2    z2    cost
123                 456               7

其中 x1y1z1x2y2z2cost 在 excel 的一列中混杂在一起。这也在excel中表示。

这是我生成xml的代码:

def generate_xml(reader,outfile):
    root = Element('Solution')
    root.set('version','1.0')
    tree = ElementTree(root)        
    head = SubElement(root, 'DrillHoles')
    description = SubElement(head,'description')
    current_group = None
    i = 1
    for row in reader.next():
        x1,y1,z1,x2,y2,z2,cost = row
        if current_group is None or i != current_group.text:
            current_group = SubElement(description, 'hole',{'hole_id':"%s"%i})

            collar = SubElement(current_group,'collar')
            toe = SubElement(current_group,'toe')
            cost1 = SubElement(current_group,'cost')
            collar.text = ', '.join((x1,y1,z1))
            toe.text = ', '.join((x2,y2,z2))
            cost1.text = cost
        i+=1
    head.set('total_holes', '%s'%i)
    indent.indent(root)
    tree.write(outfile)

生成 csv: def generate_csv(root, outfile): with open(outfile, 'w') as file_:

        writer = csv.writer(file_, delimiter="\t")
        writer.writerow(['x1'] + ['y1'] + ['z1'] + ['x2'] + ['y2'] + ['z2'] + ['cost'])
        for a in zip(root.findall("DrillHoles/description/hole/collar"),
                 root.findall("DrillHoles/description/hole/toe"),
                 root.findall("DrillHoles/description/hole/cost")):
            writer.writerow([x.text for x in a])

请帮助谢谢编辑:我想我可能需要多个分隔符,但我不知道如何将其合并到该程序中。

4

2 回答 2

1

您似乎缺少拆分,它与您在生成 xml 时所做的 join((x1,y1,z1)) 对称。像这样的东西:

for a in zip(root.findall("DrillHoles/description/hole/collar"),
         root.findall("DrillHoles/description/hole/toe"),
         root.findall("DrillHoles/description/hole/cost")):
    collars, toes, cost = a
    collars = [x.strip() for x in collars.text.split(',')]
    toes = [x.strip() for x in toes.text.split(',')]
    cost = [cost.text]
    writer.writerow(collars + toes + cost)
于 2013-07-08T22:42:45.713 回答
0

您可以尝试将 excel 方言与 csv writer 类一起使用,以便 excel 正确检测分隔符:

尝试换行:

writer = csv.writer(file_, delimiter="\t")

到这一行:

writer = csv.writer(file_, dialect='excel')

但是如果您需要制表符作为分隔符,您可以在 excel 中导入 csv 文件时尝试修剪设置

于 2013-07-06T16:30:40.023 回答