python - 添加到现有电子表格？

Question

我有一个带有字段名的电子表格：

['姓名'，'职业'，'公司'，'地址'，'address_2'，'城市'，'州'，'邮编'，'电话'，'传真'，'电子邮件'，'网站'，'描述']

并希望将包含较少字段名的其他数据电子表格添加到此电子表格（尽管所有其他人的字段名都包含在此电子表格中）。

我收到一个奇怪的错误：

Samuel-Finegolds-MacBook-Pro:~ samuelfinegold$ /var/folders/jv/9_sy0bn10mbdft1bk9t14qz40000gn/T/Cleanup\ At\ Startup/merge-395698810.980.py.command ; exit;
['name', 'occupation', 'company', 'address', 'address_2', 'city', 'state', 'zip', 'phone,fax', 'email', 'website', 'description']
Traceback (most recent call last):
  File "/Users/samuelfinegold/Documents/noodle/merge.py", line 14, in <module>
    gc_all_dict.writerow(row)
  File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/csv.py", line 148, in writerow
    return self.writer.writerow(self._dict_to_list(rowdict))
  File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/csv.py", line 144, in _dict_to_list
    ", ".join(wrong_fields))
TypeError: sequence item 0: expected string, NoneType found
logout

[Process completed]

当我运行以下命令时：

import csv

# compile master spreadsheet
with(open('gc_all.txt','w')) as gc_all:

    fieldnames = ['name', 'occupation', 'company', 'address', 'address_2','city', 'state', 'zip', 'phone,' 'fax', 'email', 'website', 'description']
    gc_all_dict = csv.DictWriter(gc_all, fieldnames = fieldnames, delimiter = '\t')
    print gc_all_dict.fieldnames

    with(open('/Users/samuelfinegold/Documents/noodle/aicep/aicep_scrape_output.txt', 'rU')) as aicep:
        aicep_dict = csv.DictReader(aicep, fieldnames = fieldnames, delimiter = '\t')
        for row in aicep_dict:
#             print row
            gc_all_dict.writerow(row)


    for row in gc_all:
        print row

假数据：

name    occupation  company address address_2   city    state   zip phone   fax email   website description
Rob Er      Step Up 123 Road Dr     New York    NY  10011   1234567891  1234567891  a@b.com www.stepUp.com  A great counselor
Bob B. Bob      For Your Rights 12 2nd Ave      San Francisco   CA  94109   1234567891  1234567891  c@d.com     
Snob Job        Marley Inc. 12 1st Ave      Denver  CO  80231   1234567891  1234567891  g@h.com     What a counselor!

score 2 · Accepted Answer

这里真正的问题是，尽管您在问题中声称，所有其他人的字段名都不包含在此电子表格中。

您可以通过查看上升线上方的线来判断。DictWriter._dict_to_list看起来像这样：

def _dict_to_list(self, rowdict):
    if self.extrasaction == "raise":
        wrong_fields = [k for k in rowdict if k not in self.fieldnames]
        if wrong_fields:
            raise ValueError("dict contains fields not in fieldnames: " +
                             ", ".join(wrong_fields))
    return [rowdict.get(key, self.restval) for key in self.fieldnames]

因此，它找到了一个不在您的DictWriter.

但是为什么在尝试创建错误时会引发那个奇怪的错误呢？因为缺少的字段名为None. DictWriter代码不是为了处理这个问题而构建的。所以，这就是问题#2。

为什么该字段被命名None？因为这就是DictReader当它发现一个不适合fieldnames你给它的列时产生的。您可以通过以下方式看到这一点print row： will 的元素之一dict是类似的None: 'foo'。所以，这就是问题#3。

那么你如何解决这个问题？

好吧，显而易见的事情是使您的主张成为现实：使目标中的字段成为源中字段的严格超集。

或者，您可以告诉您DictReader跳过额外的字段，或者您DictWriter忽略它们而不是提高。例如，只需添加extrasaction='ignore'到您的DictWriter构造函数中，问题就会消失。

但实际上，你不应该那样做。raise在这里为您发现了一个合法的错误；它只是没有这样做，并带有非常有用的错误消息。

python - 添加到现有电子表格？

1 回答 1

Related

Reference