1

我正在尝试从 xlsx 文件创建一个 kml,但是当 xlsx 包含 utf-8 时它不起作用。

我看到了 simplekml 文档,它被标记为已解决,但我无法让它工作。

我尝试将编码设置为 ascii,也使用了 django 的 smart_str 和 smart_unicode,但直到现在都没有任何效果。

我正在使用 openpyxl 读取文件

def create_kml(input_file,sheet_name,output_file,lat_column = 0,lng_column = 1):

    kml = simplekml.Kml()
    wb_read = load_workbook(input_file)
    sh = wb_read.get_sheet_by_name(sheet_name)

    properties = []
    for c in sh.rows[0]:
        properties.append(c.value.encode('utf-8'))

    for p,row in enumerate(sh.rows[1:]):
        for k,c in enumerate(row):
            if k==0:
                coord_tuple = (row[lng_column].value,row[lat_column].value)
                pnt = kml.newpoint(name = 'Point %s' % p, coords =[coord_tuple])
            #TODO: It's not working with unicode and utf-8
            if k != lat_column and k != lng_column:
                if type(row[k].value) == unicode or type(row[k].value) == str:
                    pnt.extendeddata.newdata(properties[k],row[k].value.encode('utf-8'))

    kml.save(output_file)

追溯:

    Traceback (most recent call last):
    File "<console>", line 1, in <module>
    File "C:/Users/Fernando Alves/Dropbox/Projetos/utils.py", line 296, in create_kml
    kml.save(output_file)
    File "C:\Python27\lib\site-packages\simplekml\kml.py", line 285, in save
    out = self._genkml(format)
    File "C:\Python27\lib\site-packages\simplekml\kml.py", line 198, in _genkml
    kml_str = self._feature.__str__()
    File "C:\Python27\lib\site-packages\simplekml\featgeom.py", line 418, in __str__
    buf.append(feat.__str__())
    File "C:\Python27\lib\site-packages\simplekml\featgeom.py", line 414, in __str__
    buf.append(super(Feature, self).__str__())
    File "C:\Python27\lib\site-packages\simplekml\base.py", line 54, in __str__
    buf.append(u("<{0}>{1}</{0}>").format(var, val))  # Enclose the variable's __str__ with its name
    UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 33: ordinal not in range(128)
4

2 回答 2

1

我自己正在处理这个问题,但它发生在一些制表符分隔的数据中,我使用 simplekml 在 KML 中构建地标。问题的主要原因是所谓的制表符分隔文本包含一些高位字符。在解析它们时,它们会被复制到地标的描述字段中。当我保存 KML 文件时,会发生此错误。

两年前在 simplekml 问题论坛中讨论了这个问题: http ://code.google.com/p/simplekml/issues/detail?id=10

有趣的是,那里描述为接受发布的解决方案(响应 #6)不在通过 pip 提供的当前版本的 simplekml 中。此外,当我在本地应用补丁时,它没有任何区别。base.py 中出现相同的 unicode 解码错误。

我可以通过在 simplekml 分配和方法中使用它之前添加代码来过滤制表符分隔的文本来解决我的特定问题。总而言之,simplekml 要求其字符串中包含与 ascii 兼容的文本字符。

于 2013-10-16T14:11:53.993 回答
1

我找到了解决方案,尽管您必须更改 simplekml 库...

这些是您要更改的文件:

/usr/local/lib/python2.7/dist-packages/simplekml/base.py
/usr/local/lib/python2.7/dist-packages/simplekml/kml

/usr/local/lib/python2.7/dist-packages/simplekml/base.py

  • 在第一个文件中,您必须删除函数u的每次出现。它存在于行中:46、54、257、259

/usr/local/lib/python2.7/dist-packages/simplekml/kml

  • 在第二个文件中,您必须将第209 行从 this: 更改kml_str = xml.dom.minidom.parseString(xml_str.encode("utf-8")) 为: kml_str = xml.dom.minidom.parseString(xml_str)

  • 您还必须删除函数u的每次出现。


如果问题仍然存在,请按照调试器删除函数u的每次出现,它应该可以正常工作!

我尝试更改u功能,但没有成功...如果您找到解决方案,请告诉我们!

于 2015-06-05T10:02:28.743 回答