1

我的案例:丹麦名字的学生名单(名字包括字符为ü,æ,ø,å)。最小工作示例 CSV 文件:

Fornavn;Efternavn;Mobil;Adresse
Øjvind;Ørnenæb;87654321;Paradisæblevej 125, 5610 Åkirkeby
Süzette;Ågård;12345678;Ærøvej 123, 2000 Frederiksberg

浏览器内 Neo4j 编辑器:

$ LOAD CSV WITH HEADERS  FROM 'file:///path/to/file.csv' AS line FIELDTERMINATOR ";"
CREATE (:Elev {fornavn: line.Fornavn, efternavn: line.Efternavn, mobil: line.Mobilnr, adresse: line.Adresse})

导致注册如下: Neo4j browser screenshot,包含 ?-characters,其中需要丹麦语/德语字符。我的数据来自学习管理系统到 Excel。从 Excel 导出为 CSV 时,我可以控制文件编码作为另存为对话框的功能。我已经尝试在单独命名的文件中将 Excel 编码为“UTF-8”(Neo4j 手册说它想要)、“ISO-西欧”、“Windows-西欧”、“Unicode”,并FROM 'file:///path/to/file.csv'相应地调整了条款。

有趣的是,我在“另存为”时向 Excel 请求完全一样的虚假陈述结果,与哪种(明显的?)文件编码无关。将名称和地址直接复制粘贴到编辑器中时,我没有遇到同样的问题。

4

1 回答 1

1

在此处查看Michael Hunger 的博客文章,其中包含一些提示,即:

如果您使用非 ascii 字符(变音符号、重音符号等),请确保使用适当的语言环境或提供系统属性-Dfile.encoding=UTF8

于 2015-12-06T15:31:54.697 回答