我的案例:丹麦名字的学生名单(名字包括字符为ü,æ,ø,å)。最小工作示例 CSV 文件:
Fornavn;Efternavn;Mobil;Adresse
Øjvind;Ørnenæb;87654321;Paradisæblevej 125, 5610 Åkirkeby
Süzette;Ågård;12345678;Ærøvej 123, 2000 Frederiksberg
浏览器内 Neo4j 编辑器:
$ LOAD CSV WITH HEADERS FROM 'file:///path/to/file.csv' AS line FIELDTERMINATOR ";"
CREATE (:Elev {fornavn: line.Fornavn, efternavn: line.Efternavn, mobil: line.Mobilnr, adresse: line.Adresse})
导致注册如下:
Neo4j browser screenshot,包含 ?-characters,其中需要丹麦语/德语字符。我的数据来自学习管理系统到 Excel。从 Excel 导出为 CSV 时,我可以控制文件编码作为另存为对话框的功能。我已经尝试在单独命名的文件中将 Excel 编码为“UTF-8”(Neo4j 手册说它想要)、“ISO-西欧”、“Windows-西欧”、“Unicode”,并FROM 'file:///path/to/file.csv'
相应地调整了条款。
有趣的是,我在“另存为”时向 Excel 请求完全一样的虚假陈述结果,与哪种(明显的?)文件编码无关。将名称和地址直接复制粘贴到编辑器中时,我没有遇到同样的问题。