1

我需要将一些高度连接的数据从 SQL Server 批量导入 Neo4j 进行分析。

Neo4j 开发人员指南中有 2 个链接讨论了这一点:

我第一次尝试从 SQL Server 导入和导出向导生成的 CSV 文件中导入数据,但未能将表中的列加载到节点属性中。

有谁知道配置 SSIS 包以生成符合上面链接中列出的 Neo4j 要求的 CSV 导出的指南?

4

1 回答 1

2

我没有指导您的指南,但我可以为您指出正确的方向来自己解决这个问题:

  • 不要使用导入导出向导——这对您配置平面文件目标的能力非常有限,并且不允许您修复管道中的数据
  • 听起来他们想要一个标题行。这意味着您需要确保数据中的第一行就是那个。这可以使用 UNION 来完成,例如,如果您的数据来自 SQL。IE

    SELECT 'Column1' as Column1
         , 'Column2' as Column2 
    UNION 
    SELECT <actual data from my table>
    
  • 通过选中“第一个数据行中的列名”将平面文件连接管理器配置为具有标题行

  • 您可以使用派生列或脚本任务在文本中的特殊字符或引号周围加上引号:

     - "Special character in non-quoted text ← make sure unusual text is always quoted"
     - "stray quotes – standalone double or single quote in the middle 
    of non-quoted text, or non-escaped quotes in quoted text ← escape 
    or remove stray quotes"
    

根据链接中的建议,您可以使用 CSVkit 或 Papa Parse 检查最终 CSV 文件中的问题,然后再尝试将其上传到 neo4j。通常,这些数据质量问题是特定于您的领域的,一旦解决了少数问题,就不需要进一步的关注和补充。

于 2015-02-10T13:46:17.820 回答