0

我想将数据加载到titanDB,我知道批量加载和gremlin脚本会这样做,但我想使用spark做同样的事情。我有 json 格式的数据,我想使用 spark 加载它。他们在 Titan 0.9 和 1.0.0 中将 spark 与 Titan 集成在一起。但是使用 SparkGraphComputer 我可以从 Titan 读取数据但我想做相反的事情,我想使用 spark 将数据写入 Titan

参考资料 http://tinkerpop.apache.org/docs/3.1.0-incubating/#sparkgraphcomputer

https://groups.google.com/forum/#!topic/aureliusgraphs/DGwJnpdHPmU

4

1 回答 1

3

您需要使用 TinkerPop 的BulkLoaderVertexProgram

http://s3.thinkaurelius.com/docs/titan/1.0.0/titan-hadoop-tp3.html

您可以在此 Titan 数据迁移示例存储库中查看其工作原理的一些示例:

https://github.com/dkuppitz/openflights

以及通过 CSV 加载数据的示例:

https://groups.google.com/forum/#!msg/gremlin-users/AetuGcLiBxo/KW966WAyAQAJ

于 2016-05-10T10:26:28.440 回答