我使用 DSE Graph Loader 从 Hadoop 分布式文件系统读取输入文件。
我想以分布式方式将数据插入 dse 图集群(在多台机器上)。如何完成?
我使用 DSE Graph Loader 从 Hadoop 分布式文件系统读取输入文件。
我想以分布式方式将数据插入 dse 图集群(在多台机器上)。如何完成?
DSE Graph Loader 是一个命令行实用程序,支持从多种来源加载数据,包括 CSV、文本、JSON、Gryo、HDFS 和 AWS S3 来源。它不能作为 Hadoop/Spark 作业运行。
要使用多个线程并行化注入,请配置参数load_threads(默认为 1)。可以在此处找到文档:配置 DSE 图形加载器