我正在将一些 RDF 转储导入 Virtuoso 开源版本 (6.x)。我想知道导入相同数据的不同序列化之间是否存在性能差异(我有 NT/N3/XML 可用)。
虽然我在这里:在单个磁盘上使用条带化时,有人看到导入性能差异吗?
专门针对 Virtuoso 的问题通常最好在公共 OpenLink 讨论论坛、Virtuoso 用户邮件列表或通过机密支持案例提出。
也就是说,导入时会有一些性能差异,随着负载大小的增加,这种差异会变得更加明显。
RDF/XML 几乎总是相对较慢——因为必须先解析整个 XML 树,然后才能将任何三元组写入图形存储。
NT 省略了许多必须在 N3 中处理的语法糖,因此 NT可能是加载速度最快的。但是,N3 文件通常会比相同数据集的 NT 小(有时明显小),这在某些情况下可能是一个重要的考虑因素......
底线——这个问题充满了细微差别,没有普遍正确的答案。
这里的每篇文章都应该只涉及一个问题,但我还要说——条带化通常不会在单个设备(无论是 HDD 还是 SSD)上带来太多好处。当在多个设备上拆分存储时,此功能可提供最大的性能优势,每个设备都在自己的控制器上,等等。