我正在尝试处理具有数亿个节点的超大规模 NetworkX Graph 对象。我希望能够将其写入文件,以免占用我所有的计算机内存。但是,我需要不断地搜索现有节点、更新边缘等。
有没有好的解决方案?我不确定它如何与http://networkx.lanl.gov/reference/readwrite.html上提供的任何文件格式一起使用
我能想到的唯一解决方案是将每个节点存储为一个单独的文件,并引用文件系统中的其他节点 - 这样,打开一个节点进行检查不会使内存过载。是否有用于大量数据(例如 PyTables)的现有文件系统来执行此操作而无需编写我自己的样板代码?