我正在使用 Graphchi 的 pagerank 示例:https ://github.com/GraphChi/graphchi-cpp/wiki/Example-Apps#pagerank-easy
示例应用程序编写了一个包含顶点信息的二进制文件,我想将其读取/转换为计划文本文件(以便稍后调用 R 或其他语言)。
该文件指出:
“GraphChi 会将边的值写入二进制文件中,这在其他程序中很容易处理。包含顶点值的文件的名称是 GRAPH-NAME.4B.vout。这里的“4B”指的是顶点值一个 4 字节类型(浮点数)。”
“易于处理”的部分是我正在努力解决的问题 - 我有高级语言的经验,但没有 C++ 或处理二进制文件。我通过搜索 stackoverflow 找到了一些东西,但在阅读这个文件时还没有运气。理想情况下,这将通过 bash 或 python 完成。
非常感谢您对此的帮助。
更新:hexdump graph-name.4B.vout | head -5
给出:
0000000 999a 3e19 7468 3e7f 7d2a 3e93 d8e0 3ec4
0000010 cec6 3fe4 d551 3f08 eff2 3e54 999a 3e19
0000020 999a 3e19 3690 3e8c 0080 3f38 9ea3 3ef5
0000030 b7d6 3f66 999a 3e19 10e3 3ee1 400c 400d
0000040 a3df 3e7c 999a 3e19 979c 3e91 5230 3f18