我正在运行crawler4j,输出到目录/frontier/
。该目录下的文件是
- 00000000.jdb
- je.info.0
- je.info.lck
- 杰尔克
.jdb 文件是唯一包含数据的文件,其他三个文件的字节数为零。我不确定如何处理这些数据。java 程序捕获了我想要的数据,但现在我不知道如何浏览我检索到的数据。(我在 Mac 上,所以任何跨平台或用于 OSX 的东西都是可取的)
我查看了 crawler4j 的源代码,它看起来像是在使用 Berkeley DB。有关如何访问这些文件的详细信息,请搜索 StackOverflow。