0

我的目标是构建一个自动化的知识图谱。我决定使用 Neo4j 作为我的数据库。我打算将一个 json 文件从我的本地目录加载到 Neo4j。我将使用的数据是 yelp 数据集(json 文件非常大)。

我看过一些带有 Graphaware 和 OpenNLP 的 Neo4j 示例。我读到 Neo4j 对 JAVA 应用程序有很好的支持。我还读到 Neoj 支持 python(我打算使用 nltk)。是否建议将 Neo4j 与 JAVA maven/gradle 和 OpenNLP 一起使用?或者我应该将它与带有 nltk 的 py2neo 一起使用。

我真的很抱歉我之前没有使用这些工具的任何经验。任何意见或建议将不胜感激。太感谢了!

4

1 回答 1

0

欢迎来到堆栈溢出!不幸的是,这个问题是一个建议/意见问题,因此不适合这个论坛。

然而,这是我工作过的一个领域,所以我可以自信地说 Java(或 Kotlin)是 Neo 的最佳选择。原因是,它是 Neo 的母语,社区对可用的问题和库的支持要多得多。

但是,NLTK 比 OpenNLP 强大得多。因此,如果您的用例对于 OpenNLP 来说足够简单,那么纯 Java/Kotlin 是一种完美的方法。或者,您可以使用 java 作为存储图的接口层,但使用带有 NLTK 的 python 将语言工作输入到图中。当然,这会显着增加项目的复杂性。

最终,最佳方法取决于您的确切用例以及哪些权衡对您最有意义。

于 2019-09-10T19:54:50.383 回答