我正在寻找一个进行文本分析和提取实体的库。
实体的类型/分类并不重要,重要的是确定有价值的东西。在这种情况下,实体宇宙是无限的,它不受固定字典的限制。
似乎有几个网络服务可以做到这一点(NERD 让您比较这些网络服务的结果:http: //nerd.eurecom.fr/documentation非常有用),但我正在寻找本地图书馆而不是远程托管服务。我更喜欢 Java 或 .NET,但如果它是一个好的库,我会学习它所用的任何语言。
关于类似主题的旧线程很少,我希望在这个领域找到新的发展,和/或建立在较低级别的 NLP 库之上的库:
- 在提供 Lucene 索引时使用免费工具进行实体提取/识别
- Lucene 实体提取
- 如何在 Lucene 中进行实体提取
- https://stackoverflow.com/questions/tagged/named-entity-extraction
- https://stackoverflow.com/questions/tagged/named-entity-recognition
有谁知道一个做得不错的图书馆?