我想开发一个基于 Java 的应用程序来将同义词映射到唯一的代码或单词。例如,在医学术语中,单词 heart attack
或 cardiac arrest
等表示相同的东西。所以我想建立一个数据库(不需要是一个 RDBMS)来存储这样的映射。以后必须添加/修改或删除此类映射。
主要目标是开发一个应用程序以在语义上将实体映射在一起。
我的输入就像一个两三个词的短语,它会被映射到一个标准代码。例如心脏病发作和心脏骤停映射到疾病代码HA50122445。明天,如果我发现一个新短语说myo heart crazy ,我想将其映射到代码HA50122445
我查看了Apache Lucene,但它是用于文本挖掘,基于搜索关键字的优先级。我的要求有点类似于Wordnet。Wordnet 数据库是否可编辑或可修改?我的研究说不。这样对吗 ?
如果您能指导我,那将非常有帮助。谢谢