Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
给定一个自由文本,我需要分析这个文本并从预先存在的列表中建议一个标签列表。 市场上有哪些算法?他们能处理这样的情况吗,例如,文本有一个词
高胆固醇
我想要它,所以建议
心脏疾病
尽管“高胆固醇”可能(最初)不存在于预定义列表中。
有相关主题和标签推荐的预先存在的数据库和插件 - 查看其中一些:
自动标签 (js)
雅虎术语提取器
OpenCalais
还有很多用于自动完成/建议的服务。您还可以考虑查询 Twitter // 其他一些社交媒体的 API,以根据文本查找标签。
听起来您需要关键字(自由文本)和标签列表之间的多对多关系。这样,您可以强制执行所有正确的关联。
如果没有人首先在数据库中定义关系,计算机本身就不会聪明到知道这一点high cholesterol并且heart disease是相关的。
high cholesterol
heart disease
看看这篇文章:
http://en.wikipedia.org/wiki/Association_rule_learning
也许它有帮助