您如何使用 NLP/信息提取 (IE) 方法检测/找出首字母缩写词的含义(扩展名)?
我们希望在自由文本中检测是否使用了单词或其首字母缩写词并将其映射到相同的实体/标记。
大多数在线可用的论文都是关于医学首字母缩略词的,它们没有提供完成这项任务的库。
有任何想法吗?
您如何使用 NLP/信息提取 (IE) 方法检测/找出首字母缩写词的含义(扩展名)?
我们希望在自由文本中检测是否使用了单词或其首字母缩写词并将其映射到相同的实体/标记。
大多数在线可用的论文都是关于医学首字母缩略词的,它们没有提供完成这项任务的库。
有任何想法吗?
阅读您的问题和评论,我了解您想要创建从首字母缩写词到其扩展名的映射。
假设您有一个文本文档集合,其中出现了首字母缩写词及其扩展,您可以应用算法来提取(首字母缩写词,扩展名)对。
AS Schwartz 和 MA Hearst提出的用于识别生物医学文本中缩写定义的简单算法,正是通过查看模式来实现的。Java 实现可在此处获得。
Wordnet 包含大量单词的首字母缩写词,您可以在各种编程语言中使用它们:http ://wordnet.princeton.edu/wordnet/
或者从 Freebase 获取。请参阅:使用网络查找相关名称的一种方法是什么?