0

是否有可能在 wordnet 或任何其他方式中知道最常用的词义。例如,“商品”一词可能更多地用于表示善意而不是“产品”。或者“钥匙”这个词更多地用于指代真正的钥匙而不是“解决方案”。例如,这个问题的关键是......

有这样的吗??

4

1 回答 1

0

词频有几个问题。表面词频只会告诉你一个词在语料库中出现的次数。

然而,要找到一个感知频率,它仍然是一个未标记语料库的未解决问题。(即在某个上下文中,一个词多少次指代某种意义?)。现在最好的办法是:

  1. 计算一个有感觉标签的语料库的感觉频率,然后假设未标记的语料库上的感觉频率是相似的或
  2. 使用 Word Sense Disambiguation 软件标记未标记的语料库,然后计算标记产品的感觉频率。然而,这是一种复杂的方法,因为大多数 WSD 软件仅使用已标记语料库中的最常见含义 (MFS) 即可。
于 2013-04-01T07:40:52.883 回答