2

我想知道 WordNet 中单词之间的层次关系是如何检索的。

是手动完成的还是通过计算机技术完成的。

如果基于计算机技术,它们是什么?

4

1 回答 1

5

从常见问题解答:

q.1.2 你从哪里得到 WordNet 的定义?(简短回答)我们的词典编纂者编写它们。

您从哪里获得 WordNet 的定义?(长答案)从 WordNet 的前言:电子词汇数据库,pp. xviii-xix:

人们有时会问:“你从哪里得到你的话?” 我们从 1985 年开始使用 Kučera 和 Francis 的现代编辑英语标准语料库(众所周知的布朗语料库)中的单词,主要是因为它们为不同的词性提供了频率。当 Henry Kučera 警告我们说,尽管他和 Francis 拥有布朗语料库,句法标记数据已被出售给 Houghton Mifflin 时,我们很好地进入了该列表。因此,我们放弃了使用它们的频率计数的计划(1988 年,Richard Beckwith 开发了一个我们使用的多义词索引)。我们还整合了查尔斯·奥斯古德用来发展语义差异的所有形容词对。由于同义词对我们至关重要,我们在各种词库中查找单词:例如,Laurence Urdang 的小“同义词和反义词基础书”(1978 年),Urdang 对 Rodale 的“同义词查找器”(1978 年)的修订,以及罗伯特·查普曼的第 4 版“Roget 的国际词库”(1977 年)——在这些作品中,一个词迅速引向他人。1986 年末,我们收到了一份由 Fred Chang 在海军人员研究与发展中心编制的词汇表,我们将其与我们自己的词汇表进行了比较;我们很失望地发现只有 15% 的重叠。1986 年末,我们收到了一份由 Fred Chang 在海军人员研究与发展中心编制的词汇表,我们将其与我们自己的词汇表进行了比较;我们很失望地发现只有 15% 的重叠。1986 年末,我们收到了一份由 Fred Chang 在海军人员研究与发展中心编制的词汇表,我们将其与我们自己的词汇表进行了比较;我们很失望地发现只有 15% 的重叠。

因此,张的名单成为输入。1993 年,我们获得了纽约大学的拉尔夫·格里什曼 (Ralph Grishman) 和他的同事在他们的常用词典 COMLEX 中收录的 39,143 个单词的列表;这一次我们对 WordNet 只包含 74% 的 COMLEX 词感到失望。但该列表也成为输入。简而言之,有多种来源做出了贡献;我们在建立词汇量方面没有得到很好的训练。事实是英语词典非常庞大,我们很幸运,我们的赞助商在我们慢慢爬上山的过程中对我们有耐心。

于 2011-10-16T23:58:03.633 回答