4

有没有找到动词时间特征的算法?意味着它是“事件”、“成就”、“成就”还是“状态”?正如 Zeno Vendler 的论文“动词和时间”中所描述的那样?

http://semantics.uchicago.edu/kennedy/classes/s07/events/vendler57.pdf

或者,也许有人知道实现这种事情的最佳方法是什么?

谢谢!

4

1 回答 1

2

据我所知,如果不使用数据库,就无法做到这一点。然后,“算法”本身将是数据库结构和对其进行的查询的联合。

例如,一个关系数据库有一个英语单词表,每列两列:单词和一个或多个词性,是可以想象的最基本的语言处理数据库。更复杂的还有一个动词表,其中包含两列、单词和“时间特征”。

例如,单词“be”总是描述一种状态。因此,看到单词 be(或其变体:is、are、was 等)的程序可以立即识别该子句描述一种存在状态。显然,完成一词将立即表示成就,而“成就”将始终表示成就。但不要忘记,在您列出的四个类别中,只有“状态”和“事件”是互斥的(除了现在分词,例如句子“事件正在发生”中)。除此之外,状态也可以是成就或成就(“我是奥运金牌得主”),事件也可以是(“我明天毕业。”)。

成就和成就也是主观术语,取决于说话者和读者的感受。诸如“达到”、“完成”和“成功”之类的词是对成就感的刻意表达,因此总是可以归为此类。但是,这是先验信息,因此需要实现关系数据库。

最后,一些词的“时间特征”会随着句子中的其他词而改变。例如,在“我闻起来不错。”这句话中,“气味”是一个状态动词。在“我闻到培根”这句话中,它是一个动作动词。这些类型的动词是名词后跟的动作动词(及物动词),形容词后跟的状态动词(谓语主格),以及都不跟的动作动词(不及物动词)。因此,解析器必须检查句子中紧随其后的单词,一个名词或形容词,并从中识别动词在句子中的作用。这是数据库知道每个单词的词性之间的共同努力,

这只是对词法计算的简要概述,以及我对该主题的了解。它还有很多,显然,用单词及其词性、定义、角色等填充数据库是乏味的。可能存在预先填充了词典计算机科学家实施此类系统所需的信息的数据库(但我不声称知道在哪里可以找到它们)。

希望我有所帮助,祝你好运!

于 2012-06-27T00:07:52.690 回答