11

我希望有人能指出正确的方向来学习如何从一堆文本中分离出动作。

假设我有这个文本

放下干洗衣服,去街角的商店买一罐牛奶,买一品脱草莓。
然后,去学校接孩子。首先,找到图书馆隔壁托儿所的约翰,然后找到两个街区外的山姆。
当你有了孩子时,你需要到医生办公室停下来接受处方。蒂姆的航班下午 4 点到达。
这是美国航空公司的 331 航班从达拉斯抵达。快到高峰时间了,所以一定要给自己留足够的时间。

我正在尝试将其拆分为

放下干洗,
然后去街角的商店买一罐牛奶,买一品脱草莓。
然后,去学校接孩子。首先,找到图书馆隔壁托儿所的约翰,然后找到两个街区外的山姆。 
当你有了孩子时,你需要到医生办公室停下来接受处方。
蒂姆的航班下午 4 点到达。
这是美国航空公司的 331 航班从达拉斯抵达。快到高峰时间了,所以一定要给自己留足够的时间。

我无法在我的搜索中找到任何具体基于操作的内容。它需要比仅仅挑选动词更聪明,因为有时会有多个动词与一个动作相关联,例如第二个项目有“go”、“pick-up”和“get”,但这只是一部分的单一动作。当然,“Tim's flight”只是暗示带有现在分词的动作,动词出现在片段的末尾。

关于在哪里寻找做这种事情的任何建议?需要注意的事项,推荐的阅读材料等。

4

2 回答 2

5

简单的方法:使用[您最喜欢的解析器]解析文本,然后选择SBAR具有祈使语气的句子或短语。斯坦福解析器恰好在其最新版本中具有“改进的命令识别” 。

除了标准解析器程序中已经包含的内容之外,可能不需要机器学习。

于 2011-11-18T14:45:27.827 回答
0

这个域称为信息提取

句子理解的一般方法是:

  • 提取词性标记的解析树(Python spaCy.io、nltk、CoreNLP 等)
  • 提取一个词向量(例如 word2vec)
于 2016-10-12T20:04:43.403 回答