0

我有两个字符串 -

"I like running around the track.

I like swimming in the pool, but only in the morning.

我需要从以上两条评论(running around the trackswimming in the pool.

有没有人推荐文本分析 gem 或其他获取此类信息的方法?我不一定需要字数或 n-gram,我只想知道与单词“ like”相关的单词。

4

2 回答 2

0

为了快速而肮脏的修复,您可以使用正则表达式搜索“like”的所有形式,并提取那里与标点符号或换行符之间的所有文本。

于 2013-10-14T21:09:05.907 回答
0

您可以使用依赖解析器(例如斯坦福解析器 )来解析您的文本并在您的情感词典中找到关键词,并且可能对依赖类型设置一些限制以消除歧义。例如,依赖项需要是“dobj”(直接对象)类型。然后根据您的需要遵循依赖结构到短语或句子的末尾。

于 2013-10-23T18:37:02.003 回答