我有两个字符串 -
"I like running around the track.
I like swimming in the pool, but only in the morning.
我需要从以上两条评论(running around the track
和swimming in the pool
.
有没有人推荐文本分析 gem 或其他获取此类信息的方法?我不一定需要字数或 n-gram,我只想知道与单词“ like
”相关的单词。
我有两个字符串 -
"I like running around the track.
I like swimming in the pool, but only in the morning.
我需要从以上两条评论(running around the track
和swimming in the pool
.
有没有人推荐文本分析 gem 或其他获取此类信息的方法?我不一定需要字数或 n-gram,我只想知道与单词“ like
”相关的单词。
为了快速而肮脏的修复,您可以使用正则表达式搜索“like”的所有形式,并提取那里与标点符号或换行符之间的所有文本。
您可以使用依赖解析器(例如斯坦福解析器 )来解析您的文本并在您的情感词典中找到关键词,并且可能对依赖类型设置一些限制以消除歧义。例如,依赖项需要是“dobj”(直接对象)类型。然后根据您的需要遵循依赖结构到短语或句子的末尾。