我对自然语言处理领域非常陌生。我唯一的经验是使用斯坦福 nlp 来获取句子的词性。
问题:我必须找出一组产品反馈中给出的前 10 条建议。
输入:它由大约一百个反馈组成,作为对某些产品的建议。
我无法弄清楚我应该从哪里开始工作。我应该在什么基础上创建前 10 条建议?
我对自然语言处理领域非常陌生。我唯一的经验是使用斯坦福 nlp 来获取句子的词性。
问题:我必须找出一组产品反馈中给出的前 10 条建议。
输入:它由大约一百个反馈组成,作为对某些产品的建议。
我无法弄清楚我应该从哪里开始工作。我应该在什么基础上创建前 10 条建议?
当您说您有一组反馈时,如果有任何分隔符字符串或涉及的内容,那么您可以使用正则表达式来分隔不同的反馈..您可以参考此链接
https://sites.google.com/site/gothnlp/links/regular-expressions
http://docs.python.org/2/library/re.html
如果分隔符类似于提交反馈的人的姓名,那么您可以查看名为命名实体识别的概念,它可以分隔人名。
如果您可以使用 NLTk 工具包,那么我建议您使用它。
http://www.slideshare.net/japerk/nltk-in-20-minutes
这是可以提供帮助的链接
这个博客也可以帮助你