我正在尝试根据感兴趣的单词的子集来计算单词在 dict 列中存在的次数。
首先我导入我的数据
products = graphlab.SFrame('amazon_baby.gl/')
products['word_count'] = graphlab.text_analytics.count_words(products['review'])
products.head(5)
数据可以在这里找到:https ://drive.google.com/open?id=0BzbhZp-qIglxM3VSVWRsVFRhTWc
然后我创建我感兴趣的单词列表:
words = ['awesome', 'great', 'fantastic']
我想计算“单词”中每个单词在产品中出现的次数['word_count']。
我不喜欢使用graphlab。只是同事向我推荐的。