0

我需要以下代码的帮助,到处都是“您的代码”。任何帮助表示赞赏。谢谢!

#使用词典创建两个词典特征。一个特征“POSLEX”,它的值表示有多少令牌属于正词典。一个特征“NEGLEX”,其值表示有多少令牌属于负词典。

 def two_lexicon_features(tokens):
    feats = {'POSLEX': 0, 'NEGLEX': 0}
    # YOUR CODE HERE

 return feats

#如果正词典中的单词(例如'like')在文档中出现N次(例如5次),则为与该值相关联的单词添加正词典特征'POSLEX_word'(例如{'POSLEX_like':5 }. 类似地,如果否定词典中的一个词(例如'dislike')在文档中出现 N 次(例如 5 次),则为与该值相关联的那个词添加一个否定词典特征 'NEGLEX_word'(例如 {'NEGLEX_dislike ':5}

def lexicon_features(tokens):
  feats = {}
  # YOUR CODE HERE
  # Assume the positive and negative lexicons are available in poslex and neglex, respectively.

return feats

#添加一个特征'DOC_LEN',其值为文档长度的自然对数(使用math.log计算对数)

import math
def len_feature(tokens):
   feat = {'DOC_LEN': 'YOUR CODE HERE'}

return feat

#添加一个特征'DEICTIC_COUNT',计算文档中第一和第二人称代词的数量。

def deictic_feature(tokens):
   pronouns = set(('i', 'my', 'me', 'we', 'us', 'our', 'you', 'your'))
   count = 0
   # YOUR CODE HERE

return {'DEICTIC_COUNT': count}
4

0 回答 0