python - 使用analyzer.py有困难，返回KeyError: ';;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;\n'

Question

这是我的代码的样子：

import nltk

class Analyzer():

    def __init__(self, positives, negatives):
        self.positives = set()
        self.negatives = set()

        file = open(positives, "r")
        for line in file:
            self.positives.add(line.strip("\n"))
            if line.startswith(";"):
                self.positives.remove(line)
        file.close()

        file1 = open(negatives, "r")
        for line in file1:
            self.negatives.add(line.strip("\n"))
            if line.startswith(";"):
                self.negatives.remove(line)
        file1.close()

    def analyze(self, text):
        with open("text") as texts:
            for lines in texts:
                # Get a list of words from the lines in text.
                tokens = [self.tokenizer.tokenize(lines)]
                # All the words in postive-words and negative-words are lowercased.
                if tokens.lower() in self.positives:
                    return 1
                elif tokens.lower() in self.negatives:
                    return -1
                else:
                    return 0

不幸的是，这似乎不起作用，无论我如何改变代码行，我一直得到：

Traceback (most recent call last):
  File "./smile", line 32, in <module>
    main()
  File "./smile", line 20, in main
    analyzer = Analyzer(positives, negatives)
  File "/home/ubuntu/workspace/pset6/sentiments/analyzer.py", line 13, in __init__
    self.positives.remove(line)
KeyError: ';;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;\n'

我可以提示我做错了什么吗？真的很感激一些提示！谢谢！

score 0 · Accepted Answer

问题是您试图从集合中删除不存在的项目。您正在添加line.strip("\n")到集合中，但随后尝试line从同一集合中删除。为确保您始终删除集合中实际存在的内容，您可以执行以下操作：

entry = line.strip("\n")
self.positives.add(entry)
if line.startswith(";"):
    self.positives.remove(entry)

在上面的代码中，您永远不会意外尝试删除字典中不存在的内容。您在处理时也必须进行类似的更改self.negatives，但这应该不会太难。

或者，如果您要通过重新排列到以下内容来删除它，您可以简单地不向集合中添加条目：

if not line.startswith(";"):
  self.positives.add(line.strip("\n"))

python - 使用analyzer.py有困难，返回KeyError: ';;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;; ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;\n'

1 回答 1

Related

Reference