0

我写了一个阅读文章和自学AI的代码。首先,我阅读带有 URL 的文章并下载它。然后我解析文章并将其用于我的 AI 学习文本。但是现在我想从 txt 文件中读取文本。如何将 txt 文件的文本分配给 Article 对象?(请检查代码以清除我的愿望)谢谢大家。

article = Article('URL for article')
article.download()
article.parse()
article.nlp()
corpus = article.text

text= corpus
sentence_list = nltk.sent_tokenize(text)

PS:我想使用 txt 文件而不是 URL。但我不会从代码中删除文章,因为它再次是必要的。

4

1 回答 1

0

我尝试了很多选项,但唯一的方法是不使用文章。所以我删除文章部分并像这样进行更改:

f = open("visp.txt", "r",encoding="utf8")

#article = Article('visp.txt')
#article.download()
#article.parse()
#article.nlp()
#corpus = article.text


f = open("demo.txt", "r",encoding="utf8")
corpus = f.read()
print(corpus)

PS:打开.txt文件时不要忘记编码。

于 2020-06-18T12:45:17.037 回答