我正在使用 Textblob 处理文本数据。
我的代码是:
from textblob import TextBlob
wiki = TextBlob("Python is a high-level, general-purpose programming language.")
wiki.tags
我得到的输出为:
[(u'Python', u'NNP'), (u'is', u'VBZ'), (u'a', u'DT'), (u'high-level', u'JJ'), (u'general-purpose', u'JJ'), (u'programming', u'NN'), (u'language', u'NN')]
代替:
[('Python', 'NNP'), ('is', 'VBZ'), ('a', 'DT'), ('high-level', 'JJ'), ('general-purpose', 'JJ'), ('programming', 'NN'), ('language', 'NN')]
每个单词前面都加上字母“u”的原因可能是什么?
我正在使用 Python 2.7.6 版本开发 Ubuntu 14.04.2。