问题标签 [textblob]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
740 浏览

python - 使用 textblob ngrams 保留收缩

有没有办法告诉#textblob在创建 ngram 时不要将缩略词拆分let'slet& ?'s我知道它们在技术上是两个独立的词,但我想将它们保持为一个词。

0 投票
0 回答
62 浏览

python - 在解析像“gonna”这样的收缩时,这是 Python 中 TextBlob 库中的错误吗?

我正在尝试使用 TextBlob 库从文本中提取信息。我偶然发现了这个错误,这给我带来了很多问题。请告诉我为什么会发生这种情况,有什么办法可以避免它,否则我将不得不忽略文本中的这些词并继续前进。

“想要”、“让我们”等词也会出现同样的问题。

0 投票
7 回答
12884 浏览

python - python.无法导入名称'TextBlob'

我试图将 TextBlob 导入 Python。

当我直接在 shell 中运行命令时,它运行良好: from textblob import TextBlob

但是,当我将它放入 py 文件并运行它时,它不再起作用了,它说:

请帮帮我,现在很绝望......非常感谢

0 投票
1 回答
334 浏览

python-2.7 - 如何从流中解码 ascii 以进行分析

我正在尝试通过 textblob 库中的情绪分析从 twitter api 运行文本,当我运行我的代码时,代码会打印一个或两个情绪值,然后出错,出现以下错误:

如果仅分析文本,我不明白为什么这是代码要处理的问题。我试图将脚本编码为 UTF-8。这是代码:

有人可以帮我解决这个问题吗?

先感谢您。

0 投票
1 回答
116 浏览

python - 'u' 被添加到 TextBlob 中的所有文本之前

我正在使用 Textblob 处理文本数据。

我的代码是:

我得到的输出为:

代替:

每个单词前面都加上字母“u”的原因可能是什么?

我正在使用 Python 2.7.6 版本开发 Ubuntu 14.04.2。

0 投票
2 回答
621 浏览

python - TextBlob 未在 Pandas 数据框中返回正确数量的字符串实例

对于我实验室的一个项目,我正在分析 Twitter 数据。我们捕获的推文中都有“性”一词,这是我们过滤 TwitterStreamer 以捕获的关键字。

我将所有推文数据(json 元标记)都存放在 pandas 数据库中的 CSV 进行了转换,并保存了“文本”列以隔离推文文本。

输出正确的输出:

但是,当我尝试这个

我的输出是22.

“sex”一词的出现次数应该至少与 CSV 中的行数一样多,而且可能更多。我无法弄清楚这里发生了什么。TextBlob 是否没有围绕 dtype:object 进行配置?

0 投票
2 回答
442 浏览

arrays - Textblob 词标记化为数组

打印出来的结果是:

[WordList(['i', 'have', 'a', 'bunch', 'of', 'grapes']), WordList(['i', 'like', 'to', 'eat', '苹果']), WordList(['this', 'is', 'a', 'laptop'])]

我如何从 WordList 中提取,以便我的 array2 将打印为:

[['i', 'have', 'a', 'bunch', 'of', 'grapes'],['i', 'like', 'to', 'eat', 'apple'],[ “这是一台笔记本电脑”]]

0 投票
2 回答
513 浏览

python - 使用 NLTK 在文本中查找原因

对于我的工作项目,我的任务是浏览一堆用户生成的文本,其中一些文本是取消他们的互联网服务的原因,以及该原因发生的频率。可能是他们正在搬家,只是不喜欢它,或者服务不好等。

虽然这可能不一定是 Python 问题,但我想知道是否可以通过某种方式使用 NLTK 或 Textblob 来确定取消的原因。我非常怀疑对于这样一个专门的任务是否有任何自动化的东西,我意识到我可能必须建立一个神经网络,但任何关于如何解决这个问题的建议都将不胜感激。

这是我到目前为止所考虑的:1)使用词干和标记化并统计最常见的单词。方法简单,不准确。2) n-gram。计算密集型,但可能会有一些希望。3)词性标注和分块,可能会找到跟在“因为”等连词后面的词。4) 手动浏览所有文本字段并记录取消原因。效率不高,违背了寻找某种算法的全部目的。5)NN,完全不知道,也不知道是否可行。

我真的很感激对此的任何建议。

0 投票
1 回答
2810 浏览

python-3.x - 在 Windows 上使用 Conda 安装 TextBlob

textblob 上的现有问题并没有谈论 conda,所以请尝试一个新问题。

我尝试加载/安装 TextBlob https://textblob.readthedocs.org/en/dev/install.html#with-conda

https://conda.binstar.org/sloria仅适用于 OSX

所以尝试了这个而不是https://binstar.org/sursma/textblob仍然没有多少运气

C:\Users\kumar\AppData\Local\Continuum\Anaconda3>conda install -c https://conda.binsta.org/sursma textblob 获取包元数据:...无法连接到https://conda.binsta。 org/sursma/noarch/ 无法连接到https://conda.binsta.org/sursma/win-64/ 错误:找不到 URL:https ://conda.binstar.org/sursma /win-64/

谢谢 !

0 投票
2 回答
556 浏览

python - 导出相关词TF-IDF TextBlob python

我按照本教程在我的文档中搜索相关单词。我的代码:

这是我的问题,我想导出一个包含以下信息的数据框:索引、10 个热门单词(用逗号分隔)。我可以用熊猫数据框保存的东西。例子:

谢谢大家。