问题标签 [textblob]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

333 问题

0 投票

1 回答

740 浏览

python - 使用 textblob ngrams 保留收缩

有没有办法告诉#textblob在创建 ngram 时不要将缩略词拆分let's为let& ？'s我知道它们在技术上是两个独立的词，但我想将它们保持为一个词。

2015-05-30T19:23:13.137

0 投票

0 回答

62 浏览

python - 在解析像“gonna”这样的收缩时，这是 Python 中 TextBlob 库中的错误吗？

我正在尝试使用 TextBlob 库从文本中提取信息。我偶然发现了这个错误，这给我带来了很多问题。请告诉我为什么会发生这种情况，有什么办法可以避免它，否则我将不得不忽略文本中的这些词并继续前进。

“想要”、“让我们”等词也会出现同样的问题。

python textblob

2015-06-08T11:36:04.220

0 投票

7 回答

12884 浏览

python - python.无法导入名称'TextBlob'

我试图将 TextBlob 导入 Python。

当我直接在 shell 中运行命令时，它运行良好： from textblob import TextBlob

但是，当我将它放入 py 文件并运行它时，它不再起作用了，它说：

请帮帮我，现在很绝望......非常感谢

python textblob

2015-06-10T17:04:57.653

0 投票

1 回答

334 浏览

python-2.7 - 如何从流中解码 ascii 以进行分析

我正在尝试通过 textblob 库中的情绪分析从 twitter api 运行文本，当我运行我的代码时，代码会打印一个或两个情绪值，然后出错，出现以下错误：

如果仅分析文本，我不明白为什么这是代码要处理的问题。我试图将脚本编码为 UTF-8。这是代码：

有人可以帮我解决这个问题吗？

先感谢您。

python-2.7 twitter stream sentiment-analysis textblob

2015-06-19T22:26:41.863

0 投票

1 回答

116 浏览

python - 'u' 被添加到 TextBlob 中的所有文本之前

我正在使用 Textblob 处理文本数据。

我的代码是：

我得到的输出为：

代替：

每个单词前面都加上字母“u”的原因可能是什么？

我正在使用 Python 2.7.6 版本开发 Ubuntu 14.04.2。

python textblob

2015-07-11T06:27:52.723

0 投票

2 回答

621 浏览

python - TextBlob 未在 Pandas 数据框中返回正确数量的字符串实例

对于我实验室的一个项目，我正在分析 Twitter 数据。我们捕获的推文中都有“性”一词，这是我们过滤 TwitterStreamer 以捕获的关键字。

我将所有推文数据（json 元标记）都存放在 pandas 数据库中的 CSV 进行了转换，并保存了“文本”列以隔离推文文本。

输出正确的输出：

但是，当我尝试这个

我的输出是22.

“sex”一词的出现次数应该至少与 CSV 中的行数一样多，而且可能更多。我无法弄清楚这里发生了什么。TextBlob 是否没有围绕 dtype:object 进行配置？

python pandas textblob

2015-07-15T23:02:14.717

0 投票

2 回答

442 浏览

arrays - Textblob 词标记化为数组

打印出来的结果是：

[WordList(['i', 'have', 'a', 'bunch', 'of', 'grapes']), WordList(['i', 'like', 'to', 'eat', '苹果']), WordList(['this', 'is', 'a', 'laptop'])]

我如何从 WordList 中提取，以便我的 array2 将打印为：

[['i', 'have', 'a', 'bunch', 'of', 'grapes'],['i', 'like', 'to', 'eat', 'apple'],[ “这是一台笔记本电脑”]]

arrays tokenize textblob

2015-07-23T02:52:37.673

0 投票

2 回答

513 浏览

python - 使用 NLTK 在文本中查找原因

对于我的工作项目，我的任务是浏览一堆用户生成的文本，其中一些文本是取消他们的互联网服务的原因，以及该原因发生的频率。可能是他们正在搬家，只是不喜欢它，或者服务不好等。

虽然这可能不一定是 Python 问题，但我想知道是否可以通过某种方式使用 NLTK 或 Textblob 来确定取消的原因。我非常怀疑对于这样一个专门的任务是否有任何自动化的东西，我意识到我可能必须建立一个神经网络，但任何关于如何解决这个问题的建议都将不胜感激。

这是我到目前为止所考虑的：1）使用词干和标记化并统计最常见的单词。方法简单，不准确。2) n-gram。计算密集型，但可能会有一些希望。3）词性标注和分块，可能会找到跟在“因为”等连词后面的词。4) 手动浏览所有文本字段并记录取消原因。效率不高，违背了寻找某种算法的全部目的。5）NN，完全不知道，也不知道是否可行。

我真的很感激对此的任何建议。

python python-2.7 neural-network nltk textblob

user4797334

2015-07-23T04:41:52.017

0 投票

1 回答

2810 浏览

python-3.x - 在 Windows 上使用 Conda 安装 TextBlob

textblob 上的现有问题并没有谈论 conda，所以请尝试一个新问题。

我尝试加载/安装 TextBlob https://textblob.readthedocs.org/en/dev/install.html#with-conda

但https://conda.binstar.org/sloria仅适用于 OSX

所以尝试了这个而不是https://binstar.org/sursma/textblob仍然没有多少运气

C:\Users\kumar\AppData\Local\Continuum\Anaconda3>conda install -c https://conda.binsta.org/sursma textblob 获取包元数据：...无法连接到https://conda.binsta。 org/sursma/noarch/ 无法连接到https://conda.binsta.org/sursma/win-64/ 错误：找不到 URL：https ://conda.binstar.org/sursma /win-64/

谢谢！

python-3.x anaconda textblob

2015-07-30T19:49:58.907

0 投票

2 回答

556 浏览

python - 导出相关词TF-IDF TextBlob python

我按照本教程在我的文档中搜索相关单词。我的代码：

这是我的问题，我想导出一个包含以下信息的数据框：索引、10 个热门单词（用逗号分隔）。我可以用熊猫数据框保存的东西。例子：

谢谢大家。

python text-mining tf-idf textblob

2015-08-12T08:16:15.847

1 2 3 4 5 6 7 8 9 10

问题标签 [textblob]

Reference