问题标签 [textblob]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 带有 TextBlob 的 Jython for Java
我目前正在开发一个带有 python 集成的 Java 项目。为此,我使用以下软件包和 ide:
Eclipse luna Jython 2.7.0 TextBlob v0.10.0-dev
这是我的java代码片段:
python代码也相当简单。
当我执行 python 代码时,我得到了我的期望:
0.06 -0.341666666667 Der Titular Bedrohung des BLOB hat mich als die ultimative Film immer geschlagen Monster: ein unersättlich hangrig, amöbenartige Masse in der Lage, zu durchdringen praktisch jede Sicherung, in der Lage ist - als Untergang geweihten Arzt unterkühlen Fleisschlagen auf Kontakt. Abfällige Vergleiche zu Gelatin verdammt sein, es ist ein Konzept, mit dem die meisten verheerende der möglichen Folgen, nicht anders als die graue Schmiere-Szenario durch technologische Theoretiker fürchten vorgeschlagen künstliche Intelligenz wuchern. -0.159091
但是,当我使用 jython 调用 python 脚本时,我得到以下结果:
0.0 0.0 Der Titular Bedrohung des BLOB hat mich als die ultimative Film immer geschlagen Monster: ein unersättlich hangrig, amöbenartige Masse in der Lage, zu durchdringen praktisch jede Sicherung, in der Lage ist - als Untergang geweihten Arzt unterkühlt es beschreibt - "assimilieren Fle Kontakt. Abfällige Vergleiche zu Gelatine verdammt sein, es ist ein Konzept, mit dem die meisten verheerende der möglichen Folgen, nicht anders als die graue Schmiere-Szenario durch technologische Theoretiker fürchten vorgeschlagen künstliche Intelligenz wuchern. 0.0 translate_text: BLOB hat mich als die ultimative Film immer geschlagen Monster: ein unersättlich hangrig, amöbenartige Masse in der Lage, zu durchdringen praktisch jede Sicherung,in der Lage ist - als Untergang geweihten Arzt unterkühlt es beschreibt - "assimilieren Fleisch auf Kontakt. Abfällige Vergleiche zu Gelatine verdammt sein, es ist ein Konzept, mit dem die meisten verheerende der möglichen Folgen, nicht anders als die graue Schmiere -Szenario durch technologische Theoretiker fürchten vorgeschlagen künstliche Intelligenz wuchern。”)
Sentiment.polarity 突然变为 0,在 Java 中访问翻译后的变量并打印它后,ascii 编码看起来有点奇怪。
有没有人遇到过类似的问题?
python - 使用 django 在 textblob 中缺少语料库错误
我正在使用 Python 2.7、Django 1.8,我的服务器是 Linux Ubuntu 上的 Apache。我有一个包含 23000 条推文的 JSON 文件。我想根据预定义的类别对推文进行分类。但是当我运行代码时,它会抛出MissingCorpusError at /
并建议:
要下载必要的数据,只需运行
我已经有了 TextBlob 的最新语料库。不过,我得到了错误。
我的views.py如下:
python - 构建文本分类器
我需要构建一个分类器,它将任何推文字符串分类为特定类别。我有大约 15 个左右的类别。我有训练数据集。任何想法我应该如何继续这个?为此使用 Python 或 Java。
我一直在研究 Textblob 和斯坦福 NLP 分类器。我只是不确定选择哪一个以获得更好的结果。
python - Python泡菜错误:UnicodeDecodeError
我正在尝试使用 Textblob 进行一些文本分类。我首先训练模型并使用 pickle 对其进行序列化,如下所示。
当我尝试运行这个文件时:
我收到此错误:
UnicodeDecodeError:“utf-8”编解码器无法解码位置 0 中的字节 0x80:无效的起始字节
以下是我的 sample.csv 的内容:
我的 SQL 根本无法正常工作。这是一个错误的选择,SQL
我有问题。请及时回复,支持
我在哪里错了?请帮忙。
python - TextBlob NaiveBayesAnalyzer 极慢(与 Pattern 相比)
我正在使用 TextBlob for python 对推文进行一些情绪分析。TextBlob 中的默认分析器是 PatternAnalyzer,它工作得很好,而且速度很快。
我现在尝试切换到 NaiveBayesAnalyzer,发现运行时不适合我的需求。(每条推文接近 5 秒。)
我以前使用过朴素贝叶斯分类器的 scikit learn 实现,并没有发现它这么慢,所以我想知道在这种情况下我是否正确使用它。
我假设分析器是预训练的,至少文档说明“在电影评论数据集上训练的朴素贝叶斯分析器”。但它也有一个函数 train(),被描述为“在电影评论语料库上训练朴素贝叶斯分类器”。它是否在每次运行之前在内部训练分析器?我希望不是。
有谁知道加快速度的方法?
python - 在 python 中加入单词列表
我需要从中ngrams
提取text
。我在用着:
将文本(python 之王)拆分为三元组,它给出:
现在我需要将每个 WordList 的项目加入:
它给了我以下错误:
我知道解决方案很愚蠢,但我不擅长 python,我不明白wordlists
。
python - TextBloB:正确()方法返回空对象
我正在尝试使用TextBlob 的拼写更正,但 correct() 每次调用都返回一个空对象。下面展示了终端上的方法调用:
我在 Linux 上运行 Python 2.7.6。
python - 使用 TextBlob 翻译 pandas 列
我正在尝试使用 Python(2.7.10 Mac OS X Yosemite)中的 TextBlob 包读取 csv 并用法语将一列翻译成英语。
但是,Python 会向我抛出以下错误消息:
我的 Python 代码:
再三考虑,我实际上认为我在这里不需要 numpy。但是我怎样才能让熊猫阅读内容字段并让 textblob 将其翻译成英文。最好将其放在名为“英语”的列中
编辑:更改为:
数据非常基本,第 1 列作者姓名和第 2 列(“内容”)为法文文本。
我仍然有以下错误:
python - TypeError:“TextBlob”对象不可调用
我可以从一个简单的脚本成功加载 TextBlob 模块,但不能从 Flask 应用程序加载。我会告诉你代码和错误。
加载一个简单的脚本有效:
从 Flask 应用程序加载会引发错误:
错误:
我正在使用通过 pip 安装的 textblob 版本 0.11.0。
python - python textblob和文本分类
我正在尝试使用 python 和textblob构建文本分类模型,该脚本在我的服务器上运行,将来的想法是用户将能够提交他们的文本并将其分类。我正在从 csv 加载训练集:
csv 大约有 500 行长(字符串在 10 到 100 个字符之间),NaiveBayesclassifier 需要大约 2 分钟的时间进行训练,然后才能对我的文本进行分类(不确定它需要这么多时间是否正常,也许是我的服务器很慢只有 512mb 内存)。
csv 行示例:
我不清楚,我无法在 textblob 文档上找到答案,是否有办法“保存”我训练有素的分类器(这样可以节省很多时间),因为现在每次我运行脚本时它都会训练再次分类器。我是文本分类和机器学习的新手,所以如果这是一个愚蠢的问题,我深表歉意。
提前致谢。