问题标签 [text-analytics-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
299 浏览

r - 用于潜在语义分析和 PLSA 中的主题建模的 r 代码

有人可以帮助我使用 R 代码来执行概率潜在语义分析(PLSA)和 LSA 以进行主题建模。我成功地执行了 LDA 方法。

0 投票
1 回答
246 浏览

python - Microsoft Azure 文本分析认知服务编码问题

为了使用他们的文本分析,Azure 需要一个如下所示的 json 文件/文档:

我目前遇到的问题是最后一条记录id: 4导致此错误:

JSON 的格式是正确的,它直接来自他们的站点,并且在没有最后一条记录的情况下运行得非常好。我进行了更多测试,然后发现íandá是引发错误的那些。为了确保这一点,我什至用像简历或未婚夫这样的英文单词对其进行了测试,但仍然是同样的错误。但这没有任何意义,因为西班牙语是文本分析支持的语言之一,而且文本语言在处理之前甚至被定义为西班牙语。

所以我的问题是,在通过 Azure 传递我的数据之前我是否遗漏了什么?我是想转换、更改编码或删除这些字符,还是 Azure 的 API 应该能够处理这些字符?

编辑:更多背景知识,我按照他们网站上提供的说明将其设置为与python一起使用。除了我提到的之外,它工作得很好。

0 投票
1 回答
760 浏览

python - SpaCy 中的相似性函数如何工作?

我试过一个,例如,

“积极”和“消极”它们不是相似的词,而是相反,但 spaCy 仍然给我 81% 的相似度。

这是我的代码,

0 投票
1 回答
212 浏览

python-3.x - Python 与谷歌云语言 api 问题?

使用 python 的 google-cloud-language 库如何获取从以下方法返回的 JSON。

该方法response.serializetostring()似乎以无法在 python 中解码的方式对结果进行编码。不是 UTF-8 或 unicode 转义。我想获取 JSON,以便可以将其转储到 mongodb 中。

提前致谢。

0 投票
1 回答
123 浏览

r - 使用 R 中的文本预测连续变量

我有一项任务,我需要根据存在客户面临的问题的文本字段来预测连续变量、里程表读数。此字段不是下拉菜单,而是使用客户的逐字更新。所以我需要根据客户面临的问题的文本字段来预测里程表读数。例如:

编辑:

我正在使用 unigram 构建线性模型。但是当我执行数据预处理时会收到此警告:

有人可以告诉我如何解决这个警告。

0 投票
0 回答
213 浏览

sentiment-analysis - 改进 Microsoft 认知服务情绪分析?

我发现情绪分析经常偏离,完全偏离实际应该是什么情绪。这里有些例子,

  1. 我告诉过你不要那样做 - 情绪 0.81(积极).. 这是积极的吗?
  2. 如果你掉下杯子,我会打败你 - 情绪 0.74(正面).. 世界上如何打败一个正面的人?
  3. 你弄得一团糟-情绪0.76(正面)..这是正面的吗?

等等许多其他这样的例子!

问题,

  • 是否可以根据您的模型进行调整?
  • 是否可以对对话线程进行情绪分析?例如,话语:你弄得一团糟,没关系,数到十.. .. 这里数到十是.. 令人放心.. 即没关系,深呼吸。情绪应该是积极的!

但只说“数到十”不应该是积极的。

微软认知服务情绪分析能走多远?有更好的/其他选择吗?

谢谢!

0 投票
1 回答
92 浏览

azure - 在 Microsoft azure 中使用 PowerApps 运行应用程序时出错

我正在尝试使用 Microsoft azure 认知服务在 powerapps 上运行应用程序。这是一个情感分析应用程序,其中根据我们输入的句子给出 0 到 1 之间的情感分析分数,其中 1 表示正面,0 表示负面。但是我尝试和执行多少我无法处理这个错误:

TextAnalytics.DetectLanguage 失败:

如果有人对此错误有任何想法并知道如何处理它。请帮我执行此代码。

0 投票
0 回答
326 浏览

r - e(s, a) 中的错误:未找到句子标记注释。在 R 中执行 NER 时出错

我正在尝试在 R 中进行命名实体识别。它在执行句子标记注释和单词标记注释后抛出错误。找不到出路。如果有人遇到同样的错误,请帮忙。

下面是我的代码,后面跟着错误。

0 投票
1 回答
130 浏览

python - 如何将数据框中的行转换为 Python 中的多个列表

我有以下类型的大型数据框:

我想将此数据转换为两种格式

预期输出 1:

预期输出 2:

谁能帮我这个

0 投票
1 回答
725 浏览

azure - 认知服务文本翻译认证问题

我正在使用 Azure 的认知服务文本分析 API。我正在尝试通过以下说明传递我的访问令牌的密钥来进行身份验证:https ://docs.microsoft.com/en-us/azure/cognitive-services/translator/reference/v3-0-reference

我将我的 Ocp-Apim-Subscription-Key 发布到https://eastus.api.cognitive.microsoft.com/sts/v1.0/issueToken并收到以下错误:

{"error":{"code":"401","message": "当前订阅密钥和定价层 TextAnalytics.S. 不支持 Token API V1.0 API 下的 issueToken 操作"}}

我正在使用 Alteryx 中的信息实验室的宏执行此身份验证请求 - https://www.theinformationlab.co.uk/2017/09/26/translate-foreign-language-text-alteryx/ - 我必须在在 issueToken 请求中添加“eastus”作为区域的宏。在我这样做之前,我收到了 AccessDenied 错误响应。至少现在我知道它正在登录我的资源,因为它会将错误中的最后一个字母从“F”(免费)更改为“S”到“S1”,这是我正在切换的定价层。

我有一个即用即付订阅,我将资源切换为使用免费、S 和 S0 定价层。仍然总是得到同样的错误。请帮忙!

谢谢

我的摘要中提供了所有内容。

我希望得到一个经过身份验证的令牌。