问题标签 [text-analytics-api]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 用于潜在语义分析和 PLSA 中的主题建模的 r 代码
有人可以帮助我使用 R 代码来执行概率潜在语义分析(PLSA)和 LSA 以进行主题建模。我成功地执行了 LDA 方法。
python - Microsoft Azure 文本分析认知服务编码问题
为了使用他们的文本分析,Azure 需要一个如下所示的 json 文件/文档:
我目前遇到的问题是最后一条记录id: 4
导致此错误:
JSON 的格式是正确的,它直接来自他们的站点,并且在没有最后一条记录的情况下运行得非常好。我进行了更多测试,然后发现í
andá
是引发错误的那些。为了确保这一点,我什至用像简历或未婚夫这样的英文单词对其进行了测试,但仍然是同样的错误。但这没有任何意义,因为西班牙语是文本分析支持的语言之一,而且文本语言在处理之前甚至被定义为西班牙语。
所以我的问题是,在通过 Azure 传递我的数据之前我是否遗漏了什么?我是想转换、更改编码或删除这些字符,还是 Azure 的 API 应该能够处理这些字符?
编辑:更多背景知识,我按照他们网站上提供的说明将其设置为与python一起使用。除了我提到的之外,它工作得很好。
python - SpaCy 中的相似性函数如何工作?
我试过一个,例如,
“积极”和“消极”它们不是相似的词,而是相反,但 spaCy 仍然给我 81% 的相似度。
这是我的代码,
python-3.x - Python 与谷歌云语言 api 问题?
使用 python 的 google-cloud-language 库如何获取从以下方法返回的 JSON。
该方法response.serializetostring()
似乎以无法在 python 中解码的方式对结果进行编码。不是 UTF-8 或 unicode 转义。我想获取 JSON,以便可以将其转储到 mongodb 中。
提前致谢。
r - 使用 R 中的文本预测连续变量
我有一项任务,我需要根据存在客户面临的问题的文本字段来预测连续变量、里程表读数。此字段不是下拉菜单,而是使用客户的逐字更新。所以我需要根据客户面临的问题的文本字段来预测里程表读数。例如:
编辑:
我正在使用 unigram 构建线性模型。但是当我执行数据预处理时会收到此警告:
有人可以告诉我如何解决这个警告。
sentiment-analysis - 改进 Microsoft 认知服务情绪分析?
我发现情绪分析经常偏离,完全偏离实际应该是什么情绪。这里有些例子,
- 我告诉过你不要那样做 - 情绪 0.81(积极).. 这是积极的吗?
- 如果你掉下杯子,我会打败你 - 情绪 0.74(正面).. 世界上如何打败一个正面的人?
- 你弄得一团糟-情绪0.76(正面)..这是正面的吗?
等等许多其他这样的例子!
问题,
- 是否可以根据您的模型进行调整?
- 是否可以对对话线程进行情绪分析?例如,话语:你弄得一团糟,没关系,数到十.. .. 这里数到十是.. 令人放心.. 即没关系,深呼吸。情绪应该是积极的!
但只说“数到十”不应该是积极的。
微软认知服务情绪分析能走多远?有更好的/其他选择吗?
谢谢!
azure - 在 Microsoft azure 中使用 PowerApps 运行应用程序时出错
我正在尝试使用 Microsoft azure 认知服务在 powerapps 上运行应用程序。这是一个情感分析应用程序,其中根据我们输入的句子给出 0 到 1 之间的情感分析分数,其中 1 表示正面,0 表示负面。但是我尝试和执行多少我无法处理这个错误:
TextAnalytics.DetectLanguage 失败:
如果有人对此错误有任何想法并知道如何处理它。请帮我执行此代码。
r - e(s, a) 中的错误:未找到句子标记注释。在 R 中执行 NER 时出错
我正在尝试在 R 中进行命名实体识别。它在执行句子标记注释和单词标记注释后抛出错误。找不到出路。如果有人遇到同样的错误,请帮忙。
下面是我的代码,后面跟着错误。
python - 如何将数据框中的行转换为 Python 中的多个列表
我有以下类型的大型数据框:
我想将此数据转换为两种格式
预期输出 1:
预期输出 2:
谁能帮我这个
azure - 认知服务文本翻译认证问题
我正在使用 Azure 的认知服务文本分析 API。我正在尝试通过以下说明传递我的访问令牌的密钥来进行身份验证:https ://docs.microsoft.com/en-us/azure/cognitive-services/translator/reference/v3-0-reference
我将我的 Ocp-Apim-Subscription-Key 发布到https://eastus.api.cognitive.microsoft.com/sts/v1.0/issueToken并收到以下错误:
{"error":{"code":"401","message": "当前订阅密钥和定价层 TextAnalytics.S. 不支持 Token API V1.0 API 下的 issueToken 操作"}}
我正在使用 Alteryx 中的信息实验室的宏执行此身份验证请求 - https://www.theinformationlab.co.uk/2017/09/26/translate-foreign-language-text-alteryx/ - 我必须在在 issueToken 请求中添加“eastus”作为区域的宏。在我这样做之前,我收到了 AccessDenied 错误响应。至少现在我知道它正在登录我的资源,因为它会将错误中的最后一个字母从“F”(免费)更改为“S”到“S1”,这是我正在切换的定价层。
我有一个即用即付订阅,我将资源切换为使用免费、S 和 S0 定价层。仍然总是得到同样的错误。请帮忙!
谢谢
我的摘要中提供了所有内容。
我希望得到一个经过身份验证的令牌。