问题标签 [cld2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
861 浏览

language-detection - 将 CLD2 的语言检测分数转换为 CLD3 准确度

我的cld2语言检测模型 (langID) 返回输入句子以对以下值进行分类

其中textBytes表示输入文本的大小,表示句子中percent的分布,而表示检测质量的指标(越小越好)。也就是说,在全新的CLD3神经网络中,分类的结果就是准确率(所以是一个介于 0 和 1 之间的概率值),就像codescore

我想弄清楚如何将 CLD2 分数转换为概率值,以便将结果与新的 CLD3 模型进行比较。

0 投票
0 回答
368 浏览

python-3.x - Polyglot 中是否有办法将希伯来语文本的语言代码从“iw”永久“修复”为“he”?

我想在 python 3.6 中使用 Polyglot 对希伯来语文本进行简单的情感分析。问题是 Polyglot 将文本语言代码识别为“iw”而不是“he”,因此无法处理它。

如图所示: 使用 polyglot package for Named Entity Recognition in hebrew我已经添加hint_language_code = 'he'Text函数调用中,但它只更改文本的初始形式,而不是其子形式(如句子或单词)。

例如:

输入:

输出:

如何将文本language_code从永久更改'iw''he'

0 投票
0 回答
92 浏览

r - 如何获得与“cld”功能的显着差异?

我正在尝试运行 cld 函数以显示显着差异。但最后这显示: UseMethod("cld") 中的错误:没有适用于 'cld' 的方法应用于类 "c('emm_list', 'list')" 的对象。如果有人可以帮助我,我将不胜感激