问题标签 [polyglot]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ios - 我在 iOS 应用中只看到键而不是翻译
我有一个问题,从多语言中提取新键后,应用程序中只显示键。如何解决?
python - 加载 word2vec 时出现 UnicodeDecodeError 错误
详细描述
我开始使用词嵌入,并找到了大量关于它的信息。到目前为止,我了解我可以训练自己的词向量或使用以前训练过的词向量,例如 Google 或 Wikipedia 的,它们可用于英语,但对我没有用,因为我正在处理巴西葡萄牙语的文本. 因此,我开始寻找葡萄牙语中预训练的词向量,最终找到了Hirosan 的预训练词嵌入列表,这使我找到了 Kyubyong 的WordVectors,从中我了解了 Rami Al-Rfou 的Polyglot。下载两者后,我一直试图简单地加载单词向量,但没有成功。
简短的介绍
我无法加载预训练的词向量;我正在尝试WordVectors和Polyglot。
下载
加载尝试
Kyubyong 的WordVectors 第一次尝试:按照 Hirosan 的建议使用Gensim;
并返回错误:
下载的 zip 还包含其他文件,但它们都返回类似的错误。
Polyglot 第一次尝试:遵循Al-Rfous 的指示;
并返回错误:
第二次尝试:使用Polyglot的词嵌入加载函数;
首先,我们必须通过 pip 安装 polyglot:
现在我们可以导入它:
并返回错误:
额外的信息
我在 MacOS High Sierra 上使用 python 3。
解决方案
Kyubyong 的WordVectors正如Aneesh Joshi 所指出的,加载 Kyubyong 模型的正确方法是调用 Word2Vec 的原生加载函数。
尽管我非常感谢 Aneesh Joshi 的解决方案,但多语言似乎是使用葡萄牙语的更好模式。关于那个有什么想法吗?
python - 如何在 Polyglot python 库找到的实体的原始文本中获取索引?
我想在使用 python 的 poplyglot 库找到的实体的原始文本中获取索引。
结果是:[I-PER(['Ben'])] I-PER ['Ben'] 8 9
所以问题是如果这些块索引在原始句子中,我如何获得开始和结束索引?
python - 如何将 Polyglot Detector 功能应用于数据帧
假设我有一个名为的列df.Text
,其中包含文本(超过 1 个句子)并且我想使用 polyglotDetector
来检测语言并将值存储在新列中df['Text-Lang']
,我如何确保我还捕获其他详细信息,例如code
和confidence
返回
名称:英文代码:en 置信度:94.0 读取字节数:1920
但
以。。结束
AttributeError: 'float' 对象没有属性 'encode' 并且 Detector 无法可靠地检测语言。
我是错误地应用了检测器功能还是错误地存储了输出或其他原因?
python - Python 多语言最大语言代码长度
我看到多语言示例中提供的大多数语言代码都是两个字符:“en”、“es”、“zh”等。但是,我知道它们也可以包含每种语言中的区域,一个示例有“zh_hant”,例如这里: http: //polyglot.readthedocs.io/en/latest/Detection.html。我不确定区域检测是否是一个选项,或者它是否是默认选项。
我似乎找不到特定于多语言的表格以及它们可能使用的内容,但我需要知道它们可能的最大长度。显然大于二。
奖励:
1.有没有办法指定区域是否包含在多语言检测中?
2. 为什么找不到表?
python-3.x - 正确安装 PyICU 和 icu4c 时,多语言导入或未找到符号错误
我真的很挣扎polyglot
,pyicu
而且icu4c
- 似乎我不是唯一一个......
我正在10.13.6
使用 virtualenv 运行 Mac OS High Sierra 和 python3
以下是我采取的步骤,主要基于这篇文章:
- 从一个新的 virtualenv 开始
- 使用自制软件删除并重新安装 icu4c (v.62.1)
- 检查 ICU_VERSION 是否为“62.1”
- 做
ln -s /usr/local/Cellar/icu4c/62.1/bin/icu-config /usr/local/bin/icu-config
- 下载 pyicu tar 文件 (2.1)
- 如链接文章中所示,提取 pyicu 并编辑 setup.py
- 构建和安装 pyicu
我懂了:
正如预期的那样。
- pip3 安装多语言
当我运行我的脚本时,我得到以下信息:
不足为奇,因为 PATH 中实际上没有 icu 模块。
如果,而不是步骤 5-7,我执行 pip3 install pyicu (创建 icu 文件夹),我得到:
输出otool -L /Users/Chris/MindWeb/Server/lib/python3.6/site-packages/_icu.cpython-36m-darwin.so
是:
python - 多语言安装
我正在尝试使用以下命令安装“polyglot”
但我收到以下错误
我的 python 版本是 Python 3.6.4 因为我是 python 新手,所以我尝试了以下我在网上找到的命令,但它们没有帮助
如何成功安装 polyglot?对此的任何帮助表示赞赏。
javascript - 如何在我的 Webpack 项目中使用 Polyglot.js?
第一次尝试在我的 Webpack 项目中使用 Polyglot,但不断收到未定义 polyglot 的错误。我可以从某处的节点导入它吗?还是我需要在本地导入它们?
python - 尝试在 Windows 10 上安装库“pycld2”时收到错误
尝试安装 pycld2(多语言需要它),我收到以下错误:
[WinError 2] 系统找不到指定的文件
如果其他人面临同样的问题,正在寻找解决方案。谢谢!