问题标签 [language-detection]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
940 浏览

nlp - (人类)文档的语言

有没有办法(程序、库)大致知道文档是用哪种语言编写的?

我有一堆混合语言的文本文档(~500K)要导入启用 i18n 的 CMS(Drupal)..

我不需要完美匹配,只需要一些猜测。

0 投票
2 回答
472 浏览

php - 如何检测文档的语言 - 在 PHP 中?

这里已经回答了基础知识。但是是否有一个预先构建的 PHP 库与来自 CPAN 的 Lingua::Identify 一样?

0 投票
17 回答
104480 浏览

programming-languages - 从片段中检测编程语言

检测代码片段中使用哪种编程语言的最佳方法是什么?

0 投票
4 回答
1131 浏览

web - 检测网络用户的语言,例如 JavaScript?

我正在考虑制作我的网站的多种语言版本(例如英语和德语)。我想根据用户的语言提供一个合理的默认值。

最简单、最不突兀的方法是什么?

编辑:理想的解决方案是不使用任何服务器端技术,而是对 html 文件中的所有内容进行编码。目前,我有一个自动转发到主页的起始页面。如果可能的话,我想让它更“聪明”一点,以便它转发到德语或英语版本。

0 投票
6 回答
5033 浏览

string - 测试字符串中的日文/中文字符

我有一个程序可以读取一堆文本并对其进行分析。文本可能是任何语言,但我需要专门测试日语和中文,以便以不同的方式分析它们。

我读过我可以测试它的 unicode 数字上的每个字符,以确定它是否在 CJK 字符范围内。这很有帮助,但是如果可能的话,我想将它们分开以针对不同的字典处理文本。有没有办法测试一个字符是日文还是中文?

0 投票
9 回答
28381 浏览

c# - 如何检测字符串的语言?

检测字符串语言的最佳方法是什么?

0 投票
2 回答
1141 浏览

regex - 如何使用 Perl 检测俄罗斯垃圾邮件?

我有一个用 perl 编写的英语论坛站点,它不断被俄语垃圾邮件轰炸。有没有办法使用 Perl 和正则表达式来检测俄语文本以便我可以阻止它?

0 投票
18 回答
65229 浏览

php - 从 PHP 中的字符串中检测语言

在 PHP 中,有没有办法检测字符串的语言?假设字符串是 UTF-8 格式。

0 投票
7 回答
34642 浏览

c# - 检测文本语言

是否有任何 C# 库可以检测特定文本的语言?即对于输入文本"This is a sentence",它应该将语言检测为"English". 或者"Esto es una sentencia"它应该将语言检测为"Spanish".

我知道从文本中检测语言不是确定性问题。但是谷歌翻译必应翻译都有一个“自动检测”选项,它可以最好地猜测输入语言。是否有类似的公开可用的东西,最好是在 C# 中?

0 投票
3 回答
2394 浏览

utf-8 - 检测 PHP 中的 CJK 字符

我有一个允许 UTF8 字符的输入框——我可以通过编程检测这些字符是中文、日文还是韩文(可能是某些 Unicode 范围的一部分)?我会根据 MySQL 的全文搜索是否有效(它不适用于 CJK 字符)来更改搜索方法。

谢谢!