问题标签 [language-detection]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - (人类)文档的语言
有没有办法(程序、库)大致知道文档是用哪种语言编写的?
我有一堆混合语言的文本文档(~500K)要导入启用 i18n 的 CMS(Drupal)..
我不需要完美匹配,只需要一些猜测。
php - 如何检测文档的语言 - 在 PHP 中?
这里已经回答了基础知识。但是是否有一个预先构建的 PHP 库与来自 CPAN 的 Lingua::Identify 一样?
programming-languages - 从片段中检测编程语言
检测代码片段中使用哪种编程语言的最佳方法是什么?
web - 检测网络用户的语言,例如 JavaScript?
我正在考虑制作我的网站的多种语言版本(例如英语和德语)。我想根据用户的语言提供一个合理的默认值。
最简单、最不突兀的方法是什么?
编辑:理想的解决方案是不使用任何服务器端技术,而是对 html 文件中的所有内容进行编码。目前,我有一个自动转发到主页的起始页面。如果可能的话,我想让它更“聪明”一点,以便它转发到德语或英语版本。
string - 测试字符串中的日文/中文字符
我有一个程序可以读取一堆文本并对其进行分析。文本可能是任何语言,但我需要专门测试日语和中文,以便以不同的方式分析它们。
我读过我可以测试它的 unicode 数字上的每个字符,以确定它是否在 CJK 字符范围内。这很有帮助,但是如果可能的话,我想将它们分开以针对不同的字典处理文本。有没有办法测试一个字符是日文还是中文?
c# - 如何检测字符串的语言?
检测字符串语言的最佳方法是什么?
regex - 如何使用 Perl 检测俄罗斯垃圾邮件?
我有一个用 perl 编写的英语论坛站点,它不断被俄语垃圾邮件轰炸。有没有办法使用 Perl 和正则表达式来检测俄语文本以便我可以阻止它?
php - 从 PHP 中的字符串中检测语言
在 PHP 中,有没有办法检测字符串的语言?假设字符串是 UTF-8 格式。
utf-8 - 检测 PHP 中的 CJK 字符
我有一个允许 UTF8 字符的输入框——我可以通过编程检测这些字符是中文、日文还是韩文(可能是某些 Unicode 范围的一部分)?我会根据 MySQL 的全文搜索是否有效(它不适用于 CJK 字符)来更改搜索方法。
谢谢!