问题标签 [latin]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 将特殊字符(例如 ü 和 Ã)转换回 C# 中的原始拉丁字母对应字符
我从 MySQL 数据库中得到了一个导出,随着时间的推移,它的编码似乎有些混乱,并且包含HTML char codes
诸如& uuml;
和更多问题字符的混合,代表相同的字母,例如ü
和Ã
。我的任务是使文件恢复一些一致性并将所有内容都转换为正确的拉丁字符,例如ú
和ó
.
我正在处理的那种字符串的一个例子是
Desinfektionslösungstücher für Flächen
这应该等于
C#/.Net 4.5 中是否有一种方法可以成功地重新编码ü
和Ã
to之类的方法UTF-8
?
否则什么方法是可取的?
上面示例字符串中的段落¶
字符也是实际的段落字符还是其他字符组合的一部分?
在需要查找和替换的情况下,我创建了一个查找表,如下所示,但是我不确定它的完整性。
apache-pig - Pig ORDER 命令失败
我正在尝试分析 apache 日志,目标是找出所有用户代理及其使用百分比。当结果包含每个用户代理、计数和百分比时,以下程序可以正常工作。当尝试根据最常用的顺序进行排序时,程序在最后一行失败。有人可以帮忙吗?
奇怪的是“转储结果”工作得很好,所以这是 ORDER 行造成了麻烦
错误:
hadoop - 猪独特的原子
假设我的数据看起来像这样,列名为 food、action 和 population:
我如何编写一个 Pig Latin 脚本来仅生成一个独特的食物和动作,以及来自不同食物和动作组的任何有效人口?
即,我想从上述数据中得到的唯一输出是这个(尽管第一行和第三行的人口可能不同):
谢谢,
mysql - 在 MySQL 中将字符转换为 UTF8(é 到 é)
我有一个 MySQL 问题。除了我的数据库之外,我的整个网站都是 UTF8 格式的。我最近刚刚尝试使用各种命令将其转换为 UTF8,但主要问题仍然存在:
口音不起作用。而不是é,我有é。è 也一样,还有另一种奇怪的字符。
是否有一个简单的转换所有这些字符的方法,比如说 é,到 é,在基地?
多谢。
(顺便说一下,数据库在latin1)
hadoop - Apache Pig - 如何获取多个包之间的匹配元素数量?
我是 Apache Pig 的新用户,我有一个问题要解决。
我正在尝试用 apache pig 制作一个小搜索引擎。这个想法很简单:我有一个文件,它是多个文档的串联(每行一个文档)。这是一个包含三个文档的示例:
然后,我使用以下代码行为每个文档创建一个词袋:
然后,我删除袋子上的重复条目:
以下是这段代码的结果:
所以我每个文档都有一袋字,就像我想要的那样。
现在,让我们将用户查询视为一个文件:
我将查询转换为一袋单词:
结果如下:
现在,这是我的问题:我想获取查询和每个文档之间的匹配数。在这个例子中,我想要这个输出:
我试图在袋子之间进行连接,但没有成功。
请问你能帮帮我吗 ?
谢谢你。
hadoop - 在 Pig Latin 中提取文件之间的不匹配记录
我是初学者,正在学习 Pig latin。需要从文件中提取记录。已经创建了两个文件 T1 和 T2,一些元组是两个文件共有的,所以需要提取仅存在于 T1 中的元组,并且需要省略 T1 和 T2 之间的公共元组。有人可以帮帮我吗...
谢谢
c# - 防止字符串中出现西里尔文/希腊文/中文 - C# 4.0
我们有一个支持希腊文、西里尔文、中文字符的系统(使用 ASP.NET C# 4.0)。但是第三方系统似乎无法正常工作。为避免在为此第三方系统输入数据时出现问题,我想将文本字段限制为仅接受英文或重音字符,但返回其他字符的验证错误。
我怎样才能做到这一点?看来我可以使用 \p{Latin} 的正则表达式,但根据我的经验,C# 似乎不支持这一点,因为我遇到了Unknown property 'Latin'
错误。
csv - 在 Pig 中提取 CSV 文件的第一行
我有几个 CSV 文件,标题始终是文件的第一行。将该行作为 Pig 中的字符串从 CSV 文件中取出的最佳方法是什么?不能使用 sed、awk 等进行预处理。
我尝试使用常规 PigStorage 和 Piggy bank CsvLoader 加载文件,但我不清楚如何获得第一行,如果有的话。
如果需要的话,我愿意编写 UDF。
php - 从带有西里尔字符的字符串中删除所有非拉丁字符
我对一些字符串清理的正则表达式有一些问题......
我想:
1) 如果第一个字符是西里尔文 => 删除所有字符,直到字符串中的第一个数字或拉丁字符
2) 如果第一个字符是拉丁文 => 保存字符直到字符串中的第一个西里尔字符
我有模式的部分:
但是对于第二部分,如果拉丁字符的位置是输入字符串的中间,我什么都没有输出......
有人可以帮我编辑正则表达式吗?
谢谢
例如($in[必须在结果中]):
jquery - 使用非拉丁字符时,自动完成功能不适用于某些移动浏览器
我将 jQuery 1.7.2 与 jQuery UI 自动完成 1.8.22 一起使用,它适用于所有基于 pc 的浏览器
在 Chrome 以外的移动浏览器上,当搜索词使用非拉丁字符(比如说希腊语)时,其他移动浏览器(例如 Firefox 和 Safari)会失败。
是否有任何我应该知道的影响移动 Firefox 和 Safari 的已知问题?