问题标签 [ucs]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
112 浏览

c++ - 如何在 C++ 中获取 UTF-8 的 1 字节字母的 UCS 代码?

我需要检查一个字母(英语和俄语)是否按字母顺序排列。默认情况下,文件应该使用 UTF-8 编码。我发现,最好的解决方案是使用 UCS 代码。计算 2 字节编码字母的 UCS-code 的方法是

这是我正在寻找的解决方案的一半。这段代码只允许我使用西里尔符号(因为它们在 UTF-8 中用 2 个字节编码)。问题是,我也需要使用拉丁字母。那么我应该怎么做才能获得 1 字节符号的 UCS 代码(在我的情况下使用 UTF8LEN(c)=1)?

更新:可能,解决方案是:

这行得通吗?

0 投票
0 回答
1066 浏览

java - 带有口音的字母的 Java 字符串到 UCS2 编码

我需要对包含外来字符的字符串进行编码,例如。带有 UCS2 字符重音符号的字母,并具有以下适用于普通英文字母的代码。

输出 UCS2/UTF16 字节的十六进制序列

例如。你好 = 00680065006C006C006F

它遇到带有重音/外来字符的字母问题,并将值显示为 FFFD,该值位于 Specials 表中,用于指示系统无法将数据流呈现为正确符号时出现的问题。

有什么解决方法吗?

0 投票
1 回答
1774 浏览

python - 用于查询固件版本的 Cisco UCS Python SDK 脚本

我一直在努力训练自己掌握 Python 的伟大之处,而我学习的最好方法之一就是边做边学。因此,我参与的众多项目之一是从我们的 Cisco UCS 环境中提取固件信息。发现Cisco提供了一个Python SDK来查询UCS后;我以此为出发点。下面是用于说明什么是 UCS 和 UCS Python SDK 的链接。

思科 UCS 说明: http ://www.cisco.com/c/en/us/products/servers-unified-computing/index.html

思科 UCS Python SDK: https ://communities.cisco.com/docs/DOC-37174

从 Cisco 开发站点引用的脚本: https ://sreeinet.wordpress.com/2014/09/20/cisco-ucs-automation-using-python-sdk/ <--这是我脚本中大部分代码的来源从,主要道具到 Sreenivas。

我的脚本: http: //pastebin.com/txjnHi9q

我只想提取每个服务器刀片、机箱和结构互连的名称、型号和固件版本。因此,使用 Cisco 提供的 SDK 和上面链接的大部分脚本,我的脚本能够登录到我们的 UCS 并查询 A 和 B Fabric Interconnects、UCS 管理器并获取模型和固件版本。

我的脚本显示与此类似的结果:

如上所示,我已成功检索到 Fabric Interconnects 和 UCS Manager 的固件版本。我尝试使用相同的方法来提取刀片机箱和刀片服务器的名称、型号和固件,但对于这个新手来说,事情变得更加困难。

查看上面链接的脚本的第 46 行,它显示了以下代码:

“sys/mgmt/fw-system”是我在尝试获取固件版本时感到困惑的地方。我只能获得第 124 行和第 133 行中引用的刀片和机箱型号,如下所示。

UCS 将刀片的固件存储在“sys/chassis-N/slot-N/mgmt/fw-system”中,其中 N 是机箱和插槽的编号。我试图将机箱 1 增加到机箱 2 -3 -4,依此类推,将插槽 1 增加到插槽 2 -3 -4。这不起作用,因为机箱的数量和每个机箱中的刀片数量并不总是相同的。例如,每个机箱最多可容纳 8 个服务器刀片(插槽),但并非所有机箱都安装了全部 8 个。有些有 2 个刀片,有些有 6 个,等等。一旦我通过第一个机箱并尝试增加到机箱 2,脚本将无限期暂停。这可能无关紧要,但我还需要考虑到机箱和插槽可以以三位数编号。

关于如何在 Python 中进行上述操作的任何想法?

如果我错过了任何相关信息,我深表歉意。我很乐意回答我能回答的任何问题。:D

0 投票
1 回答
151 浏览

c - 将ucs(通用字符集)字符转换为unicode?

我正在阅读某人的代码,我碰巧看到代码如下。

根据评论,这个功能是Convert a UCS character to an UTF-8 string. 但是什么是ucs字符,ucs转unicode的规则是什么,在哪里可以找到文档呢?

0 投票
1 回答
57 浏览

unicode - 哪些非负整数在 UCS 中没有分配字符?

由Unicode 字符编码模型定义的编码字符集将字符映射到非负整数(例如,拉丁小写字母 A到 97,由传统的 ASCII 和 UCS 组成)。

注意:字符抽象字符之间存在区别:后者更接近于我们的字符概念,而第一个术语是编码字符集上下文中的概念。一些抽象字符由多个字符表示。维基百科上的 Unicode 文章引用了一个例子:

例如,一个拉丁文小写字母“i”,上面有一个ogonek,上面有一个点,还有一个重音[一个抽象字符],在立陶宛语中是必需的,用字符序列U+012F、U+0307、U+来表示0301.

UCS(Universal Coded Character Set)是国际标准ISO/IEC 10646定义的编码字符集,可以通过这个官方链接下载作为参考。

手头的任务是判断一个给定的非负整数是否被UCS(通用编码字符集)映射到一个字符。

让我们首先考虑未分配字符的非负整数,即使它们实际上是由 UCS 保留的。UCS(第 6.3.1 节,分类,表 1;链接文档的第 19 页)根据对应的基本类型列出了三种可能性:

  • 代理(范围 D800–DFFF)
  • 非字符(范围 FDD0–FDEF 加上任何以值 FFFE 或 FFFF 结尾的代码点)

    Unicode 标准对非字符的定义如下

    非字符是永久保留的代码点,永远不会分配给它们的字符。

    此页面更准确地列出了非字符。

  • 保留我还没有找到属于这个类别的非负整数

另一方面,基本类型为以下任何一种的代码点:

  • 形象的
  • 格式
  • 控制
  • 私人使用

分配给字符。然而,这是可以讨论的。例如,是否应该认为私人使用代码点实际上被分配了任何字符?非常 UCS(第 6.3.5 节,私人使用字符;链接文档的第 20 页)将它们定义为:

本国际标准不以任何方式限制私人使用字符。专用字符可用于提供用户定义的字符。

此外,我想知道 UCS 映射或保留的非负整数的范围。最大值是多少?在某些页面中,我发现 UCS 映射的整个非负整数范围是 – 大概 – 0–0x10FFFF。这是真的?

理想情况下,这些信息将以可以构建算法的机器可读格式公开提供。是偶然的吗?


为清楚起见:我需要的是一个函数,它以非负整数作为参数并返回它是否被 UCS 映射到字符。此外,我更希望它基于官方的、机器可读的信息。要回答这个问题,只要指出一个我可以自己构建函数的资源就足够了。

0 投票
1 回答
1366 浏览

linux - LDAP - Univention 企业服务器 - 中央身份验证 - SSO

你好或晚上好,

我实际上是一个小社会的实习生,他们想要的改进之一是拥有一个中央身份验证服务器。经过一番研究,我们选择使用 UCS(Univention Corporate Server),它处理了很多他们想在未来使用的工具。我的问题从这里开始......

我想在计算机启动时进行身份验证,并且只通过我的 UCS(无漫游配置文件或其他)进行身份验证。我只需要获得一张票以允许用户在 Intranet 上进行单点登录(例如访问 NAS 或集群)。我知道 LDAP 服务器在我的 UCS 上运行,因为当我使用 univention-ldapsearch 时,我可以看到一个包含大量信息的大文件……但是,我不知道它是哪个 LDAP 服务器。我有 kerberos v5、slapd、pam(也许),所以一切都适用于 SSO 并验证用户。

他们想要的是这样的:

--> 当用户启动计算机时,他们可以从任何地方使用他们的登录名/密码进行连接。

--> 主目录必须只保留在主用户计算机上。(所以他们可以从任何地方连接的事实更多是为了访问 Intranet 中的数据)

--> 他们可以通过 SSO 访问 Intranet 中的所有设备(允许用户使用)。


现在我知道了 :

我不知道 :

我不知道是否有人熟悉这项技术,我希望如此,因为它更像是:“我需要一个教程”而不是“RTFD”,很多地方都缺失了。

我更愿意指定我们没有异构网络,所有计算机都是基于 linux 的。

如果有人可以帮助我,请,我花了一天时间尝试做一个启动连接,但什么也没做......(我可以从浏览器连接,但只是为了更改密码。我们真的需要一个中央身份验证)。

提前致谢,

问候。

0 投票
0 回答
1626 浏览

python - 如何在 Odoo 8 中包含 Python 包时解决此错误“未定义符号:PyUnicodeUCS4_FromObject”?

我下载了pyodbc python 包并尝试将其用于Odoo 8,但出现以下错误:

未定义符号:PyUnicodeUCS4_FromObject

系统 python支持UCS4,但 Odoo python支持UCS2,任何对此有任何想法的人都会非常有帮助。谢谢 !!!

0 投票
1 回答
1470 浏览

python - 通过 pyenv 将 Python 构建为 UCS-4

我遇到了这个问题ImportError numpy/core/multiarray.so: undefined symbol: PyUnicodeUCS2_AsASCIIString在pyenv-virtualenv环境中安装 Python 。

在我的情况下,它发生在matplotlib包而不是numpy(如上面的问题中),但它基本上是相同的问题。

该问题中给出的答案很简单:

针对构建为 UCS-4 的 Python 重建 NumPy。

我不知道该怎么做。在另一个问题中,据说必须使用:

但我不知道如何将该命令与pyenv一起使用。

这个问题也在pyenv's repo issue list中提到,并在评论中给出了解决方案。可悲的是(对我来说)我不明白如何应用上述评论中解释的修复程序。

所以我的问题基本上是:如何通过 将 Python 构建为 UCS-4 pyenv

0 投票
2 回答
944 浏览

c++ - 如何在 Unicode/UCS 代码点和 UTF16 代理对之间进行转换?

如何在 C++14 及更高版本中的 Unicode/UCS 代码点和 UTF16 代理对之间来回转换?

编辑:删除了对 UCS-2 代理的提及,因为没有这样的事情。谢谢@remy-lebeau

0 投票
1 回答
125 浏览

c++ - C++:实现定义的可接受的物理源文件字符

根据 C++14 标准,

§2.2.1.1 [...] 接受的物理源文件字符集是实现定义的。[...]任何不在基本源字符集中的源文件字符都被指定该字符的通用字符名替换。[...]

这是否意味着 C++ 标准没有为非 UCS/Unicode 字符提供实现定义或有条件支持的支持?例如,物理源文件编码包括没有相应 UCS 代码点的字符。

我能想到的唯一想法是,如果是这种情况(编译器通过非 UCS 编码支持非 UCS 字符),编译器必须使用私有 UCS 范围来映射这些物理字符,但无论如何,该解决方案不会适合“指定该字符的通用字符名称”部分,因为私有范围内的 UCS 代码点根本没有定义任何特定字符。