问题标签 [non-ascii-characters]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

997 问题

0 投票

2 回答

8582 浏览

c# - 替换所有非 ASCII 字符，C# 中的直角字符除外

编写文件实用程序以从文件中删除所有非 ASCII 字符。我有这个正则表达式：

哪个工作正常。但不幸的是，我发现一些愚蠢的人在他们的文件中使用直角 (¬) 作为分隔符，所以这些也被删除了，但我需要那些！

我对正则表达式很陌生，我确实了解基础知识，但任何帮助都会很棒！

提前致谢！

c#regex non-ascii-characters

2010-11-15T11:16:06.710

0 投票

2 回答

1373 浏览

perl - 从 Perl 文件中删除包含非 ASCII 字符的行

我有一个文件，其中包含每小时12,000生成的 aprox 行6。在其中一些行中，有非 ascii 字符。

我希望能够运行 Perl 脚本来删除其中包含非 ASCII 字符的所有行。

perl file non-ascii-characters

2010-12-04T18:43:29.777

0 投票

2 回答

3908 浏览

file - 用于查找非 ascii 字符的 Unix 命令

我有一个 500MB 大小的文件。它有一些非ASCII字符。我只想使用 Unix 命令找出这些字符。可能会更好地获取每行的行号和位置。

谢谢：）

file unix command non-ascii-characters

2010-12-07T05:43:38.223

0 投票

10 回答

33182 浏览

python - 如何使用 urlopen 获取非 ascii url？

我需要从具有非 ascii 字符的 URL 中获取数据，但 urllib2.urlopen 拒绝打开资源并引发：

我知道 URL 不符合标准，但我没有机会更改它。

使用 Python 访问包含非 ascii 字符的 URL 指向的资源的方法是什么？

编辑：换句话说，urlopen 可以/如何打开如下 URL：

python unicode urllib2 non-ascii-characters urlopen

2010-12-08T16:06:33.360

0 投票

1 回答

390 浏览

django - Django 和本地化无法识别包含带重音符号的字符串

我正在尝试使用 django 将一些字符串从意大利语本地化为其他语言。一切正常，但不适用于包含重音字符的字符串。

原始文件和翻译后的 .po 文件都以 UTF-8 格式保存。字符串是相同的，并且 compilemessages 命令可以在没有任何警告的情况下工作。但是，当我尝试打开页面时，我没有得到这些字符串的翻译版本，只有那些。

我应该检查什么？

谢谢！

django localization diacritics non-ascii-characters

2010-12-21T20:49:52.840

0 投票

2 回答

4497 浏览

python - Google App Engine 上 Python 中的 Unicode

我需要发出一个 POST 请求，其中数据可能是非 ascii（中文、日文字符）。我需要将输入转换为 unicode 并使用 utf-8 进行编码。我是这样做的：

但是，我的日志中不断出现此错误：

TypeError：不支持解码 Unicode

python google-app-engine unicode non-ascii-characters

2010-12-22T13:32:11.617

0 投票

2 回答

973 浏览

c# - 使用 linq to XML 在 XML 文件中进行非 ASCII 字符搜索的问题

我正在使用以下 linq to xml 查询在 XML 文件中搜索元素

我的 xml 文件是

尽管Request.QueryString("DbName")等于 "Åker"，但查询不返回任何结果。

c#.net encoding linq-to-xml non-ascii-characters

2011-01-14T09:52:34.973

0 投票

3 回答

16603 浏览

python - 如何在 Python 中将 \xXY 编码字符转换为 UTF-8？

我有一个文本，其中包含诸如“\xaf”、“\xbe”之类的字符，据我从这个问题中了解到，这些字符是 ASCII 编码字符。

我想将它们在 Python 中转换为它们的 UTF-8 等价物。通常的string.encode("utf-8")投掷UnicodeDecodeError。有没有更好的方法，例如，使用codecs标准库？

此处示例200 个字符。

python unicode utf-8 character-encoding non-ascii-characters

2011-01-19T14:18:24.877

0 投票

5 回答

7760 浏览

regex - grep/regex 找不到重音词

我正在尝试安装一个正则表达式，它可以在文件中获取一些单词，其中该单词的所有字母都与单词模式匹配。

我的问题是，正则表达式找不到重音词，但在我的文本文件中有很多重音词。

我的命令行是：

文件的内容是：

我该如何解决？

regex unicode grep cat non-ascii-characters

2011-01-19T19:02:18.287

0 投票

2 回答

1159 浏览

python - 尝试调用 Google 搜索 API 时出现 Unicode 错误

我需要执行谷歌搜索来检索查询结果的数量。我在这里找到了答案 -来自 Python 应用程序的 Google 搜索

但是，对于少数查询，我收到以下错误。我认为查询有 unicode 字符。

UnicodeDecodeError：“ascii”编解码器无法解码位置 28 中的字节 0xc3：序数不在范围内（128）

我搜索了谷歌，发现我需要将 unicode 转换为 ascii，并找到下面的代码。

如果我使用操作忽略，它会删除这些字符，但如果我使用其他操作，我会遇到异常。

任何想法，如何处理这个？

谢谢

==编辑==我正在使用下面的代码进行编码，然后执行搜索，这会引发错误。

查询 = urllib.urlencode({'q': searchfor})

python unicode ascii non-ascii-characters

2011-01-24T01:18:50.310

1 2 3 4 5 6 7 8 9 10