问题标签 [unidecoder]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
550 浏览

ruby - 捕获 undecoder 异常的问题

我正在尝试使用 undecoder gem,它给我一些字符串带来了问题:

#: (C:/Ruby193/lib/ruby/gems/1.9.1/gems/unidecoder-1.1.1/lib/unidecoder/data/x00.yml): 在第 2 行解析引号 d 标量时发现未知转义字符第 3 列来自 C:/Ruby193/lib/ruby/1.9.1/psych.rb:203:in parse' from C:/Ruby193/lib/ruby/1.9.1/psych.rb:203:inparse_stream' 来自 C:/Ruby193/lib/ruby/1.9.1/psych.rb:151:in parse' from C:/Ruby193/lib/ruby/1.9.1/psych.rb:127:inload' 来自 C :/Ruby193/lib/ruby/1.9.1/psych.rb:297:in block in load_file' from C:/Ruby193/lib/ruby/1.9.1/psych.rb:297:inopen' 来自 C:/Ruby193/lib/ruby/1.9.1/psych.rb:297:in load_file' from C:/Ruby193/lib/ruby/gems/1.9.1/gems/unidecoder-1.1.1/lib/unidecoder.rb:8:in block in '来自 C:/Ruby193 /lib/ruby/gems/1.9.1/gems/unidecoder-1.1.1/lib/unidecoder.rb:78:in yield' from C:/Ruby193/lib/ruby/gems/1.9.1/gems/unidecoder-1.1.1/lib/unidecoder.rb:78:in default' 来自 C:/Ruby193/lib/ruby/gems/1.9.1/gems/unidecoder- 1.1.1/lib/unidecoder.rb:78:in decode_char' from C:/Ruby193/lib/ruby/gems/1.9.1/gems/unidecoder-1.1.1/lib/unidecoder.rb:39:in block in decode' 来自 C:/Ruby193/lib/ruby/gems/1.9.1/gems/unidecoder-1.1.1/lib/unidecoder.rb:37:in gsub' from C:/Ruby193/lib/ruby/gems/1.9.1/gems/unidecoder-1.1.1/lib/unidecoder.rb:37:in 从 C:/Ruby193/lib/ruby/gems/1.9.1/gems/unidecoder-1.1.1/lib/unidecoder.rb:16:in 解码 to_ascii' from (irb):21 from C:/Ruby193/bin/irb:12:in'>>

更糟糕的是,我无法通过以下方式捕获错误:

有谁知道这里发生了什么?

0 投票
3 回答
151 浏览

python - 文本文件中“for循环”的替代品

现在,我收到一条错误消息,说在写入模式下不允许循环。有没有其他方法,我可以像这样修改每一行,以便可以使用 unidecode 进行转换?

0 投票
1 回答
126 浏览

ruby-on-rails - CSV 上传期间的运行方法

我在下面有一个简单的 CSV 上传器,它正在逐行创建一条新记录(事件)。我还使用了 undecoder gem,并希望to_ascii在 CSV 上传器创建的每条记录中的字段(描述字段)上调用该方法。听起来应该很简单,但我不熟悉遍历 CSV 文件。

上传者:

正确的实现方式:

谢谢!

0 投票
1 回答
4180 浏览

ruby-on-rails - "\x9D" to UTF-8 in conversion from Windows-1252 to UTF-8

I have created a csv uploader on my rails app, but sometimes I get an error of

"\x9D" to UTF-8 in conversion from Windows-1252 to UTF-8

This is the source to my uploader:

I am using the unidecode gem (https://github.com/norman/unidecoder) to normalize any goofy characters that a user may input. I've ran into this error a few times, but can't determine how to fix it. I thought the encoding: "windows-1252:utf-8" line would fix the problem, but nothing there.

Thanks stack!

0 投票
1 回答
2185 浏览

mongodb - 如何在 Mongo DB 中保存非 ASCII 字符

这个问题被重复了,但我在我的上下文中找不到问题的答案。我正在尝试Aéropostale在 mongo DB 中另存为字符串:

保存对象时,出现以下错误:

UnicodeDecodeError:“ascii”编解码器无法解码位置 2 中的字节 0xd1:序数不在范围内(128)

如何继续以原始格式保存字符串并以相同格式检索?

0 投票
1 回答
105 浏览

python - Eksport unidecode 国际字符 ascii 等价物数据库

如何从unidecodepython 模块导出数据以用于另一种语言?

该模块将 unicode 字符转换为拉丁 (ascii) 字符,大致保留语音含义,如下所示:

例如,这对于为国际网页创建 URL-s 很有用。有其他语言的端口,例如 UnidecodeSharp,但质量不是很好。

0 投票
1 回答
294 浏览

python - 使用 pyinstaller 时统一解码不一致的行为

我正在构建一个从网站读取信息并对其进行操作的脚本。

页面可能包含一些特殊字符,如 ã、ç、ó 等。

为了简化解码问题,我使用unidecode,如下所示:

上面的代码从控制台执行时,即python test.py生成结果为:

但是,如果我使用 pyinstaller 构建一个 exe:

并运行它,代码生成:

在此处输入图像描述

如何使 pyinstaller exe 的行为类似于控制台?

0 投票
1 回答
1025 浏览

django - 如何让 Django prepopulated_fields 与中文一起工作?

我的项目中包含一个名为 unidecode 的 python 包,它可以很好地解码汉字。但是当我在我的 Django 项目中使用它时,prepopulated_fields 并不能与中文一起使用。

版本信息:django 1.86,Python 3.4

模型.py

管理员.py

当我输入一些汉字时,我希望看到 slug 字段像这样自动填充: 在此处输入图像描述

但事实是,在 Django admin 中,slug 字段不会被任何这样的字符自动填充: 在此处输入图像描述

0 投票
1 回答
657 浏览

python - 在 django slug 字段中使用外语不起作用

这个问题可能有点大,我将尝试解释发生的一切。下面是我的标题模型,它通过标题填充 slug 字段本身:

我的标题是外语(具体是尼泊尔语)下面是我的管理面板的图像,用于填充标题类 标题类

如您所见,我的标题是外语的,但是我的 slug 字段是通过将该标题转换为我不想要的英语来自动填充的,我希望我的 slug 字段以与我的标题字段相同的语言填充。我做到了一些搜索和一个名为 unidecode 的模块可能是它的解决方案,我也尝试使用它,但由于它的文档不是很好,我无法理解它。所以如果有任何其他解决方案或如何正确使用 unidecode ?任何帮助或线索将不胜感激

0 投票
1 回答
6664 浏览

python - Pandas 将 unidecode 应用于几列

我正在尝试将两个熊猫系列的所有元素从熊猫数据框(不是 ascii 字符)转换为 ascii。简单地将函数应用于相关列是行不通的。Python 仅显示属性错误,指出“系列”对象没有属性编码。