0

我有一个字符串属性。

典型值为<p>foo — that's an em dash</p>.

我需要将其转换为<p>foo &mdash; that's an em dash</p>.

也就是说,我需要原封不动的 HTML 标签,但要编码的未编码实体。理想情况下,输出为utf-8.

这是为了防止此类重复错误:

Encoding::UndefinedConversionError: "\xE2" from ASCII-8BIT to UTF-8 - 0 failed attempts

我尝试了 , 和 的各种化身gsubforce_encodingNokogiri没有运气。也许其中之一是朝着正确方向迈出的一步,但我没有做对所有事情?

我应该怎么办?

4

0 回答 0