我有一个字符串属性。
典型值为<p>foo — that's an em dash</p>
.
我需要将其转换为<p>foo — that's an em dash</p>
.
也就是说,我需要原封不动的 HTML 标签,但要编码的未编码实体。理想情况下,输出为utf-8
.
这是为了防止此类重复错误:
Encoding::UndefinedConversionError: "\xE2" from ASCII-8BIT to UTF-8 - 0 failed attempts
我尝试了 , 和 的各种化身gsub
,force_encoding
但Nokogiri
没有运气。也许其中之一是朝着正确方向迈出的一步,但我没有做对所有事情?
我应该怎么办?