我在社交媒体中发现了一些“有趣”的字符(例如 ḓ̵̙͎̖̯̞̜̞̪̠ 和 •̩̩̩̩̩̩̩̩̩̩),这些字符占用了不止一行。首先,我认为这是 Firefox 的错误。我在 Gedit 和 LibreOffice Writer 中尝试过,它们都是一样的。那么,这究竟是什么?实际上我是在询问字符编码和渲染。
我试图在 GNOME 字符图中找到该字符,但找不到。
我试图用 unicode(可能是 UTF-8)检查它们的字符代码。似乎他们需要不止一个角色。为什么一个字符不止一个字符?这是使用 Python 的结果。
角色ḓ̵̙͎̖̯̞̜̞̪̠</p>
u'\u2022\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329
\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329\u0329'
性格•̩̩̩̩̩̩̩̩̩̩</p>
u'\u1e13\u0335\u0319\u034e\u0316\u032f\u031e\u031c\u031e\u032a\u0320\u033c\u031e
\u0320\u034e\u033c\u0353\u034b\u036e\u034c\u0346\u0300\u035c\u0345'