处理 RTF 文件的文本语料库并观察结果,我发现了字符串e_SSLq
,位于句子的开头,只有一个结尾引号'
。谷歌搜索了一下,我发现一些网页与句子相同,只有一个结尾引号,甚至还有一个网页也有一个e_SSRq
结尾引号。这表明SSL
与加密无关,但e_SSLq
代表e_SS
左引号。这是 RTF 文件的摘录:
\loch\af2\dbch\af2\hich\f2\cf3\noproof e_SSLqHet is hier zo stil dat het pijn doet aan de oren.''
旁注:Het is hier zo stil dat het pijn doet aan de oren.
是荷兰语This silence hurts the ears.
很可能e_SSLq
是来自排版系统的命令无法正确转换,我将通过正则表达式简单地解决它。但我很好奇e_SS
代表什么。我可以把它想象成类似Swedish Single
orSlovak Single
或特定类型的引用。但我似乎找不到它。
结束引号转换为U+0027 : APOSTROPHE {single quote; APL quote}
.
知道的请告诉我它来自什么系统,以及它的含义。
例子 ...
...我也发现了这个怪癖的网站。