我有一个奇怪的问题。我使用 tinyMCE 编辑器构建 HTML 格式的字符串。带格式的字符串如下所示:
<p>$ Ag$: s: p:</p>
然后我通过 system() 调用将这段代码发送到我的 Java 类,该类只打印出位置、字符及其 int 值。
POS: 0 CHAR:'<' NUM: 60
POS: 1 CHAR:'p' NUM: 112
POS: 2 CHAR:'>' NUM: 62
POS: 3 CHAR:'$' NUM: 36
POS: 4 CHAR:' ' NUM: 32
POS: 5 CHAR:'�' NUM: 194
POS: 6 CHAR:'�' NUM: 160
POS: 7 CHAR:' ' NUM: 32
POS: 8 CHAR:'�' NUM: 194
POS: 9 CHAR:'�' NUM: 160
POS: 10 CHAR:' ' NUM: 32
POS: 11 CHAR:'�' NUM: 194
POS: 12 CHAR:'�' NUM: 160
POS: 13 CHAR:'A' NUM: 65
POS: 14 CHAR:'g' NUM: 103
POS: 15 CHAR:'$' NUM: 36
POS: 16 CHAR:':' NUM: 58
POS: 17 CHAR:' ' NUM: 32
POS: 18 CHAR:'�' NUM: 194
POS: 19 CHAR:'�' NUM: 160
POS: 20 CHAR:' ' NUM: 32
POS: 21 CHAR:'�' NUM: 194
POS: 22 CHAR:'�' NUM: 160
POS: 23 CHAR:' ' NUM: 32
POS: 24 CHAR:'�' NUM: 194
POS: 25 CHAR:'�' NUM: 160
POS: 26 CHAR:'s' NUM: 115
POS: 27 CHAR:':' NUM: 58
POS: 28 CHAR:' ' NUM: 32
POS: 29 CHAR:'�' NUM: 194
POS: 30 CHAR:'�' NUM: 160
POS: 31 CHAR:' ' NUM: 32
POS: 32 CHAR:'�' NUM: 194
POS: 33 CHAR:'�' NUM: 160
POS: 34 CHAR:' ' NUM: 32
POS: 35 CHAR:'�' NUM: 194
POS: 36 CHAR:'�' NUM: 160
POS: 37 CHAR:' ' NUM: 32
POS: 38 CHAR:'�' NUM: 194
POS: 39 CHAR:'�' NUM: 160
POS: 40 CHAR:' ' NUM: 32
POS: 41 CHAR:'�' NUM: 194
POS: 42 CHAR:'�' NUM: 160
POS: 43 CHAR:'p' NUM: 112
POS: 44 CHAR:':' NUM: 58
POS: 45 CHAR:'<' NUM: 60
POS: 46 CHAR:'/' NUM: 47
POS: 47 CHAR:'p' NUM: 112
POS: 48 CHAR:'>' NUM: 62
我需要做的就是保留 HTML 中的所有空格,除了美元符号之间的空格 - $$ 之间的所有内容都应该被修剪。但是当我在它上面调用 trim() 时,什么都没有发生,并且 $$ 里面的部分仍然没有被修剪。
我想,这是由于奇怪的空间编码(194、160)?
文本应为 UTF-8。
感谢您的任何帮助