1

好的,我会尝试解释这个问题,尽管这会有点困难。

我正在尝试从包含坐标的某个页面解析一些信息。和复制粘贴给你这样的东西:

距离位置
5.8 ‎(77|-2)‎<br> 6.3 ‎(76|-1)‎<br> 7.8 ‎( 76|6)‎<br> 9.2 ‎(91|3)‎<br> 9.5 ‎(79| 10)‎<br> 12.2 ‎(80|13)‎<br> 15 ‎(82|-14)‎< br> 15 ‎(81|16)‎

现在我遇到的问题是在“(”和数字之间有一个身份不明的字符,如果你按右箭头键它不会移动,但如果你按几次它就会移动。

我在任何地方都没有遇到过这件事,如果有帮助的话,该网站在 php 中。如果在我复制粘贴信息时有帮助,字符会消失,我可以在文本中自由移动。

请帮助我解决这个问题,因为它导致我的软件出现故障,因为我试图将坐标解析为一个 int 并且因为那个 char 它不会让我这样做,它会给我一个格式异常。

4

1 回答 1

2

在 UTF-8 中查看时,我什么也看不到,在将编码更改为 ANSI 时,我只剩下:

5.8 ‎‭(‭‭77‬‬|‭-‭2‬‬)‬‎
6.3 ‎‭(‭‭76‬‬|‭-‭1‬‬)‬‎
7.8 ‎‭(‭‭76‬‬|‭‭6‬‬)‬‎
9.2 ‎‭(‭‭91‬‬|‭‭3‬‬)‬‎
9.5 ‎‭(‭‭79‬‬|‭‭10‬‬)‬‎
12.2 ‎‭(‭‭80‬‬|‭‭13‬‬)‬‎
15 ‎‭(‭‭82‬‬|‭-‭14‬‬)‬‎
15 ‎‭(‭‭81‬‬|‭‭16‬‬)‬‎

您似乎使用了从左到右的标记(“Ž”),并且编码被交换了一次或两次。

你可以清理它,因为它来自一个网站。我的第一个猜测是您的浏览器设置不正确(编码设置错误)。

您仍然可以尝试清洁它。

代码:

Regex rgx = new Regex("[^a-zA-Z0-9_\n %\[\]\.\(\)%&-]");
data = rgx.Replace(data, "");
于 2013-08-06T18:19:00.040 回答