0

您好,首先感谢您的帮助。

我需要对 Java 中的大量字符串执行一些数据操作。

这是我必须修改的字符串类型的示例:

<span foreground="blue" weight="bold">accomplish</span> vt, vi, 완수하다, 성취하다, 달성하다, (학문과 기예를) 가르치다  <span foreground="blue" weight="bold">accomplish</span> a, prep, 완성한, 숙달한, 소양(교양)이 있는 

我需要做什么:

从上面的字符串中删除所有

<span..../span> 

我需要拿出:

avtviprep等等。

不带走所有字符,而只带走特定的 a、 vt vi prep其他一些字符。

编辑编辑编辑所以预期的输出将是:

    완수하다, 성취하다, 달성하다, (학문과 기예를) 가르치다 완성한, 숙달한, 소양(교양)이 있는 

我想我必须使用正则表达式,但我对这件事绝对是新手。

请问有人可以帮我吗?

谢谢

4

1 回答 1

4

与正则表达式一起使用String#replaceAll()

<span.*?/span>

.replaceAll()将正则表达式作为第一个参数,而.replace()采用String(a CharSequenceatally)。

Java代码:

String s = "<span foreground=\"blue\" weight=\"bold\">accomplish</span> vt, vi, 완수하다, 성취하다, 달성하다, (학문과 기예를) 가르치다  <span foreground=\"blue\" weight=\"bold\">accomplish</span> a, prep, 완성한, 숙달한, 소양(교양)이 있는 ";
System.out.println(s.replaceAll("<span.*?/span>", ""));

输出:

vt, vi, 완수하다, 성취하다, 달성하다, (학문과 기예를) 가르치다   a, prep, 완성한, 숙달한, 소양(교양)이 있는 


更新:

如果您需要取出更多,您可以使用|运算符将​​它们放入正则表达式中。例如:

<span.*?/span>|a,|vt,|vi,|prep,|whateverYouWantDontForgetToEscape

工作代码:

System.out.println(s.replaceAll("<span.*?/span>|a,|vt,|vi,|prep,", ""));

输出:

   완수하다, 성취하다, 달성하다, (학문과 기예를) 가르치다     완성한, 숙달한, 소양(교양)이 있는 

更新 2:

根据您刚刚发布的预期输出,您还希望删除重复的空格。为此,请使用此正则表达式:

(<span.*?/span>|a,|vt,|vi,|prep,)(\s(?<=\s))*

Java代码:

System.out.println(s.replaceAll("(<span.*?/span>|a,|vt,|vi,|prep,)(\\s(?<=\\s))*", ""));

输出:

완수하다, 성취하다, 달성하다, (학문과 기예를) 가르치다  완성한, 숙달한, 소양(교양)이 있는 
于 2013-05-17T18:44:32.207 回答