3

目前我正在用空格分割一个字符串。但是,当我将它们全部重新组合在一起时,我想保留一些双重空格。关于如何做到这一点的任何建议?

即字符串"I went to the beach. I ate pie"被分割为

I
went
to
the
beach.

I
ate
pie

我不想要空白条目,但我想将它们重新组合成相同的格式。谢谢大家!

4

5 回答 5

3

做一个 String replaceAll(" ", "likelyCharacterSequence") 然后像往常一样用空格分割你的字符串。然后,您可以通过将 {unlikelyCharacterSequence} 替换为末尾的“”来转换回双倍空格。

但是:如果您在实际未修改的字符串中遇到“不太可能”的字符序列,这将失败。如需更通用的解决方案,请查看此示例下方列出的替代方案。

示例(警告,取决于不存在 !@#!@# :

String example = "Hello.  That was a double space. That was a single space."
String formatted = example.replace("  ", " !@#!@#");
String [] split = formatted.split(" ");
for(int i = 0; i < split.length; i++)
{
  split.replace("!@#!@#", " ");
}
// Recombine your splits?

或者,您可以采取更强大的策略来重新组合您在问题中使用的字符串,但忽略仅包含一个空格的元素:

String example = "ThisShouldBeTwoElements.  ButItIsNot.";
String [] splitString = example.split(" ");
String recombined = "";
for(int i = 0; i < splitString.length; i++)
{
  if(!splitString[i].equals(" "))
    recombined += splitString[i];
}
于 2012-07-03T18:22:00.920 回答
2
String st = "I went to the beach.  I ate pie";
st.split("\\s{1}(?!\\s)");

这导致

[I, went, to, the, beach. , I, ate, pie]

我还建议查看http://docs.oracle.com/javase/6/docs/api/和/或http://www.regular-expressions.info/java.html,以便您了解这是在做什么。

于 2012-07-03T18:50:42.250 回答
1

好好看看 Java 的 Regex 可以为您做什么。有一种方法可以使用正则表达式重新识别模式。

Java 正则表达式示例

于 2012-07-03T18:21:13.680 回答
1

试试这个,它应该删除非空白字符之间的所有空白。

myString = myString.replaceAll("\S\s\S", "");

当它们在两个单词之间出现不止一次时,这将保留空格。

于 2012-07-03T18:30:32.773 回答
1

我知道这是一个老问题,但为了未来观众的利益:您正在寻找的概念是“捕获群体”。捕获组允许您引用表达式中的匹配项并在以后检索它们,例如通过反向引用,而不是吞下字符串。

从文档中,这是您需要了解的相关语法:

(?<name>X)          X, as a named-capturing group
(?:X)               X, as a non-capturing group
(?idmsuxU-idmsuxU)  Nothing, but turns match flags i d m s u x U on - off
(?idmsux-idmsux:X)  X, as a non-capturing group with the given flags i d m s u x on - off
(?=X)               X, via zero-width positive lookahead
(?!X)               X, via zero-width negative lookahead
(?<=X)              X, via zero-width positive lookbehind
(?<!X)              X, via zero-width negative lookbehind
(?>X)               X, as an independent, non-capturing group

使用输入文本:

String example = "ABC     DEF     GHI J K";

您可以使用正负前瞻组合将尾随空格与每个单词组合:

// Result: [ABC     , DEF     , GHI , J , K]
example.split("(?<=\\s+)(?!\\s)");

或者,您可以使用正向前瞻来捕获单词边界,以将空格保留为单独的分组元素:

// Result: [ABC,      , DEF,      , GHI,  , J,  , K]
example.split("(?=\\b)");

Java 模式 API:
http ://docs.oracle.com/javase/7/docs/api/java/util/regex/Pattern.html



旁注:虽然“用完全不可信的东西替换文本”的建议很诱人,因为它很容易,但永远不要在生产代码中这样做。它最终会失败,而且它发生的频率比你想象的要多。在一名程序员使用了大约 80 列“~=$~=$~=$...”并认为这是安全的之后,我调试了一个呼叫中心。这持续了几个月,直到一位服务代表用这个序列在他的笔记上保存了一个“花哨的边界”。我什至在搜索服务器上目睹了真正的随机 MD5 冲突。诚然,MD5 碰撞花了 11 年时间,但它仍然使搜索崩溃,重点仍然存在。唯一的字符串永远不会。始终假设会出现重复项。

于 2015-02-26T06:17:28.643 回答