1

我有一个基于分隔符"(双引号)搜索的字符串。

因此,当我输入字符串时"program",它能够根据分隔符搜索字符串的开头和结尾,并返回我放入向量中的字符串程序。

现在,如果我输入一个字符串"program"123"",它会返回我的子字符串,如program, 123, 123"

现在我想要的结果program"123"是根据用例它是一个有效的字符串,但它包含"作为字符串的一部分,这是通过分隔符搜索无法区分字符串的开头和结尾的地方。

有人可以帮助一些逻辑吗?

以下是我正在使用的方法。

enter code here

public static PVector tokenizeInput(final String sCmd) throws ExceptionOpenQuotedString { if (sCmd == null) { return null; }

    PVector rc = new PVector();

    if (sCmd.length() == 0)
    {
        rc.add(StringTable.STRING_EMPTY);
        return rc;
    }

    char chCurrent = '\0';
    boolean bInWhitespace = true;
    boolean bInQuotedToken = false;
    boolean bDelim;
    int start = 0;
    int nLength = sCmd.length();

    for (int i = 0; i < nLength; i++)
    {
        chCurrent = sCmd.charAt(i); // "abcd "ef"" rtns abdc ef ef"
        bDelim = -1 != APIParseConstants.CMD_LINE_DELIMS.indexOf(chCurrent);

        if (bInWhitespace) // true
        {
            // In whitespace
            if (bDelim)
            {
                if ('\"' == chCurrent)
                {
                    start = i + 1;
                    bInQuotedToken = true;
                    bInWhitespace = false;
                } // if ('\"' == chCurrent)
            }
            else
            {
                start = i;
                bInWhitespace = false;
            } // else - if (bDelim)
        }
        else
        {
            // Not in whitespace
            boolean bAtEnd = i + 1 == nLength;
            if (!bDelim)
            {
                continue;
            }
            else
            {
                if ('\"' == chCurrent)
                {
                    if (!bInQuotedToken)
                    {
                        // ending current token due to '"'
                        if (bAtEnd)
                        {
                            // non terminated quoted string at end...
                            throw new ExceptionOpenQuotedString(
                                    sCmd.substring(start));
                        }
                        else
                        {
                            rc.add(sCmd.substring(start, i)); // include quote
                            bInQuotedToken = true;
                            bInWhitespace = false;
                        } // if (bAtEnd)
                    }
                    else
                    {
                        // ending quoted string
                        //if (!bAtEnd)
                        {
                            rc.add(sCmd.substring(start, i)); // don't include quote
                            bInQuotedToken = false;
                            bInWhitespace = true;
                        } // if (bAtEnd)
                    } // else - if (!bInQuotedToken)
                }
                else
                {
                    // got delim (not '"')
                    if (!bAtEnd && !bInQuotedToken)
                    {
                        rc.add(sCmd.substring(start, i));
                        bInWhitespace = true;
                    } // if (bAtEnd)
                } // else - if ('\"' == chCurrent)
            } // else - if (!bDelim)
        } // else - if (bInWhitespace)
    } // for (short i = 0; i < nLength; i++)

    if (!bInWhitespace && start < nLength)
    {
        if (!bInQuotedToken || chCurrent == '"')
        {
            rc.add(sCmd.substring(start));
        }
        else
        {
            throw new ExceptionOpenQuotedString(sCmd.substring(start));
        } // else - if (!bInQuotedToken)
    } // if (!bInWhitespace && start < nLength)
    return rc;
}
4

2 回答 2

1

您应该转义内部 "。否则,您可以检查第一个和最后一个 " 字符的位置,并使用这些位置作为分隔符拆分/剪切字符串。

于 2012-06-26T10:58:55.967 回答
0

每当您将一种编码(所有可能的字符串)嵌入到另一种(带引号的字符串)中时,只有一些基本技术可以让您明确地解析它们:

  1. 禁止某些输入。例如,不允许使用引号字符。现在您知道它们始终是分隔符。在您的情况下,您可以选择除引号之外的新分隔符,并在您的输入中禁止该分隔符。这很少是可取的,因为您通常最终想要允许您以前认为不需要的输入。

  2. 在编码中包含输入的长度。例如,您可以在每个字符串之前加上其中的字符数,而不是引号。

  3. 逃跑。有些输入不能直接表示。相反,至少保留一个字符作为转义字符。它表明它后面的任何内容都应该以不同的方式解释。在 Java 字符串中,反斜杠是转义字符。如果您仅出于单一原因需要转义字符,则可能需要遵循某些 SQL 方言的示例并将其加倍。在 SQL 中,引号是字符串的引号字符,因此要在字符串中包含文字引号字符,您需要键入两个引号。

于 2012-06-26T11:14:09.033 回答