13

我今天在使用 Substring 方法时遇到了这种行为:

static void Main(string[] args) {
    string test = "123";
    for (int i = 0; true; i++) {
        try {
            Console.WriteLine("\"{0}\".Substring({1}) is \"{2}\"", test, i, test.Substring(i));
        } catch (ArgumentOutOfRangeException e) {
            Console.WriteLine("\"{0}\".Substring({1}) threw an exception.", test, i);
                break;
        }
    }
}

输出:

"123".Substring(0) is "123"
"123".Substring(1) is "23"
"123".Substring(2) is "3"
"123".Substring(3) is ""
"123".Substring(4) threw an exception.

"123".Substring(3) 返回一个空字符串,"123".Substring(4) 抛出异常。但是,“123”[3] 和“123”[4] 都超出范围。这记录在 MSDN 上,但我很难理解为什么 Substring 方法是这样编写的。我希望任何越界索引要么总是导致异常,要么总是导致空字符串。有什么见解吗?

4

4 回答 4

15

的内部实现String.Substring(startindex)是这样的

public string Substring(int startIndex)
{
    return this.Substring(startIndex, this.Length - startIndex);
}

所以你要求一个零字符长度的字符串。(AKA String.Empty)我同意你的观点,这在 MS 部分并不清楚,但没有更好的解释,我认为给出这个结果比抛出异常更好。

深入实现String.Substring(startIndex, length)我们会看到这段代码

if (length == 0)
{
    return Empty;
}

所以,因为 length=0 在第二个重载中是一个有效的输入,所以我们也得到了第一个重载的结果。

于 2012-07-28T22:33:45.857 回答
3

.Net-Substring 的文档明确指出,如果索引大于字符串的长度,则抛出异常,在“123”为 3 的情况下。

我猜原因可能是因为兼容性,要创建与 C++ 子字符串函数相同的行为。在 C++ 中,

test.substr(3)

由于 NULL 终止,将返回一个空字符串,这意味着字符串“123”实际上包含 4 个字符!(最后一个是 \0)。

这可能是具有这种行为的意图,即使每个规范的.Net 没有以 null 结尾的字符串(尽管实现实际上确实......)

于 2012-07-28T22:38:56.853 回答
1

此实现提供的一个便利是,如果您有一个循环对一些任意字符串执行某些操作(例如,返回字符串的后半部分),您不必将空字符串作为特殊情况处理。

于 2012-07-28T22:25:55.413 回答
1

不知道为什么,也想不出一个很好的理由,但我想如果你想检查一个子字符串调用是否在字符串的末尾,返回 string.Empty 比抛出异常更便宜。

另外我想你只是在索引字符之后询问字符串的一部分,这部分是空白的,而之后的索引确实超出了范围

于 2012-07-28T22:26:10.267 回答