3

我一直试图了解一些 API 方法是如何工作的

下面是 java.lang.String 类的 equals 方法的片段

有人可以告诉我代码实际上是如何比较两个字符串的。我明白计数的意义,但偏移意味着什么。这些变量如何获得值?

就像我创建一个字符串一样。这些是如何初始化的。

详细的逐行描述以及实例变量、值、计数、偏移量等初始化的方式和时间?

 public boolean equals(Object anObject) {
  1014           if (this == anObject) {
  1015               return true;
  1016           }
  1017           if (anObject instanceof String) {
  1018               String anotherString = (String)anObject;
  1019               int n = count;
  1020               if (n == anotherString.count) {
  1021                   char v1[] = value;
  1022                   char v2[] = anotherString.value;
  1023                   int i = offset;
  1024                   int j = anotherString.offset;
  1025                   while (n-- != 0) {
  1026                       if (v1[i++] != v2[j++])
  1027                           return false;
  1028                   }
  1029                   return true;
  1030               }
  1031           }
  1032           return false;
  1033       }
4

2 回答 2

9

逻辑上

while (n-- != 0) {
if (v1[i++] != v2[j++])
    return false;
}

是相同的

for (int i = 0; i < n; i++) {
    if (v1[i] != v2[j])
        return false;
    }
}

我不确定为什么 JVM 设计者会这样做。也许使用 while 循环比使用 for 循环可以提高性能。它在我看来很像 C,所以也许写这篇文章的人有 c 的背景。

Offset用于定位字符串在 char 数组中的起始位置。内部字符串存储为 char 数组。这是value

if (v1[i++] != v2[j++])
    return false;

检查字符串底层 char 数组中的字符。

并逐行是

如果引用指向同一个对象,则必须等于

1014           if (this == anObject) {
1015               return true;
1016           }

如果对象是字符串,则检查它们是否相等

1017           if (anObject instanceof String) {

将传入的参数转换为字符串。

1018               String anotherString = (String)anObject;

记住 this.string 的长度

1019               int n = count;

如果两个字符串的长度匹配

1020               if (n == anotherString.count) {

得到一个字符数组(值就是这个数组)

1021                   char v1[] = value;
1022                   char v2[] = anotherString.value;

找出这个数组中字符串的开始位置

1023                   int i = offset;
1024                   int j = anotherString.offset;

遍历 char 数组。如果值不同,则返回 false

1025                   while (n-- != 0) {
1026                       if (v1[i++] != v2[j++])
1027                           return false;
1028                   }

其他一切都必须是真的

1029                   return true;
1030               }
1031           }

如果不是 String 类型,则它们不能相等

1032           return false;
1033       }

要了解偏移量和值,请查看 String 类

/** The value is used for character storage. */
private final char value[];

/** The offset is the first index of the storage that is used. */
private final int offset;

/** The count is the number of characters in the String. */
private final int count;

构造函数初始化这些变量。默认构造函数代码如下。对于其他构造函数,您应该会看到类似的内容。

/**
  * Initializes a newly created {@code String} object so that it represents
  * an empty character sequence.  Note that use of this constructor is
  * unnecessary since Strings are immutable.
  */
 public String() {
    this.offset = 0;
    this.count = 0;
    this.value = new char[0];
 }

是一个很好的链接

于 2012-09-30T12:52:29.777 回答
0

正如您可能知道的那样,Java 中的字符串处理是一种特殊情况,大多数情况下,字符串是从字符串池中分配的,因此对于 char 数组"I am Learning Java",一个字符串引用指向"I am Learning Java",然后偏移量可能是0,其他字符串可能指向"am"这样的偏移量2由于一些本机代码处理其初始化,所以我认为在该过程中设置了偏移量。(在从字符串池共享内存期间)

从代码中也可以看出

 public String(String original) {
         int size = original.count;
        char[] originalValue = original.value;
        char[] v;
        if (originalValue.length > size) {
            // The array representing the String is bigger than the new
          // String itself.  Perhaps this constructor is being called
            // in order to trim the baggage, so make a copy of the array.
           int off = original.offset;
          v = Arrays.copyOfRange(originalValue, off, off+size);
        } else {
           // The array representing the String is the same
          // size as the String, so no point in making a copy.
            v = originalValue;
       }
      this.offset = 0;
       this.count = size;
       this.value = v;
    }

当从旧字符串创建新字符串时,可能是旧字符串(在这种情况下为原始字符串)可能来自字符串池,这就是为什么首先获取偏移量然后复制整个数组以分配新内存(新字符串不共享来自字符串池的内存)

您还应该记住 String 是派生类型,并且字符串始终存储在字符数组中,因此我们需要一个偏移量来确定字符串在字符数组中的起始位置。

于 2012-09-30T12:52:42.170 回答