在 Go 中获取字符串的子字符串时,不会分配新的内存。相反,子字符串的底层表示包含一个 Data 指针,它是原始字符串的 Data 指针的偏移量。
这意味着如果我有一个大字符串并希望跟踪一个小子字符串,垃圾收集器将无法释放任何大字符串,直到我释放对较短子字符串的所有引用。
切片也有类似的问题,但您可以通过使用 copy() 制作子切片的副本来解决它。我不知道有任何类似的字符串复制操作。制作子字符串的“副本”的惯用和最快的方法是什么?
例如,
package main
import (
"fmt"
"unsafe"
)
type String struct {
str *byte
len int
}
func main() {
str := "abc"
substr := string([]byte(str[1:]))
fmt.Println(str, substr)
fmt.Println(*(*String)(unsafe.Pointer(&str)), *(*String)(unsafe.Pointer(&substr)))
}
输出:
abc bc
{0x4c0640 3} {0xc21000c940 2}
我知道这是一个老问题,但有几种方法可以做到这一点,而无需创建所需数据的两个副本。
首先是创建[]byte
子字符串的 ,然后简单地将其强制为string
using unsafe.Pointer
。这是有效的,因为 a 的标头与 a 的标头[]byte
相同string
,只是最后[]byte
有一个额外的Cap
字段,所以它只是被截断。
package main
import (
"fmt"
"unsafe"
)
func main() {
str := "foobar"
byt := []byte(str[3:])
sub := *(*string)(unsafe.Pointer(&byt))
fmt.Println(str, sub)
}
第二种方法是使用reflect.StringHeader
并reflect.SliceHeader
进行更明确的标头传输。
package main
import (
"fmt"
"unsafe"
"reflect"
)
func main() {
str := "foobar"
byt := []byte(str[3:])
bytPtr := (*reflect.SliceHeader)(unsafe.Pointer(&byt)).Data
strHdr := reflect.StringHeader{Data: bytPtr, Len: len(byt)}
sub := *(*string)(unsafe.Pointer(&strHdr))
fmt.Println(str, sub)
}