Go 编程语言中这个循环的计算复杂度是多少?
var a []int
for i := 0 ; i < n ; i++ {
a = append(a, i)
}
append
是在线性时间内运行(重新分配内存并在每次追加时复制所有内容),还是在摊销的常数时间内运行(就像许多语言中向量类的实现方式)?
Go 编程语言中这个循环的计算复杂度是多少?
var a []int
for i := 0 ; i < n ; i++ {
a = append(a, i)
}
append
是在线性时间内运行(重新分配内存并在每次追加时复制所有内容),还是在摊销的常数时间内运行(就像许多语言中向量类的实现方式)?
Go 编程语言规范说,append
如果需要,内置函数会重新分配。
如果 s 的容量不足以容纳附加值,则 append 分配一个新的、足够大的片,该片既适合现有的片元素又适合附加值。因此,返回的切片可能引用不同的底层数组。
必要时,为追加增长目标切片的精确算法取决于实现。当前的gc
编译器算法见growslice
Goruntime
包slice.go
源文件中的函数。它是摊销的常数时间。
在某种程度上,增长量切片计算如下:
newcap := old.cap
doublecap := newcap + newcap
if cap > doublecap {
newcap = cap
} else {
if old.len < 1024 {
newcap = doublecap
} else {
for newcap < cap {
newcap += newcap / 4
}
}
}
附录
Go 编程语言规范允许语言的实现者以多种append
方式实现内置函数。
例如,新分配只需“足够大”。分配的数量可以是 parsimonius,分配最小必要的量,也可以是慷慨的,分配超过最小必要量以最小化多次调整大小的成本。Gogc
编译器使用慷慨的动态数组摊销常数时间算法。
以下代码说明了append
内置函数的两种合法实现。gc
慷慨的常量函数实现了与 Go编译器相同的分摊常量时间算法。parsimonius 变量函数,一旦初始分配被填满,每次都会重新分配和复制所有内容。Goappend
函数和 Gogccgo
编译器用作控件。
package main
import "fmt"
// Generous reallocation
func constant(s []int, x ...int) []int {
if len(s)+len(x) > cap(s) {
newcap := len(s) + len(x)
m := cap(s)
if m+m < newcap {
m = newcap
} else {
for {
if len(s) < 1024 {
m += m
} else {
m += m / 4
}
if !(m < newcap) {
break
}
}
}
tmp := make([]int, len(s), m)
copy(tmp, s)
s = tmp
}
if len(s)+len(x) > cap(s) {
panic("unreachable")
}
return append(s, x...)
}
// Parsimonious reallocation
func variable(s []int, x ...int) []int {
if len(s)+len(x) > cap(s) {
tmp := make([]int, len(s), len(s)+len(x))
copy(tmp, s)
s = tmp
}
if len(s)+len(x) > cap(s) {
panic("unreachable")
}
return append(s, x...)
}
func main() {
s := []int{0, 1, 2}
x := []int{3, 4}
fmt.Println("data ", len(s), cap(s), s, len(x), cap(x), x)
a, c, v := s, s, s
for i := 0; i < 4096; i++ {
a = append(a, x...)
c = constant(c, x...)
v = variable(v, x...)
}
fmt.Println("append ", len(a), cap(a), len(x))
fmt.Println("constant", len(c), cap(c), len(x))
fmt.Println("variable", len(v), cap(v), len(x))
}
输出:
GC:
data 3 3 [0 1 2] 2 2 [3 4]
append 8195 9152 2
constant 8195 9152 2
variable 8195 8195 2
gccgo:
data 3 3 [0 1 2] 2 2 [3 4]
append 8195 9152 2
constant 8195 9152 2
variable 8195 8195 2
总而言之,根据实现,一旦初始容量被填满,append
内置函数可能会或可能不会在每次调用时重新分配。
参考:
如果 s 的容量不足以容纳附加值,则
append
分配一个新的、足够大的片,该片既适合现有的片元素又适合附加值。因此,返回的切片可能引用不同的底层数组。规范(在提示和 1.0.3 中)指出:
“如果 s 的容量不足以容纳附加值,则
append
分配一个新的、足够大的切片,该切片既适合现有切片元素又适合附加值。因此,返回的切片可能引用不同的底层数组。”这应该是“当且仅当”吗?例如,如果我知道我的 slice 的容量足够长,我能保证不会更改底层数组吗?
是的,你很放心。
运行时slice.go源文件
它不会在每个追加时重新分配,并且在文档中非常明确地说明:
如果 s 的容量不足以容纳附加值,则 append 分配一个新的、足够大的片,该片既适合现有的片元素又适合附加值。因此,返回的切片可能引用不同的底层数组。
因此,摊销的常数时间是所问的复杂性。