12

据我了解,Nim 中的字符串基本上是一个可变的字节序列,并且它们在分配时被复制。

鉴于此,我假设它sizeof会告诉我(如len)字节数,但它总是8在我的 64 位机器上给出,所以它似乎持有一个指针。

鉴于此,我有以下问题......

  • 复制作业的动机是什么?是因为它们是可变的吗?

  • 是否有过分配时不复制的时候?(我假设非var函数参数不会复制。还有其他吗?)

  • 它们是否进行了优化,以至于只有在/当它们发生突变时才真正被复制?

  • 字符串和序列之间是否有任何显着差异,或者上述问题的答案是否可以同样适用于所有序列?

  • 一般还有什么值得注意的吗?

谢谢!

4

1 回答 1

14

字符串的定义实际上是 in system.nim,只是在另一个名称下:

type
  TGenericSeq {.compilerproc, pure, inheritable.} = object
    len, reserved: int
  PGenericSeq {.exportc.} = ptr TGenericSeq
  UncheckedCharArray {.unchecked.} = array[0..ArrayDummySize, char]
  # len and space without counting the terminating zero:
  NimStringDesc {.compilerproc, final.} = object of TGenericSeq
    data: UncheckedCharArray
  NimString = ptr NimStringDesc

因此,字符串是指向带有len,reserveddata字段的对象的原始指针。字符串的过程在sysstr.nim中定义。

默认情况下,字符串赋值的语义已被选择为与 Nim 中的所有值类型(不是 ref 或 ptr)相同,因此您可以假设赋值创建一个副本。当不需要副本时,编译器可以将其排除在外,但我不确定到目前为止发生了多少。将字符串传递到 proc 不会复制它们。没有任何优化可以防止字符串复制,直到它们发生突变。序列的行为方式相同。

您可以通过将字符串和序列标记为浅层来更改它们的默认分配行为,然后在分配时不进行复制:

var s = "foo"
shallow s
于 2015-04-02T11:11:54.847 回答