7

在 MRI 中,它似乎rb_id2str()负责在您调用时完成所有工作Symbol#to_s。我惊讶地发现这是一个非常神秘的功能,因为我认为这是一个相当简单的操作。

我正在寻找有关此功能正在做什么的详细说明。作为参考,这里是 1.9.3 中源代码的链接:

http://rxr.whitequark.org/mri/source/parse.y?v=1.9.3-p195#9950

一些具体问题:

四大if板块在做什么?

  1. if (id < tLAST_TOKEN)
  2. if (id < INT_MAX && rb_ispunct((int)id))
  3. if (st_lookup(global_symbols.id_str, id, &data))
  4. if (is_attrset_id(id))

对 if 语句中每个代码块的作用有一个通用的概述会很棒,但它不需要逐行分析。

最后,我很好奇内存/垃圾收集的含义to_s:调用是否会Symbol#to_s创建一个每次都必须进行垃圾收集的新字符串,或者是否有类似内部写时复制优化的东西,它使用对实习表示的引用直到对字符串进行突变之前的符号?

4

1 回答 1

1

一方面,我很确定 Symbol#to_s 创建了一个新字符串。大多数 ruby​​ 类都是 C 结构,除了 TrueClass、FalseClass、NilClass、Fixnum 和 Symbol,它们在 C 中是 int。所以 Symbol 与 String 完全不同(这就是为什么推荐使用 Symbol,除非你需要大量更改值) .

我不确定你是否知道《Ruby Hacking Guide》这本书,它解释了很多关于 MRI 如何在 C 中实现的内容。

仅供参考,Ruby Hacking Guide 是用日文写的,到现在还只有一小部分被翻译了,看来大家已经放弃了。http://rhg.rubyforge.org/

于 2012-11-15T11:06:01.910 回答