197

如果元组是不可变的,那么为什么它可以包含可变项?

当一个可变项(如列表)被修改时,它所属的元组保持不可变,这似乎是一个矛盾。

4

8 回答 8

227

这是一个很好的问题。

关键的见解是元组无法知道其中的对象是否可变。使对象可变的唯一方法是拥有一个更改其数据的方法。一般来说,没有办法检测到这一点。

另一个见解是 Python 的容器实际上并不包含任何东西。相反,它们保留对其他对象的引用。同样,Python 的变量与编译语言中的变量不同。相反,变量名称只是名称空间字典中的键,它们与相应的对象相关联。Ned Batchhelder 在他的博客文章中很好地解释了这一点。无论哪种方式,对象只知道它们的引用计数;他们不知道这些引用是什么(变量、容器或 Python 内部)。

这两个见解一起解释了您的谜团(为什么当底层列表发生变化时,“包含”列表的不可变元组似乎会发生变化)。事实上,元组并没有改变(它对其他对象的引用仍然与之前相同)。元组不能改变(因为它没有变异方法)。当列表更改时,元组没有收到更改通知(列表不知道它是由变量、元组还是另一个列表引用)。

当我们讨论这个话题时,这里有一些其他想法可以帮助您完成关于元组是什么、它们如何工作以及它们的预期用途的心理模型:

  1. 元组的特征较少在于它们的不变性,而更多地在于它们的预期目的。
    元组是 Python 在一个屋檐下收集异构信息的一种方式。例如, s = ('www.python.org', 80) 将字符串和数字组合在一起,以便主机/端口对可以作为套接字(复合对象)传递。从这个角度来看,拥有可变组件是完全合理的。

  2. 不变性与另一个属性hashability 密切相关。但是哈希性并不是一个绝对的属性。如果元组的组件之一不可散列,则整个元组也不可散列。例如,t = ('red', [10, 20, 30])不可散列。

最后一个示例显示了一个包含字符串和列表的 2 元组。元组本身不是可变的(即它没有任何改变其内容的方法)。同样,字符串是不可变的,因为字符串没有任何变异方法。列表对象确实具有变异方法,因此可以更改。这表明可变性是对象类型的一个属性——有些对象具有可变方法,有些则没有。这不会因为对象是嵌套的而改变。

记住两件事。首先,不变性不是魔术——它只是缺少变异方法。其次,对象不知道哪些变量或容器引用了它们——它们只知道引用计数。

希望,这对你有用:-)

于 2012-03-18T04:36:42.753 回答
179

那是因为元组包含列表、字符串或数字。它们包含对其他对象的引用1无法更改元组包含的引用序列并不意味着您不能改变与这些引用关联的对象。2

1.对象、值和类型(参见:倒数第二段)
2.标准类型层次结构(参见:“不可变序列”)

于 2012-03-18T04:39:24.407 回答
17

据我了解,这个问题需要重新表述为一个关于设计决策的问题:为什么 Python 的设计者选择创建一个可以包含可变对象的不可变序列类型?

要回答这个问题,我们必须考虑元组的用途:它们用作快速通用的序列。考虑到这一点,很明显为什么元组是不​​可变的,但可以包含可变对象。以机智:

  1. 元组快速且内存高效:元组比列表创建速度更快,因为它们是不可变的。不变性意味着可以使用常量折叠将元组创建为常量并按原样加载。这也意味着它们的创建速度更快,内存效率更高,因为不需要过度分配等。它们比随机项目访问的列表一点,但解包速度更快(至少在我的机器上)。如果元组是可变的,那么对于这些​​目的它们就不会那么快了。

  2. 元组是通用的:元组需要能够包含任何类型的对象。它们习惯于(快速)执行可变长度参数列表之类的操作(通过*函数定义中的运算符)。如果元组不能保存可变对象,那么它们对于这样的事情将毫无用处。Python 必须使用列表,这可能会减慢速度,并且肯定会降低内存效率。

所以你看,为了实现它们的目的,元组必须是不可变的,而且还必须能够包含可变对象。如果 Python 的设计者想要创建一个不可变对象来保证它“包含”的所有对象也是不可变的,那么他们将不得不创建第三种序列类型。收益不值得额外的复杂性。

于 2012-03-18T14:00:04.093 回答
16

首先,“不可变”这个词对不同的人可能意味着许多不同的东西。我特别喜欢 Eric Lippert 在他的博文[存档 2012-03-12 ] 中对不变性进行分类的方式。在那里,他列出了这些类型的不变性:

  • Realio-trulio 不变性
  • 一次写入不变性
  • 冰棒不变性
  • 浅层不变性与深层不变性
  • 不变的外墙
  • 观察不变性

这些可以以各种方式组合以产生更多种类的不变性,我相信还有更多。您似乎对深度(也称为传递)不变性感兴趣的那种不变性,其中不可变对象只能包含其他不可变对象。

关键在于,深度不变性只是众多不变性中的一种。您可以采用您喜欢的任何一种,只要您知道您的“不可变”概念可能与其他人的“不可变”概念不同。

于 2012-03-18T04:49:33.713 回答
14

您不能更改id其项目的。所以它总是包含相同的项目。

$ python
>>> t = (1, [2, 3])
>>> id(t[1])
12371368
>>> t[1].append(4)
>>> id(t[1])
12371368
于 2012-03-18T04:44:45.530 回答
5

我会在这里冒个险,说这里的相关部分是,虽然您可以更改包含在元组中的列表的内容或对象的状态,但您无法更改的对象或列表在那里。如果你有一些依赖于 thing[3] 作为列表的东西,即使是空的,那么我可以看到这很有用。

于 2012-03-18T04:38:36.633 回答
3

一个原因是 Python 中没有通用的方法可以将可变类型转换为不可变类型(请参阅被拒绝的PEP 351以及有关它被拒绝的原因的链接讨论)。因此,如果有这个限制,就不可能将各种类型的对象放在元组中,包括几乎任何用户创建的非散列对象。

字典和集合有这个限制的唯一原因是它们要求对象是可散列的,因为它们在内部实现为散列表。但请注意,具有讽刺意味的是,字典和集合本身并不是不可变的(或可散列的)。元组不使用对象的散列,因此它的可变性无关紧要。

于 2013-01-24T15:36:09.170 回答
2

元组是不可变的,因为元组本身不能扩展或收缩,而不是包含自身的所有项目都是不可变的。否则元组是枯燥的。

于 2012-03-18T04:38:59.243 回答