3

您能否描述两种字符串连接方式之间的区别:简单__add__运算符和%s模式?我对这个问题进行了一些调查,发现%s(不使用括号的形式)要快一些。

还出现了另一个问题:为什么 result of'hell%s' % 'o'指的是另一个内存区域而不是'hell%s' % ('o',)

有一些代码示例:

l = ['hello', 'hell' + 'o', 'hell%s' % 'o', 'hell%s' % ('o',)]
print [id(s) for s in l]

结果:

[34375618400, 34375618400, 34375618400, 34375626256]

PS我知道字符串实习:)

4

2 回答 2

7

这是一个小练习:

>>> def f1():
    'hello'


>>> def f2():
    'hel' 'lo'


>>> def f3():
    'hel' + 'lo'


>>> def f4():
    'hel%s' % 'lo'


>>> def f5():
    'hel%s' % ('lo',)


>>> for f in (f1, f2, f3, f4, f5):
    print(f.__name__)
    dis.dis(f)


f1
  1           0 LOAD_CONST               1 (None) 
              3 RETURN_VALUE         
f2
  1           0 LOAD_CONST               1 (None) 
              3 RETURN_VALUE         
f3
  2           0 LOAD_CONST               3 ('hello') 
              3 POP_TOP              
              4 LOAD_CONST               0 (None) 
              7 RETURN_VALUE         
f4
  2           0 LOAD_CONST               3 ('hello') 
              3 POP_TOP              
              4 LOAD_CONST               0 (None) 
              7 RETURN_VALUE         
f5
  2           0 LOAD_CONST               1 ('hel%s') 
              3 LOAD_CONST               3 (('lo',)) 
              6 BINARY_MODULO        
              7 POP_TOP              
              8 LOAD_CONST               0 (None) 
             11 RETURN_VALUE         

如您所见,所有简单的连接/格式化都是由编译器完成的。最后一个函数需要更复杂的格式,因此,我猜,实际上是执行的。由于在编译时创建的所有这些对象都具有相同的 id。

于 2010-07-30T13:25:14.863 回答
1

%从技术上讲,使用是字符串格式,而不是连接。他们是两个完全不同的世界。

如果您了解字符串实习,那么您应该知道绝对不能保证两个字符串将占用与另一个字符串相同的内存。在您的示例中,前三个所做的事实只不过是纯粹的巧合。

我不是 100% 确定字符串格式化是如何工作的,但我知道它在底层 C 中的实现方式与连接不同——我认为''.join(sequence)+这篇文章了解更多信息。

*有点。

于 2010-07-30T13:20:32.850 回答