56

我最近阅读了一篇关于在 Ruby中使用的好文章。StringIO然而,作者没有提到的是,这StringIO只是一个“我”。没有“O”。你不能这样做,例如:

s = StringIO.new
s << 'foo'
s << 'bar'
s.to_s
# => should be "foo\nbar"
# => really is ''`

Ruby 确实需要一个 StringBuffer,就像 Java 一样。StringBuffers 有两个重要用途。首先,它们让您测试 Ruby 的 StringIO 所做的输出的一半。其次,它们对于从小部分构建长弦很有用——乔尔一遍又一遍地提醒我们的东西是非常非常缓慢的。

有没有好的替代品?

Ruby 中的字符串确实是可变的,但这并不意味着我们应该始终依赖该功能。如果stuff很大,例如这对性能和内存的要求真的很差。

result = stuff.map(&:to_s).join(' ')

在 Java 中执行此操作的“正确”方法是:

result = StringBuffer.new("")
for(String s : stuff) {
  result.append(s);
}

虽然我的 Java 有点生疏。

4

5 回答 5

121

我查看了 ruby​​ 文档StringIO,看起来你想要的是StringIO#string,而不是StringIO#to_s

因此,将您的代码更改为:

s = StringIO.new
s << 'foo'
s << 'bar'
s.string
于 2008-08-13T20:41:29.153 回答
34

与 Ruby 中的其他 IO 类型对象一样,当您写入 IO 时,字符指针会前进。

>> s = StringIO.new
=> #<StringIO:0x3659d4>
>> s << 'foo'
=> #<StringIO:0x3659d4>
>> s << 'bar'
=> #<StringIO:0x3659d4>
>> s.pos
=> 6
>> s.rewind
=> 0
>> s.read
=> "foobar"
于 2009-08-09T19:39:21.843 回答
24

我做了一些基准测试,最快的方法是使用该String#<<方法。使用StringIO速度有点慢。

s = ""; Benchmark.measure{5000000.times{s << "some string"}}
=>   3.620000   0.100000   3.720000 (  3.970463)

>> s = StringIO.new; Benchmark.measure{5000000.times{s << "some string"}}
=>   4.730000   0.120000   4.850000 (  5.329215)

使用该方法连接字符串String#+是多个数量级的最慢方法:

s = ""; Benchmark.measure{10000.times{s = s + "some string"}}
=>   0.700000   0.560000   1.260000 (  1.420272)

s = ""; Benchmark.measure{10000.times{s << "some string"}}
=>   0.000000   0.000000   0.000000 (  0.005639)

所以我认为正确的答案是Java的等价物StringBuffer只是String#<<在Ruby中使用。

于 2012-11-07T18:57:33.277 回答
12

您的示例适用于 Ruby - 我刚刚尝试过。

irb(main):001:0> require 'stringio'
=> true
irb(main):002:0> s = StringIO.new
=> #<StringIO:0x2ced9a0>
irb(main):003:0> s << 'foo'
=> #<StringIO:0x2ced9a0>
irb(main):004:0> s << 'bar'
=> #<StringIO:0x2ced9a0>
irb(main):005:0> s.string
=> "foobar"

除非我错过了您使用 to_s 的原因 - 只是输出对象 ID。

于 2008-08-13T20:46:30.500 回答
3

好吧,在 Ruby 中 StringBuffer 不是必需的,主要是因为 Ruby 中的字符串是可变的……因此您可以通过修改现有字符串来构建字符串,而不是使用每个 concat 构造新字符串。

请注意,您还可以使用特殊的字符串语法,您可以在其中构建一个引用字符串中其他变量的字符串,这使得字符串构造非常易读。考虑:

first = "Mike"
last = "Stone"
name = "#{first} #{last}"

这些字符串还可以包含表达式,而不仅仅是变量……例如:

str = "The count will be: #{count + 1}"
count = count + 1
于 2008-08-13T20:31:29.050 回答