4

如果我有一个像下面这样的字符串,我将如何在每第三个字符或任何其他指定字符处拆分它?

b = "123456789"

结果将是这样的:

b = ["123","456","789"]

我试过使用这些方法:b.split("").each_slice(3).to_a

但这会导致:[["1", "2", "3"], ["4", "5", "6"], ["7", "8", "9"]]

谢谢您的帮助!

4

6 回答 6

6

我会使用:

b = "123456789"
b.scan(/.{3}/) # => ["123", "456", "789"]

如果 OP 的样本长度不同,或者嵌入了“\n”,则可以进行简单的修改:

b = "123456789"
b.scan(/.{1,3}/) # => ["123", "456", "789"]
b[0..-2].scan(/.{1,3}/) # => ["123", "456", "78"]
"#{ b }\n#{ b }".scan(/.{1,3}/) # => ["123", "456", "789", "123", "456", "789"]

现在,如果在偶数“3”边界上没有嵌入的“\n”,它将中断:

"#{ b[0..-2] }\n#{ b }".scan(/.{1,3}/) # => ["123", "456", "78", "123", "456", "789"]

但这与 OP 的简单规范相去甚远,可以通过首先去除换行符来修复:

"#{ b[0..-2] }\n#{ b }".delete("\n").scan(/.{1,3}/) # => ["123", "456", "781", "234", "567", "89"]
于 2013-10-16T17:56:06.057 回答
5

你几乎成功了。

b = "123456789"
b.split("").each_slice(3).map(&:join) # => ["123", "456", "789"]
于 2013-10-16T17:54:49.043 回答
5
b = "123456789"
b.chars.each_slice(3).map(&:join)
# => ["123", "456", "789"]
于 2013-10-16T17:54:54.933 回答
5

另一种方式:

my_s, my_a = '123456789', []
my_a << my_s.slice!(0..2) until my_s.empty?
p my_a # => ["123", "456", "789"]
于 2013-10-16T18:18:33.770 回答
2

除了其他答案之外,如果您想拆分任意一组字符(此答案不涵盖每三个字符,因为已经有足够多的答案)并决定拆分字符的位置,您还可以使用split像这样:

# Split and include splitting character in next slice
"123456789".split(/(?=[36])/)     # => ["12", "345", "6789"]

# Split and include splitting character in slice
"123456789".split(/(?<=[36])/)    # => ["123", "456", "789"]

# Split and exclude character from slices
"123456789".split(/[36]/)         # => ["12", "45", "789"]

请记住,这确实使用正则表达式,并且出于您的目的,最好找到一种使用较少过度路由的方法来拆分字符串(请参阅 detunized 的答案,这是相当简洁且合理的方法处理这个(事情)。根据要拆分的字符串的复杂性、您要拆分的内容、拆分字符/短语/等的方法等等,您的方法可能会改变。

于 2013-10-16T18:12:09.240 回答
1

这不会创建临时数组,适用于任何字符集和数量,并且不使用慢速正则表达式。虽然没有那么优雅。

s = "1234567"
(0...s.size / 3).map { |i| s[i * 3, 3] }
# => ["123", "456", "7"]

基准:

require "benchmark"

N = 100000

Benchmark.bm do |x|
    b = "123456789"
    x.report { N.times { (0...b.size / 3).map { |i| b[i * 3, 3] } } }
    x.report { N.times { b.scan(/.{3}/) } }
    x.report { N.times { b.chars.each_slice(3).map(&:join) } }
    x.report { N.times { b.split("").each_slice(3).map(&:join) } }
end

结果:

$ ruby split3.rb
       user     system      total        real
   0.080000   0.000000   0.080000 (  0.079944)
   0.130000   0.000000   0.130000 (  0.127715)
   0.300000   0.000000   0.300000 (  0.299186)
   0.640000   0.000000   0.640000 (  0.641817)

我试图改变行的顺序,看看是否有任何奇怪的副作用。结果是一致的。顺序无关紧要。

于 2013-10-16T18:04:02.203 回答