如果我有一个像下面这样的字符串,我将如何在每第三个字符或任何其他指定字符处拆分它?
b = "123456789"
结果将是这样的:
b = ["123","456","789"]
我试过使用这些方法:b.split("").each_slice(3).to_a
但这会导致:[["1", "2", "3"], ["4", "5", "6"], ["7", "8", "9"]]
谢谢您的帮助!
我会使用:
b = "123456789"
b.scan(/.{3}/) # => ["123", "456", "789"]
如果 OP 的样本长度不同,或者嵌入了“\n”,则可以进行简单的修改:
b = "123456789"
b.scan(/.{1,3}/) # => ["123", "456", "789"]
b[0..-2].scan(/.{1,3}/) # => ["123", "456", "78"]
"#{ b }\n#{ b }".scan(/.{1,3}/) # => ["123", "456", "789", "123", "456", "789"]
现在,如果在偶数“3”边界上没有嵌入的“\n”,它将中断:
"#{ b[0..-2] }\n#{ b }".scan(/.{1,3}/) # => ["123", "456", "78", "123", "456", "789"]
但这与 OP 的简单规范相去甚远,可以通过首先去除换行符来修复:
"#{ b[0..-2] }\n#{ b }".delete("\n").scan(/.{1,3}/) # => ["123", "456", "781", "234", "567", "89"]
你几乎成功了。
b = "123456789"
b.split("").each_slice(3).map(&:join) # => ["123", "456", "789"]
b = "123456789"
b.chars.each_slice(3).map(&:join)
# => ["123", "456", "789"]
另一种方式:
my_s, my_a = '123456789', []
my_a << my_s.slice!(0..2) until my_s.empty?
p my_a # => ["123", "456", "789"]
除了其他答案之外,如果您想拆分任意一组字符(此答案不涵盖每三个字符,因为已经有足够多的答案)并决定拆分字符的位置,您还可以使用split
像这样:
# Split and include splitting character in next slice
"123456789".split(/(?=[36])/) # => ["12", "345", "6789"]
# Split and include splitting character in slice
"123456789".split(/(?<=[36])/) # => ["123", "456", "789"]
# Split and exclude character from slices
"123456789".split(/[36]/) # => ["12", "45", "789"]
请记住,这确实使用正则表达式,并且出于您的目的,最好找到一种使用较少过度路由的方法来拆分字符串(请参阅 detunized 的答案,这是相当简洁且合理的方法处理这个(事情)。根据要拆分的字符串的复杂性、您要拆分的内容、拆分字符/短语/等的方法等等,您的方法可能会改变。
这不会创建临时数组,适用于任何字符集和数量,并且不使用慢速正则表达式。虽然没有那么优雅。
s = "1234567"
(0...s.size / 3).map { |i| s[i * 3, 3] }
# => ["123", "456", "7"]
基准:
require "benchmark"
N = 100000
Benchmark.bm do |x|
b = "123456789"
x.report { N.times { (0...b.size / 3).map { |i| b[i * 3, 3] } } }
x.report { N.times { b.scan(/.{3}/) } }
x.report { N.times { b.chars.each_slice(3).map(&:join) } }
x.report { N.times { b.split("").each_slice(3).map(&:join) } }
end
结果:
$ ruby split3.rb
user system total real
0.080000 0.000000 0.080000 ( 0.079944)
0.130000 0.000000 0.130000 ( 0.127715)
0.300000 0.000000 0.300000 ( 0.299186)
0.640000 0.000000 0.640000 ( 0.641817)
我试图改变行的顺序,看看是否有任何奇怪的副作用。结果是一致的。顺序无关紧要。