1

我发现自己反复想计算数组中某个项目的出现次数,并显示顶部项目及其实际计数。我已经多次编写如下代码,我认为它是一种反复出现的、引发 RSI 的模式:

hits = Hash[ array.group_by{|o|o}.map{|o,a|[o,a.length]}.sort_by{|o,ct|[-ct,o]} ]

require 'pp'
pp hits

我可以把它移到 Enumerable 上的一个猴子补丁中……</p>

module Enumerable
  def counts(&blk)
    blk ||= ->(o){o}
    Hash[ group_by(&blk).map{|o,a| [o,a.length] }.sort_by{|o,ct| [-ct,o] } ]
  end
end

a = %w[a b a b c d e g j a e c d k o k i l p a e c f d e a d e f s d v c ]
pp a.counts
#=> {"a"=>5,
#=>  "d"=>5,
#=>  "e"=>5,
#=>  "c"=>4,
#=>  "b"=>2,
#=>  "f"=>2,
#=>  "k"=>2,
#=>  "g"=>1,
#=>  "i"=>1,
#=>  "j"=>1,
#=>  "l"=>1,
#=>  "o"=>1,
#=>  "p"=>1,
#=>  "s"=>1,
#=>  "v"=>1}

…但我想知道是否有更优雅的方式来使用核心 Ruby 方法来完成这个(更少的输入就足够了)。

4

3 回答 3

5
ruby-1.9.2-p290 :041 > Hash[*[1,1,2,3,4,5,5,5].inject(Hash.new(0)) { |h,v| h[v] += 1; h }.sort_by{|k,v| v}.reverse.flatten]

=> {5=>3, 1=>2, 4=>1, 2=>1, 3=>1}

听一下,如果您希望根据出现次数对列表进行排名,以下效果很好,

ruby-1.9.2-p290 :045 > [1,1,2,3,4,5,5,5].group_by{|x| x}.sort_by{|k, v| -v.size}.map(&:first)

=> [5, 1, 2, 4, 3] 
于 2012-05-31T23:03:14.160 回答
1

看起来我拥有的代码将尽可能简洁。移入非猴子补丁方法:

def count_items(enum,&blk)
  blk ||= ->(o){o}
  Hash[ enum.group_by(&blk).map{|o,a| [o,a.length] }.sort_by{|o,ct| [-ct,o] } ]
end
于 2012-06-06T16:42:16.303 回答
0

没有提前排序,对于高 n 可能会很慢:

a = %w[a b a b c d e g j a e c d k o k i l p a e c f d e a d e f s d v c ]
a.each_with_object( {} ) {|e, h| h[e] ||= 0; h[e] += 1 }.sort_by {|o, ct| [-ct, o] }

如果您关心优雅,请在合适的时候使用#with_object / #each_with_object。

于 2012-05-31T23:05:55.783 回答