0

很抱歉问这个问题,但我真的需要完成这件事。我希望能够传入一个字符串并去掉 stop_words。我有以下内容:

class Query
  def self.normalize term
    stop_words=["a","big","array"]
    term.downcase!
    legit=[]
    if !stop_words.include?(term)
      legit << term
    end
    return legit
  end

  def self.check_parts term
    term_parts=term.split(' ')
    tmp_part=[]
    term_parts.each do |part|
      t=self.normalize part
      tmp_part << t
    end  
    return tmp_part  
  end
end

我认为这只会返回不在 stop_words 列表中的术语,但我会返回一个空数组或传入的术语数组。像这样:

ruby-1.9.2-p290 :146 > Query.check_parts "here Is my Char"
 => [[], [], [], ["char"]] 
ruby-1.9.2-p290 :147 >

我究竟做错了什么?

提前谢谢

4

2 回答 2

0

为什么要将结果作为数组我不知道但

term_parts=term.split(' ')
term_parts.reject { |part| stop_words.include?(part) }

你可以写你所期望的。
顺便说一句,你有一个数组数组,因为

def self.check_parts term
    term_parts=term.split(' ')
    tmp_part=[]                 # creates an array
    term_parts.each do |part|
      t=self.normalize part     # normalize returns an empty array
                                # or one of only one element (a term).
      tmp_part << t             # you add an array into the array
    end  
    return tmp_part  
  end
于 2012-10-18T07:01:45.300 回答
0

如果您只是想过滤掉术语并获得一系列降级单词,那很简单。

module Query
  StopWords = %w[a big array]
  def self.check_parts string; string.downcase.split(/\s+/) - StopWords end
end

Query.check_parts("here Is my Char") # => ["here", "is", "my", "char"]
于 2012-10-18T07:50:23.017 回答