0

我编写了 Erik Demaine (MIT) docdist8.py 的 Ruby 版本。这在 github 上作为docdist-v3.rb 可用。我遇到了两种奇怪的情况:

1) 在函数 inner_product 中有一个块注释:

Inner product between two vectors, where vectors
are repeated as dictionaries of (word, freq) pairs.
Example : inner_product({"and":3, "of":2, "the":5},
                        {"and":4, "in":1, "of":1, "this":2}) = 14.0

如果我用 =begin 和 =end 包裹它,没有问题,但如果我用三个双引号 """ 包裹它,我会收到如下错误:

./docdist-v3.rb:71: syntax error, unexpected tIDENTIFIER, expecting kEND
    Example : inner_product({"and":3, "of":2, "the":5},
                                         ^
./docdist-v3.rb:71: syntax error, unexpected tIDENTIFIER, expecting kEND
    Example : inner_product({"and":3, "of":2, "the":5},
                                                  ^
./docdist-v3.rb:72: syntax error, unexpected kIN, expecting kEND
...                 {"and":4, "in":1, "of":1, "this":2}) = 14.0
                              ^
./docdist-v3.rb:72: syntax error, unexpected tIDENTIFIER, expecting kEND
...         {"and":4, "in":1, "of":1, "this":2}) = 14.0
                              ^
./docdist-v3.rb:72: syntax error, unexpected tIDENTIFIER, expecting kEND
..."and":4, "in":1, "of":1, "this":2}) = 14.0
                          ^

是否存在与 =begin 和 =end 不同的“””规则/允许条目?

2)当我使用 time 命令运行我的程序时,它会在大约 0.3 秒内执行。但是,如果我输入 require 'profile' ,则相比之下所需的时间会变得非常高 - 30 秒。因此我根本没有得到正确的输出。原始 Python 版本似乎并非如此,它只需要一点额外的时间来分析。如何在 Ruby 中运行相同的配置文件?

注意:我用来运行 Ruby 程序的两个文件是 t2.bobsey.txt 和 t3.lewis.txt。它们可在http://ocw.mit.edu/ans7870/6/6.006/s08/lecturenotes/dd_data.htm获得

4

1 回答 1

0

1) 块注释始终具有以下形式:

=begin
Comment
=end

您实际上是在创建一个从未使用过的字符串:

"""
Not a comment
"""
# => "\nNot a comment\n"

这就是添加另一个引号时出现错误的原因,这就是语法突出显示将它们呈现为字符串的原因。

2)使用探查器速度较慢,但​​我得到相同的结果:

ruby docdist-v3.rb t2.bobsey.txt t3.lewis.txt
File t2.bobsey.txt:262111 lines,49785 words,3354 distinct words
File t3.lewis.txt:1015474 lines,182355 words,8530 distinct words
The distance between the documents is: 0.574160 (radians)
于 2013-04-12T23:33:59.893 回答