1

我不确定是否应该在 ServerFault 或此处询问这个问题,因为这是 Rails 3.2.3 应用程序中特定于 Mechanize 和 Nokogiri 的服务器问题。

我有一个 rake 任务,它从我们的一个服务提供商网站上抓取纬度和经度。

我已经在“crontab -e”中设置了任务以及其他任务。出于某种原因,在两台假定相同的服务器上,其中一台服务器无法完成 rake 任务,并出现以下错误:

X-Cron-Env: <PATH=/usr/bin:/bin>
X-Cron-Env: <LOGNAME=root>
Message-Id: <20120410134631.2CFA624B76@localhost>
Date: Tue, 10 Apr 2012 14:46:30 +0100 (BST)

rake aborted!
/var/www/railsapp/lib/tasks/peoplesafelocation.rake:29: undefined (?...) sequence: /new GLatLng\(\s*(?<lat>.+?)\s*,\s*(?<long>.+?)\s*\)/

两台服务器都运行 Rails 3.2.3、Ruby 1.9.2。

我不明白为什么它会在一台服务器上出现“未定义(?...)序列”而在另一台服务器上失败。

两台服务器都使用 RVM 并运行 Ubuntu 10.04。

完整的rake任务如下:

desc "Import Peoplesafe Location"
task :fetch_peoplesafelocation => :environment do

# Logs into provider.co.uk/live and retrieved latitude and longitude.
require 'rubygems'
require 'mechanize'
require 'logger'
require 'nokogiri'

# Create a new mechanize object
agent = Mechanize.new

# Load the Peoplesafe website
page = agent.get("http://provider.co.uk/live/")

# Select the first form
form = agent.page.forms.first
form.username = 'User'
form.password = 'Password'

# Submit the form
page = form.submit form.buttons.first

page = agent.get("http://provider.co.uk/live/?gps&cid=AAXA-PJZM6M")

html_doc = page.root

script = page.at('/html/head/script[not(@src)]')
parts = script.text.match(/new GLatLng\(\s*(?<lat>.+?)\s*,\s*(?<long>.+?)\s*\)/)

#puts parts[:lat], parts[:long]

Location.create(:latitude => parts[:lat], :longitude => parts[:long])
puts 'Location Updated'

结尾

任何指针将不胜感激!

4

2 回答 2

2

问题源于正则表达式和使用旧红宝石。

这很容易由使用 RVM 引起。

默认情况下,RVM 只加载它的配置,它是一个交互式 shell。Cronjobs 默认使用 sh shell。

RVM 附带了一个外壳包装器来帮助解决这个问题。在您的 cronjob 顶部添加SHELL=/path/to/rvm/bin/rvm-shell(b/c 我登录到服务器以提供帮助)此路径为/usr/local/bin/rvm/bin/rvm-shell设置这将导致包含正确的 rvm 路径。

下一步是修复 cron 命令。由于我们使用的是 rvm-shell,我们希望删除路径以在您的 rvm 中使用正确的 gem(rake 等)。

删除 rake 的绝对路径并SHELL在 crontab 顶部添加变量后,所有 cron 将开始正确触发。

于 2012-04-10T17:54:01.060 回答
1

此错误消息由 ruby​​ 1.8.7 中的正则表达式引擎引发;例如看这个问题。因此,如果您实际上在两台机器上都使用 ruby​​ 1.9.3,这应该可以工作。

红宝石 1.8.7:

$ rvm 1.8.7-p334
$ irb
1.8.7 :002 > "foo".match(/new GLatLng\(\s*(?<lat>.+?)\s*,\s*(?<long>.+?)\s*\)/)
SyntaxError: compile error
(irb):2: undefined (?...) sequence: /new GLatLng\(\s*(?<lat>.+?)\s*,\s*(?<long>.+?)\s*\)/
from (irb):2

红宝石 1.9.2:

$ rvm 1.9.2-p290
$ irb
1.9.2p290 :001 > "foo".match(/new GLatLng\(\s*(?<lat>.+?)\s*,\s*(?<long>.+?)\s*\)/)
=> nil 

因此,请仔细检查您是否确实在故障服务器上使用了正确的 rvm ruby​​。一方面,检查您是否已将 1.9.2 或更高版本设置为默认使用

rvm 1.9.2 --default

并且 rvm 可执行文件位于任何可能安装的系统 ruby​​ 之前的路径中。另外,请注意,cronjobs 默认情况下不提供其用户的环境 - 您需要显式传递它或从登录 shell 中执行 cron 作业(参见例如http://danielsz.posterous.com/how-to-运行-rvm-scripts-as-cron-jobs)。

于 2012-04-10T14:30:11.843 回答