我最近将 mi CI 服务器(Teamcity)移到了另一台具有相同配置和非常相似操作系统的强大机器上。
从那以后,我的一些集成规范开始失败。我的设置非常标准,Rails 3 + capybara + poltergeist + phantomjs。
失败是确定性的,它们总是会发生,并且总是与 DOM 中一些缺失的节点有关。此外,故障发生在具有相似设置的不同项目中,因此与项目配置无关。capybara 1.x 和 capybara 2 都会发生这种情况。
这是最简单的失败规范。请注意,此规范无需 javascript 即可运行,因此该问题也存在于仅机架规范中。
scenario 'require an unsubscription' do
visit unsubscribe_index_path
within main_content do
choose list.description
fill_in 'Email', :with => subscriber.email
click_button 'Unsubscribe'
end
save_page # <--- Added to debug output
# !!! HERE is the first failing assertion
page.should have_content('You should have received a confirmation message')
# Analytics event recorded
# !!! this also is failing
page.should have_event('Unsubscription', 'Sent', list_name)
# If I comment previous two lines the spec passes on CI machine
# this means that the form is submitted with success since email is triggered
# from controller code
last_email_sent.should have_subject 'Unsubscribe request received'
last_email_sent.should deliver_to subscriber.email
end
我试过的:
- 在不同的机器上运行规范,它们可以在每台开发机器上运行,也可以在登台服务器上运行。即使在 CI 环境之外,我也只能在 CI 机器上重现故障(即通过命令行运行规范)
- 增加到
Capybara.default_wait_time
一个荒谬的20
- 尝试在上
page.should have_content
线前进行残酷的睡眠 - 在 CI 机器上升级 RVM、ruby、capybara、poltergeist 的最新版本。
- 将teamcity升级到最新版本
我发现的最奇怪的事情是当我save_page
在失败行之前添加了一个调用。如果我在我的机器上运行规范,然后在服务器出现故障的 CI 上运行并比较这两个文件,结果是这样的:
$ diff capybara-201309071*.html
26a27,29
> <script type='text/javascript'>
> _gaq.push(["_trackEvent","Unsubscription","Sent","listname"]);
> </script>
90a94,96
> <div class="alert-message message notice">
> <p>You should have received a confirmation message</p>
> </div>
这是导致规范失败的两个缺失部分,因此提交了表单,控制器操作成功运行,但缺少两个 dom。这怎么可能?为什么这只发生在一台机器上?
作为记录,这两个 DOM 是使用标准 rails 工具添加的,其中一个是
redirect_to unsubscribe_index_path, notice: ...
另一个是分析宝石