当然,我已经可以用 Nokogiri 做到这一点
doc = Nokogiri::HTML(src)
其中 src 是我数据库中的文本列。
但我真的很喜欢 Watir 为开发人员提供的搜索界面,而不是 Nokogiri。
到目前为止,在我在互联网上的搜索中,没有太多关于如何做到这一点的证据,即。对于未托管的 html。
您可以通过在文件路径的开头添加“file://”来访问本地 html 文件(请参阅我关于该主题的博客文章)。
例如,假设您的计算机上有一个 html 文件,位于“C:\users\testuser\desktop\test_file.html”。
如果你想打开这个文件并使用 Watir 与之交互,你可以这样做:
browser = Watir::Browser.new
browser.goto('file://C:\users\testuser\desktop\test_file.html')
然后,您可以像通常与 Watir 一样与浏览器/页面/html 进行交互。
注意:如果您NoMethodError: unknown property or method: 'document'
在尝试与浏览器交互时遇到异常,请确保您的浏览器正在由具有管理权限的用户打开。
如果上述方法不适合您,您可以尝试直接使用驱动程序导航,如下所示:
browser = Watir::Browser.new
browser.driver.navigate.to('file://Users/path/to/file.html')
PS我在Mac上,但这应该不管你的操作系统