我有一个无法打开的大文件:
... more here
<my_element attr1='123'>
... a lot of text and elements here
</my_element>
<my_element attr1='33'>
... a lot of text and elements here
</my_element>
... more here
我试过“如何使用 Nokogiri::XML::Reader 解析大型 XML 文件? ”:
#!/usr/bin/ruby
require "rubygems"
require "nokogiri"
require "debugger"
require "awesome_print"
file = ARGV[0]
reader = Nokogiri::XML::Reader(File.open(file))
reader.each do |node|
if node.name == "PATDOC"
debugger
break
end
end
但node.attributes
返回{}
。
如何从元素中提取属性和内部文本?