3

我一直在阅读教程后的教程,但似乎没有什么对我有用。目标是获取包含元素和属性的 XML 文档,并将数据插入数据库。每个元素/属性将是数据库中的一列,每个条目是一行。这是我一直在使用的虚构 XML 文档:

<?xml version="1.0"?>
<library>
  <NAME><![CDATA[Favorite Books]]></NAME>
  <book ISBN="11342343">
    <title>To Kill A Mockingbird</title>
    <description><![CDATA[Description#1]]></description>
    <author>Harper Lee</author>
  </book>
  <book ISBN="989894781234">
    <title>Catcher in the Rye</title>
    <description><![CDATA[This is an extremely intense description.]]></description>
    <author>J. D. Salinger</author>
  </book>
  <book ISBN="123456789">
    <title>Murphy's Gambit</title>
    <description><![CDATA[Daughter finds her dad!]]></description>
    <author>Syne Mitchell</author>
  </book>
</library>

所以我想要一个有 2 个条目的表,每个条目都有一个 ISBN、标题、描述和作者。这就是基础。(我想 CDATA 是完全可选的。如果这是我的问题的一部分,无论如何让我们摆脱它......)

最终目标有点复杂。拥有多本书的多个图书馆。数据库之间有关系,所以我可以从我的图书数据库中引用图书馆数据库,反之亦然。我完全迷路了,绝对是一个菜鸟,但我有很好的计算机知识,并且愿意测试和尝试。

我正在使用带有默认 SQLite3 数据库 (3.6.20) 的 Rails 3.2.6。我已经安装了 REXML、ROXML、LibXML 等,并通读了 API 和演练,但一切都没有成功。必须有一种简单的方法将 XML 文档转换为带有 Book 对象(具有 .title、.author、.isbn 和 .description 方法)的 Library 对象(使用 .name 方法)。

任何帮助都是真正的赞赏!

更新!

好的,下一个问题。我一直在玩弄这背后的逻辑,并想知道执行以下操作的最佳方法...

假设我有这个新的和改进的 XML 文件。

<?xml version="1.0"?>
<RandomTag>
  <library name='Favorite Books'>
    <book ISBN="11342343">
      <title>TKAM</title>
      <description>Desc1</description>
      <author>H Lee</author>
    </book>
    <book ISBN="989894781234">
      <title>Catcher in the Rye</title>
      <description>Desc2</description>
      <author>JD S</author>
    </book>
  </library>
  <library name='Other Books'>
    <book ISBN="123456789">
      <title>Murphy\'s Gambit</title>
      <description>Desc3</description>
      <author>Syne M</author>
    </book>
  </library>
</RandomTag>

所以现在我们有两个图书馆,第一个名为“Favorite Books”,有两本书,第二个图书馆名为“Other Books”,只有一本书。

每本书知道它属于哪个图书馆的最佳方法是什么?最初,我创建了一个图书馆数据库和一个图书数据库。每个 Book 对象都有一个 library_id 字段,它引用了正确的 Library。因此,每个数据库都可以使用“@library.books.each do |b| b.title”之类的语法正确填写。但是,这仅在我拥有一个库时才有效。

我尝试将您给我的 Book 循环嵌套在一个类似的 Library 循环中,但是 .css 方法会找到每个匹配项,无论它位于何处。是否有 .css 方法可以找到 UNTIL 一个特定点?

换句话说,我希望能够将每本书导入其各自的图书馆。我无法向 XML 文件添加任何字段。

再次感谢。

4

1 回答 1

11

我使用Nokogiri库做了类似的事情。

doc = Nokogiri::XML(xml_data)

doc.css('book').each do |node|
  children = node.children

  Book.create(
    :isbn => node['ISBN'],
    :title => children.css('title').inner_text,
    :description => children.css('description').inner_text,
    :author => children.css('author').inner_text
  )
end

更新

您可以通过执行以下操作创建快速测试:

首先安装 nokogiri gem:

gem install nokogiri

然后创建一个名为 text_xml.rb 的文件,其内容为:

require 'nokogiri'

doc = Nokogiri::XML('<?xml version="1.0"?>
  <library>
    <NAME><![CDATA[Favorite Books]]></NAME>
    <book ISBN="11342343">
      <title>To Kill A Mockingbird</title>
      <description><![CDATA[Description#1]]></description>
      <author>Harper Lee</author>
    </book>
    <book ISBN="989894781234">
      <title>Catcher in the Rye</title>
      <description><![CDATA[This is an extremely intense description.]]></description>
      <author>J. D. Salinger</author>
    </book>
    <book ISBN="123456789">
      <title>Murphy\'s Gambit</title>
      <description><![CDATA[Daughter finds her dad!]]></description>
      <author>Syne Mitchell</author>
    </book>
  </library>')

doc.css('book').each do |node|
  children = node.children

  book = {
    "isbn" => node['ISBN'], 
    "title" => children.css('title').inner_text, 
    "description" => children.css('description').inner_text, 
    "author" => children.css('author').inner_text
  }

  puts book
end

最后运行:

ruby test_xml.rb

我怀疑您在粘贴 xml 时并没有转义Murphy's Gambit中的单引号。

于 2012-07-06T22:51:53.263 回答