0

在我的 rails 应用程序中,我需要上传一些 doc/xls 文件并解析其结构并获取信息。如何从 *.doc 或 *.xls 获取可能是 xml 格式的数据或其他我可以读取和解析的数据?

4

3 回答 3

1

您可以使用Roo gem解析不同类型的电子表格。它支持:

  • 开发办公室
  • Excel
  • 谷歌电子表格
  • Excelx
  • 自由办公室
  • CSV

根据我的经验,解析 .xls 文件存在一些问题,但是解析 .xlsx 文件很好。

至于 .doc 文件,您可以尝试使用msworddoc-extractor gem 或尝试此处提出的解决方案之一。

更新:使用 *.docx 文件 - docxdocx-html

于 2013-11-12T16:47:42.023 回答
0

电子表格 gem 非常适合 excel 和 csv 文件。 https://github.com/zdavatz/电子表格

于 2013-11-11T23:00:49.500 回答
0

你见过 Nokogiri 宝石吗?http://nokogiri.org/

对xml解析非常有用

于 2013-11-11T22:06:08.227 回答