11

今天升级到 Ruby-1.9.3-p392 后,REXML 在尝试检索超过一定大小的 XML 响应时抛出运行时错误 - 一切正常,接收 25 条以下 XML 记录时不会抛出错误,但是一旦某个 XML 响应达到长度阈值,我收到此错误:

Error occurred while parsing request parameters.
Contents:

RuntimeError (entity expansion has grown too large):
  /.rvm/rubies/ruby-1.9.3-p392/lib/ruby/1.9.1/rexml/text.rb:387:in `block in unnormalize'

我意识到这在最新的 Ruby 版本中发生了变化: http ://www.ruby-lang.org/en/news/2013/02/22/rexml-dos-2013-02-22/

作为快速修复,我已将 的大小更改REXML::Document.entity_expansion_text_limit为更大的数字并且错误消失了。

有没有风险较小的解决方案?

4

2 回答 2

3

当您将过多内容作为 XML 响应发送时,会生成此问题。

要解决此问题:您需要限制单个节点中的数据(< 10k)(而不是发送整个数据,显示截断的数据并提供单独的链接以查看完整内容)

以下文件引发了错误: ruby-2.1.2/lib/ruby/2.1.0/rexml/text.rb

# Unescapes all possible entities
def Text::unnormalize( string, doctype=nil, filter=nil, illegal=nil )
  sum = 0
  string.gsub( /\r\n?/, "\n" ).gsub( REFERENCE ) {
    s = Text.expand($&, doctype, filter)
    if sum + s.bytesize > Security.entity_expansion_text_limit
      raise "entity expansion has grown too large"
    else
      sum += s.bytesize
    end
    s
  }
end

限制ruby-2.1.2/lib/ruby/2.1.0/rexml/text.rb默认为 10240,这意味着每个节点 10k 数据。

REXML 已经默认每个文档只允许 10000 个实体替换,因此实体替换可以生成的最大文本量约为 98 兆字节。(参考https://www.ruby-lang.org/en/news/2013/02/22/rexml-dos-2013-02-22/

于 2014-09-05T07:10:45.627 回答
0

这听起来像很多 XML。你真的需要得到所有吗?也许您可以从远程服务器请求某些字段?一种选择可能是尝试另一个 XML 解析器(例如Nokogiri)。另一种选择可能是使用 XML 以外的东西作为传输(JSON?二进制?)。

于 2013-06-11T02:03:20.153 回答