我正在开发一个需要存储 2GB+ XML 文件进行处理的应用程序,我面临两个问题:
- 如何处理文件?一次将整个文件加载到 Nokogiri 是行不通的。它很快就会耗尽内存,据我所知,这个过程会从轨道上被摧毁。是否有与 Heroku 兼容的方法可以快速/轻松地以较小的块读取位于非 Heroku 服务器上的大型 XML 文件?
- 如何存储文件?该站点设置为使用 S3,但数据提供者需要 FTP 访问权限才能每晚上传 XML 文件。通过 FTP 的 S3 显然是不可行的,并且将文件存储在 Heroku 上也不起作用,因为它只会被拥有它的 dyno 看到并且容易被随机清除。以前有没有人遇到过这种类型的限制,如果有,你是如何解决的?