2

我有兴趣编写一个修改 PostScript 文件的实用程序。它需要遍历文件,对页数和尺寸做出某些决定,然后将输出写入文件或标准输出,对 PostScript 代码进行某些修改。

在这种情况下,在 *NIX 系统上处理文件处理的好方法是什么?我对 C 中的管道和分叉相当陌生,据我了解,如果直接读取文件,我可能会在输入文件周围来回寻找,但如果输入直接通过管道传输到程序中,我不能简单地倒退到输入的开头,因为输入可能是例如网络流,对吗?

与其将整个 PS 文件存储到可能会变得巨大的内存中,不如在进行第一次页面分析时将输入缓冲到磁盘更有意义,然后从临时文件中重新读取,产生输出,并删除临时文件。如果这是一个可行的解决方案,那么在 *NIX 系统上存储此类文件的好地方是哪里?我也不确定这样的代码有多安全:该程序可能被同一服务器上的多个用户使用。听起来我会确保将文件保存在给定用户帐户唯一的临时目录中的某个位置,并为磁盘上的临时文件提供一个相当唯一的名称。

非常感谢有关这个疯狂的令人费解的文件处理世界的任何提示和指示。

4

3 回答 3

4

用于mkstemp(3)创建您的临时文件。它将为您处理并发问题。mmap(2)会让你在文件中随意移动。

于 2010-11-13T18:10:22.953 回答
1

如果输入直接通过管道传输到程序中,我不能简单地倒退到输入的开头,因为输入可能是网络流,例如,对吗?

这是正确的。您只能对文件执行随机访问。

如果您阅读该文件,也许您可​​以构建一个元数据表,以后可以使用它来查找文件的特定部分,而无需将文件本身保存在内存中。

于 2010-11-13T18:07:44.507 回答
1

/tmp 是 unix 系统上的临时目录。它由 FHS 指定。系统重新启动时将其清除。

如果您需要比这更多的持久性数据存储,那么 /var/tmp 在重新启动后不会被清除。还有 FHS。

http://en.wikipedia.org/wiki/Filesystem_Hierarchy_Standard

于 2010-11-13T18:07:52.047 回答