1

我有一个 .rtf 文件,它只包含一个整数,比如 15。我希望通过 python 读取这个整数并以某种方式操作该整数。但是,python 似乎正在读取与 .rtf 文件相关的大部分元数据。这是为什么?我怎样才能避免它?例如,试图读入这个文件,我得到..

{\rtf1\ansi\ansicpg1252\cocoartf949\cocoasubrtf460 {\fonttbl\f0\fswiss\fcharset0 Helvetica;} {\colortbl;\red255\green255\blue255;} \margl720\margr720\margb720\margt720\vieww9000\viewh8400\viewkind0 \ pard\tx566\tx1133\tx1700\tx2267\tx2834\tx3401\tx3968\tx4535\tx5102\tx5669\tx6236\tx6803\ql\qnatural\pardirnatural

4

2 回答 2

4

这就是 .RTF(即富文本文件)的本质,它们包含额外的数据来定义文本的布局和格式。

不建议将数据存储在此类文件中,以免遇到您指出的困难。您是否会努力解析此文件并“恢复”您的一个数值,您可能会使您的应用程序面临 RTF 格式更新版本的风险,这可能会导致解析逻辑部分不正确,从而产生错误的数字数据应用)。

为什么不将此信息存储在真正的文本文件中。这可以是一个平面文本文件,或者最好是一个 XML、YAML、JSON 文件,例如为您的应用程序添加“前向”兼容性,您可以在文件中添加额外的参数等。

但是,如果这个文件是给定的,那么可能存在 Python 库来读取和写入它。检查 RTF 关键字的Python 包索引 (PyPI)

于 2009-10-12T05:42:00.233 回答
4

这正是 RTF 文件包含的内容,因此 Python(在没有进一步说明的情况下)为您提供文件包含的内容。

您可能正在寻找一个库来读取 RTF 文件的内容,例如pyrtf-ng

于 2009-10-12T05:43:07.343 回答