0

我是 Python 的新手,在 mac ox 10.8.3 中使用 python 2.7。

今天遇到一个问题,python在执行文件读取时没有得到正确的数据。

我的输入文件包括两个这样的网站网址:

    www.google.com
    www.facebook.com

和python代码如下,只是为了打印输入:

f = open("weblist.rtf","r")
print f.read()
f.close()

但是运行之后,输出是这样的:

    {\rtf1\ansi\ansicpg1252\cocoartf1187\cocoasubrtf370
    {\fonttbl\f0\fnil\fcharset134 STHeitiSC-Medium;}
    {\colortbl;\red255\green255\blue255;}
    \paperw11900\paperh16840\margl1440\margr1440\vieww12200\viewh12840\viewkind1
    \pard\tx566\tx1133\tx1700\tx2267\tx2834\tx3401\tx3968\tx4535\tx5102\tx5669\tx6236\tx6803\pardirnatural

   \f0\b\fs36 \cf0 www.google.com\
   www.facebook.com}

如何解决这个问题呢?有人有建议吗?

4

2 回答 2

1

RTF 文件不像简单的文本文件(例如,windows .txt 文件),RTF 文件有特定的标头。

您可以尝试使用简单的文本文件而不是其他类型的文本文件。

于 2013-05-15T05:41:12.477 回答
1

您不能将 RTF 文件视为普通文本文件并逐行阅读。

您可以查看有关将 RTF 文件转换为文本文件的 stackoverflow 上的以下链接。

是否有用于将 RTF 转换为纯文本的 Python 模块?

于 2013-05-15T05:57:49.193 回答