我有一个巨大的 mbox 文件,其中可能包含 500 封电子邮件。
它如下所示:
From x@blah.com Fri Aug 12 09:34:09 2005
Message-ID: <42FBEE81.9090701@blah.com>
Date: Fri, 12 Aug 2005 09:34:09 +0900
From: me <x@blah.com>
User-Agent: Mozilla Thunderbird 1.0.6 (Windows/20050716)
X-Accept-Language: en-us, en
MIME-Version: 1.0
To: someone <someone@hotmail.com>
Subject: Re: (no subject)
References: <BAY101-F9353854000A4758A7E2CCA9BD0@phx.gbl>
In-Reply-To: <BAY101-F9353854000A4758A7E2CCA9BD0@phx.gbl>
Content-Type: text/plain; charset=ISO-8859-1; format=flowed
Content-Transfer-Encoding: 8bit
Status: RO
X-Status:
X-Keywords:
X-UID: 371
X-Evolution-Source: imap://x+blah.com@blah.com/
X-Evolution: 00000002-0010
Hey
the actual content of the email
someone wrote:
> lines of quotedtext
我想知道如何删除所有引用的文本,去掉除 To、From 和 Date 行之外的大多数标题,并且仍然让它有点连续。
我的目标是能够将这些电子邮件打印为一种书籍格式,并且目前每个程序都希望每页打印一封电子邮件,或者所有标题和引用的文本。关于使用 shell 工具从哪里开始编写小程序的任何建议?