28

我正在开发谷歌应用程序迁移/归档系统,在开发的这一点上,我试图想出一种方法来下载我的域用户创建的所有组中的所有消息。我知道我可以设置转发过滤器并将所有邮件存档到电子邮件中,但这对旧邮件没有帮助。

有没有办法从谷歌组下载这些消息,如果是这样,管理 API 中是否有获取用户创建的所有组的列表?

4

3 回答 3

18

如果你不介意使用#bash,你可以试试我写的工具

https://github.com/icy/google-group-crawler

它可以从 Google Group下载所有mbox文件。如果您有 cookie 文件,您甚至可以从私人 Google 群组下载所有文件,和/或查看所有原始电子邮件。它还可以阅读 rss 提要并获取最新帖子;这对日常镜子很有用。

一个示例结果在这里http://l.archlinuxvn.org/archlinuxvn/。MHonArch 用于将mbox文件转换为 HTML 格式。

于 2015-07-20T02:37:10.453 回答
7

最终,我最终使用 gdata python 库来获取所有组的列表及其各自的 URL。从那里我使用 selenium 来抓取组中的消息和所有回复。可能不是最好的解决方案,但它可以满足我的需要。

于 2014-06-18T21:19:54.970 回答
2

我使用 selenium 和 htmlunit 制作了一个简单的废料实用程序。你可以使用它。它不是很优化,只能帮助你下载小组消息(最多 7000 条消息)

https://github.com/himukr/google-grp-scraper

于 2015-04-29T04:49:07.043 回答