3

我在 Drive 上有 200 多个文件,主要是文本、文档和 pdf。我需要从他们那里提取电子邮件地址,放入电子表格中。

有没有可以让我的生活更轻松的脚本(Python、PHP?)?

4

1 回答 1

1

不,如果没有大量代码,这似乎不太可能。我个人会做的是打开谷歌文档中的每个文件,搜索@并一次复制一个(你必须找到多少封电子邮件?)。

如果您需要使用 python 执行此操作,则必须下载所有文件(使用 google drive 很容易)。然后浏览每种文件格式并使用特定的方法。

对于文本,只需使用正则表达式读取每个文件with open("filename") as file:并逐行搜索电子邮件。re.search.

对于 pdf,请使用PyPDF链接

对于doc,首先将其转换为python可以打开的文件,catdoc然后以文本形式打开。

如果您需要完全自动化所有这些,您可能需要查看用于下载的网络自动化包,或者使用api构建 google drive/docs 扩展。

于 2013-06-13T16:36:25.323 回答