我在 Drive 上有 200 多个文件,主要是文本、文档和 pdf。我需要从他们那里提取电子邮件地址,放入电子表格中。
有没有可以让我的生活更轻松的脚本(Python、PHP?)?
我在 Drive 上有 200 多个文件,主要是文本、文档和 pdf。我需要从他们那里提取电子邮件地址,放入电子表格中。
有没有可以让我的生活更轻松的脚本(Python、PHP?)?
不,如果没有大量代码,这似乎不太可能。我个人会做的是打开谷歌文档中的每个文件,搜索@
并一次复制一个(你必须找到多少封电子邮件?)。
如果您需要使用 python 执行此操作,则必须下载所有文件(使用 google drive 很容易)。然后浏览每种文件格式并使用特定的方法。
对于文本,只需使用正则表达式读取每个文件with open("filename") as file:
并逐行搜索电子邮件。re.search
.
对于doc,首先将其转换为python可以打开的文件,catdoc
然后以文本形式打开。
如果您需要完全自动化所有这些,您可能需要查看用于下载的网络自动化包,或者使用api构建 google drive/docs 扩展。