我一直在使用 DocNow hydrator ( https://github.com/DocNow/hydrator ) 来为包含 Tweet ID 的 txt 文件中的推文添加水合物。现在,我在一个文件夹中有 100 多个 txt 文件,使用 hydrator 应用程序非常麻烦,因为我必须逐个文件处理这个文件。相反,我想编写一个 python 脚本来循环遍历所有的 txt 文件,对它们进行水合并将它们中的每一个保存到一个 csv 文件中。
制作一个巨大的 txt 文件是不可行的,因为我正在处理超过 10 亿条推文,而且我将无法用 excel 打开生成的 csv 文件(尽管可能有我不知道的方法),因为它太大了。
有人可以帮助我使用 twarc ( https://github.com/DocNow/twarc ) 编写这样的脚本吗?我对python很陌生,不知道该怎么做。非常感谢您!