twitter - 如何使用 twarc 从包含许多 .txt 文件的目录中补充 Tweet Id 并将它们保存为 csv 文件（python）

翻译自：https://stackoverflow.com/questions/71245305 2022-02-23T23:37:54.447

14 次

我一直在使用 DocNow hydrator ( https://github.com/DocNow/hydrator ) 来为包含 Tweet ID 的 txt 文件中的推文添加水合物。现在，我在一个文件夹中有 100 多个 txt 文件，使用 hydrator 应用程序非常麻烦，因为我必须逐个文件处理这个文件。相反，我想编写一个 python 脚本来循环遍历所有的 txt 文件，对它们进行水合并将它们中的每一个保存到一个 csv 文件中。

制作一个巨大的 txt 文件是不可行的，因为我正在处理超过 10 亿条推文，而且我将无法用 excel 打开生成的 csv 文件（尽管可能有我不知道的方法），因为它太大了。

有人可以帮助我使用 twarc ( https://github.com/DocNow/twarc ) 编写这样的脚本吗？我对python很陌生，不知道该怎么做。非常感谢您！

twitter - 如何使用 twarc 从包含许多 .txt 文件的目录中补充 Tweet Id 并将它们保存为 csv 文件（python）

0 回答 0

Related

Reference