0

我正在尝试制作一个程序,可以自动扫描用户桌面上的图像或文本,然后将其转换为.txt文件以进行文本分析。

到目前为止,我已经找到了可以转换PDF为. 但是我想让我的程序以特定的时间间隔自动扫描桌面屏幕,而不是手动输入源,例如:HTML.txt

$pdf2txt.py samples/simple1.pdf

我不知道从哪里开始,所以任何建议都会受到赞赏。

4

1 回答 1

0

首先,桌面只是文件目录中的一个位置,例如:

C:\Users\Kirsteen\Desktop

因此,下一步是在此目录中搜索您感兴趣的文件类型。您的目标是生成需要转换的有效文件名列表。此Q/A可能会对您有所帮助。

找到文件后,运行您拥有的那些转换脚本。要自动重复此操作,请将所有这些都放在一个循环中并添加一个延迟,以便它每小时/每周运行一次。

整理一下,考虑在后台运行这个过程,并确保程序不会多次转换文件(如果它们没有更改)。

于 2016-04-10T07:42:40.357 回答