我正在尝试制作一个程序,可以自动扫描用户桌面上的图像或文本,然后将其转换为.txt
文件以进行文本分析。
到目前为止,我已经找到了可以转换PDF
为. 但是我想让我的程序以特定的时间间隔自动扫描桌面屏幕,而不是手动输入源,例如:HTML
.txt
$pdf2txt.py samples/simple1.pdf
我不知道从哪里开始,所以任何建议都会受到赞赏。
我正在尝试制作一个程序,可以自动扫描用户桌面上的图像或文本,然后将其转换为.txt
文件以进行文本分析。
到目前为止,我已经找到了可以转换PDF
为. 但是我想让我的程序以特定的时间间隔自动扫描桌面屏幕,而不是手动输入源,例如:HTML
.txt
$pdf2txt.py samples/simple1.pdf
我不知道从哪里开始,所以任何建议都会受到赞赏。
首先,桌面只是文件目录中的一个位置,例如:
C:\Users\Kirsteen\Desktop
因此,下一步是在此目录中搜索您感兴趣的文件类型。您的目标是生成需要转换的有效文件名列表。此Q/A可能会对您有所帮助。
找到文件后,运行您拥有的那些转换脚本。要自动重复此操作,请将所有这些都放在一个循环中并添加一个延迟,以便它每小时/每周运行一次。
整理一下,考虑在后台运行这个过程,并确保程序不会多次转换文件(如果它们没有更改)。