@echo off
for %%j in (*.pdf) do (
java -jar pdfbox-app-1.7.1.jar PDFToImage %%j
)
if exist *.jpg (
for %%i in (*.jpg) do (
mkdir %%~ni
tesseract %%i %%~ni.txt
move %%i %%~ni
move %%~ni.txt %%~ni
)
)
所以我有这个命令,它基本上可以转换:
- 将 pdf 文件转换为 jpg 文件。
- 对于所有 JPG 文件,它会创建相应的文件夹。
- 它使用 tesseract 软件将图像文件转换为文本文件。
- 将 JPG 文件移动到我刚刚创建的相应文件夹中(works)。
- 将文本文件移动到我刚刚创建的相应文件夹中(不起作用)。
谁能告诉我如何制作它,以便它将文本文件移动到相应的文件夹中,就像我对图像文件所做的那样?所以最后对于每个文件夹,它将包含图像文件和文本文件。谢谢 !