尝试制作使用“转换为 TXT 文档”进行 pdf 到 txt 转换的 Automator 工作流程。但是在运行时,Abbyy FineReader 窗口会变为活动状态。是否可以在静音模式或最小化窗口下运行?
3 回答
这个 AppleScript 使用最新版本的 Sierra 为我工作。在我的系统上测试,它没有将 Abbyy FineReader 带到前台。
set thePDF to (choose file)
tell application "FineReader"
set resultFile to export to txt thePDF ¬
from file thePDF
end tell
您的新文本文件应出现在与原始 PDF 相同的目录中
我没有使用 Automator,所以我不知道您将使用哪种方法将 PDF 文件传递给这个 AppleScript。出于测试目的,我习惯使用“选择文件”命令。如果您使用 Automator 传递您在之前的 Automator 操作中指定的 PDF 文件,您只需从代码中删除“选择文件”命令。无论如何,您需要做的就是在您的 Automator 工作流程中添加一个“运行 AppleScript”命令。
如果要删除“选择文件”命令,则需要重新定义变量 thePDF 的值
注意 FineReader 实际上有一个扩展的 AppleScript 字典。我的回答包括用于导出为文本的许多其他选项的最小版本。这是选项的完整版本示例
tell application "FineReader"
set resultFile to export to txt directParamFile ¬
from file fromFileFile ¬
ocr languages enum ocrLanguagesEnumLanguageListType ¬
saving type savingTypeSaveSettingsEnum ¬
retain layout retainLayoutTxtLayout ¬
keep page numbers headers and footers keepPageNumbersHeadersAndFootersBoolean ¬
keep line breaks and hyphenation keepLineBreaksAndHyphenationBoolean ¬
insert page break character as page separator insertPageBreakCharacterAsPageSeparatorBoolean ¬
use blank lines useBlankLinesBoolean ¬
encoding encodingEncodingEnum
end tell
我决定不使用 FineReader 小程序。相反,我迁移到堆栈:tesseract + ImageMagick + gs。如果有人感兴趣,我在下面附上我的解决方案。
自动化外壳脚本
export PATH=/usr/local/bin:$PATH
/usr/local/bin/convert -density 300 "$@" -depth 8 -strip -background white -alpha off image.tiff
/usr/local/bin/tesseract -l rus image.tiff ~/Desktop/OCR
rm image.tiff
您可以在脚本编辑器中尝试此 applescript,将文件路径替换为您的文件。我没有安装程序,所以我没有测试它。如果它不起作用,也许它是你可以建立的东西,以获得你所追求的结果。
tell application "FineReader" activate
tell application "System Events" set visible of process "FineReader" to false
tell application "FineReader"
export to txt "/Path/to/filename/File_to_OCR.pdf" from file "/Path/to/filename/File_to_OCR.pdf"
end tell