我正在使用TIKA 解析器从 PDF 中提取文本,但它会将tika-server.jar下载到 C:\Users\User\AppData\Local\Temp 中。如果我稍后清理“临时”,有没有办法让它永久化?我们可以在生产中使用 TIKA 解析器吗?
尝试了其他库,如pyPdf2,但它适用于某些文件,不适用于其他文件。
我正在使用TIKA 解析器从 PDF 中提取文本,但它会将tika-server.jar下载到 C:\Users\User\AppData\Local\Temp 中。如果我稍后清理“临时”,有没有办法让它永久化?我们可以在生产中使用 TIKA 解析器吗?
尝试了其他库,如pyPdf2,但它适用于某些文件,不适用于其他文件。