我想生成 PDF 文件或转换使用 Tj 运算符表示字符串的现有 PDF 文件,用 Tl 表示文本前导,它不应包含 TJ 运算符和 TD 运算符。我必须在 acrobat distiller server 6.0.1 或 adobe illustrator 的设置中进行设置。在这个问题上帮助我。
目前我正在使用这些运算符来识别和搜索文本并将它们存储为字典以用于我的目的。
我想生成 PDF 文件或转换使用 Tj 运算符表示字符串的现有 PDF 文件,用 Tl 表示文本前导,它不应包含 TJ 运算符和 TD 运算符。我必须在 acrobat distiller server 6.0.1 或 adobe illustrator 的设置中进行设置。在这个问题上帮助我。
目前我正在使用这些运算符来识别和搜索文本并将它们存储为字典以用于我的目的。
我不认为 Distiller 支持任何类型的东西。
我建议您找到一种更好的方法来提取文本。即使您的所有文本都使用Tj
而不是其他文本显示运算符之一(不仅仅是 TJ),如果您遇到自定义编码,您仍然会遇到麻烦。让已经解决此问题的其他人为您完成。
有很多程序可以很好地从 PDF 中提取文本。最好的仍然是 Acrobat/Reader……因此,如果您无法从 Reader 中选择/复制/粘贴文本,那么其他软件也将无法工作……保存 OCR(O potical C character R ecognition)。
我偏向于iText (Java) 和iTextSharp (C#)……我是一名提交者。尽管如此,还有相当多的其他应用程序在做基本相同的事情......坐在免费软件/自由软件/商业领域的各个地方。哎呀,iTexts位于该范围内的几个地方。:翻白眼: