问题标签 [acrobat]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
376 浏览

html - 有没有办法在 Perl 中使用 Acrobat Reader 将多个 PDF 文件保存为 HTML 文件?

我正在使用Xpdf从 PDF 文件中提取文本,这与-raw选项配合得很好,但现在我们想将 PDF 文件转换为 HTML 文件,以提取 HTML 格式化标签,如粗体 <b>、斜体 <i> 等与文本。带有该选项的 Xpdf-html确实有效,我也尝试过为此使用 pdf2html,但发现它不可靠,因为缺少像 <sup> 和 <sub> 这样的标签。

我们现在使用 Acrobat Reader 将 PDF 文件保存为 HTML 文件,它为我们提供了所有 HTML 格式标记。

有没有办法在 Perl 中使用 Acrobat Reader 将多个 PDF 文件保存为 HTML 文件?

谢谢你。

0 投票
1 回答
93 浏览

sifr - 在 Acrobat 9.1.2 中捕获页面时出现 sIFR 错误

在使用 Adob​​e Acrobat Standard 9.1.2 及其内置网站抓取器时,我在 PDF 中出现以下错误,“使用 sIFR 3,修订版 436 渲染”。

有没有办法强制 Acrobat 呈现纯文本而不是 flash 测试?或者一种使 sIFR 与 Acrobat 站点抓取器兼容的方法?

请注意,该站点在 Firefox 3.5 和 IE7 中显示良好。其他论坛帖子表明浏览器中的此类错误表明 sIFR 和 javascript 版本不匹配。

0 投票
1 回答
3197 浏览

c# - 使用 Acrobat 插件打印多个 PDF (axAcroPDF1)

我有一个 Windows 应用程序,我想在其中向打印机发送列表框中的 PDF 列表。单步执行下面的代码,我可以看到 *axAcroPDF1.LoadFile(s) 正在加载我的应用程序中的每个文件,但 Acrobat 似乎只将 lbPDFList 列表框中的最后一项打印到打印机(例如,如果有 4 个 PDF打印,它总是只打印最后一个 PDF)?

这是线程问题吗?

0 投票
1 回答
1654 浏览

javascript - 从单个组合框中导出多个值?(土坯杂技演员)

我正在尝试从组合框字段的每个项目中导出 2 个值。

我找到了两种将项目插入组合框的方法:

1) 插入项目在

http://www.verypdf.com/document/acrobat-forms-javascript/pg_0048.htm

2) 设置项目

http://livedocs.adobe.com/acrobat_sdk/9/Acrobat9_HTMLHelp/wwhelp/wwhimpl/common/html/wwhelp.htm?context=Acrobat9_HTMLHelp&file=JS_API_AcroJS.88.748.html

但是这两种方法都不允许使用两个参数(在 Acrobat JavaScript 调试器的参数列表错误之后,我总是得到“丢失)”)

有谁知道这个问题的更好解决方案?谢谢!

0 投票
1 回答
2421 浏览

adobe - Adobe Acrobat 和 WebDAV

我正在尝试打开和编辑(添加注释)并将 PDF 保存到 IISWebDAV 存储库。我在 XP SP2 上使用 Acrobat Pro 9.0 和 IIS 5.0。

  1. 我需要能够从 Winform 应用程序以编程方式打开 Acrobat。我尝试使用 Process.Start(url),但它会在浏览器文档中打开 PDF。在 Acrobat 中尝试了以下设置,但没有成功。 http://www.mydigitallife.info/2007/06/17/disable-pdf-from-opening-in-web-browser-ie-firefox-opera-safari/

尝试了以下代码,但它打开了命令提示符并且没有打开 Acrobat。字符串 url = " http://localhost/SampleWebDAV/Root/TestDoc100.doc "; 进程 p = new Process(); p.StartInfo.FileName = Environment.GetEnvironmentVariable("COMSPEC"); p.StartInfo.Arguments = "/c \"start \"" + url + "\""; p.Start();

  1. Acrobat 不会发出 LOCK/UNLOCK WebDAV 命令。Acrobat 9.0 发行说明说它支持 WebDAV,但如果我用 fiddler 拦截请求,我可以看到只有 GET、PROPFIND 和 PUT 命令正在发生。我看不到 LOCK 和 UNLOCK 命令。

谢谢。!

0 投票
6 回答
3426 浏览

pdf - 有没有办法在 Adob​​e Acrobat 中向 PDF 中的链接添加“替代文本”?

在 Adob​​e Acrobat Pro 中,向页面添加链接并不难,但我想知道是否还有一种方法可以向链接添加“替代文本”(有时称为“标题文本”)。在 HTML 中,这将是这样完成的:

然后,当鼠标悬停在链接上时,文本会显示为一个小工具提示。是否有 PDF 的等价物?如果是这样,你如何添加它?

0 投票
1 回答
474 浏览

javascript - 在 Acrobat Javascript 中从 XML 数据创建数组时遇到问题,如果可以,请提供帮助

我有一个手动创建的数组,它已经在下面的示例中工作:

现在上面的这个数组只是数组中的一个值,它工作正常。这是我试图用来动态更改值的 XML。

我在 Acrobat 中解析得很好。现在我想让数组在使用这些值时为我工作。如果我在下面有以下内容,它将起作用。

其中 part.item(i).indent.value 等于缩进节点的值等。

一旦我尝试使用直接 part.item(i).breakDownIndexNo.value 使 breakDownIndexNo 节点中的 179 值成为动态值,它将无法编译。Acrobat 正在使用 javascript,所以我不确定为什么我无法解析它。

我试图从 breakDownIndexNo 节点创建一个变量,并将其键入一个字符串和一个整数。这将让它创建数组,但它不会让我从数组中输出。newArr[indexNum].partNum 给我“没有属性”,如果我手动将索引号设置为 179,newArr[179].partNum 将打印出 part.item(i).indent.value 的值。

如果你们有任何想法或答案,请告诉我。

0 投票
5 回答
17070 浏览

c# - 在指定目的地以编程方式打开 pdf 文件

我想使用 WinForms (C#) 在指定目的地打开一个 PDF 文件。这是我的代码:

它总是在第 1 页打开文件,即使在第 10 页有目标 Test2。它基本上忽略了目标参数。但是,如果我使用像页码这样的另一个参数,它就可以正常工作。例如:

将始终在第 5 页打开 PDF 文档。

在此先感谢您的帮助

0 投票
7 回答
46886 浏览

search - How to know if a PDF contains only images or has been OCR scanned for searching?

I have a bunch of PDF files that came from scanned documents. The files contain a mix of images and text. Some were scanned as images with no OCR, so each PDF page is one large image, even where the whole page is entirely text. Others were scanned with OCR and contain images and searchable text where text is present. In many cases even words in the images were made searchable.

I want to make an automated process to recognize the text in all of the scanned documents using OCR, with Acrobat 8 Pro, but I don't want to re-OCR the files that have already been through the OCR process in the past. Does anyone know if there is a way to tell which ones contain only images, and which ones already contain searchable text?

I'm planning on doing this in C# or VB.NET but I don't think being able to tell the two kinds of files apart is language dependent.

0 投票
2 回答
4257 浏览

pdf-generation - 使用标准 Acrobat 以编程方式组合 PDF 文件?

在 SO 和其他地方有很多关于使用非 Adob​​e 产品以编程方式组合 PDF 文件的建议。

有没有办法(相当容易)使用我的 Adob​​e Acrobat Standard(不是 Reader)的付费副本以编程方式将两个或多个 PDF 文件组合成一个新的 PDF 文件(我知道它可以通过组合 -> 多个文件手动完成)?

更喜欢命令(例如,复制 file1.pdf file2.pdf combine.pdf),但愿意求助于 VBA。

感谢您的任何想法!