问题标签 [pdf-conversion]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1567 浏览

c# - itextsharp PdfTextExtractor 拼写错误

我们的数据库中有一个 PDF 格式的二进制文件。我将其流式传输并保存为 PDF 文件,并使用两个源进行了测试,最终得到相同的结果:PdfTextExtractor 拼错了一些单词。

例如,PDF 中有一个词“已确认”。PdfTextExtractor 转换后,拼写为“已确认”。

我在调试中逐步完成该过程,它在被 PdfTextExtractor 转换后立即拼写错误,所以我确信它不是不准确的,因为我正在做一些事情。

我能做些什么来提高 PdfTextExtractor 的准确性吗?

这是我目前正在使用的代码:

0 投票
1 回答
2343 浏览

file-upload - 使用 Carrierwave 在 Rails 中上传 PDF 并将每个页面转换为 PNG/JPEG 并将它们保存到新模型

我对使用carrierwave很陌生。目前我可以上传和对图像执行简单的操作,例如 resize_to_fit。
现在我需要更改我的 name-uploader.rb 文件,所以当我上传 PDF 文件时,它会自动将 pdf 转换为多个图像文件 (PNG/JPEG)。我想了解的一件主要事情是如何检查上传文件的类型?我知道我可以设置要接受的文件类型列表,我已经设置了接受的文件类型列表。
现在,当上传 pdf 文件时,我希望将其转换为多个图像,并为每个图像创建一个包含特定数据和图像的新模型。

  • 如何查看上传文件的类型?
  • 如何将 PDF 转换为多个图像(PNG/JPEG/等)文件?
  • 我可以创建模型,或者从另一个控制器调用一个操作来使用 uploader.rb 文件中生成的 png 来创建模型吗?
  • Carrierwave 是这项工作的工具还是我应该使用另一个 gem 来上传文件?

我用过convert => "png",但它给了我一个错误。

注意:我已将 RMagic 包含在文件的顶部。

谢谢,

0 投票
1 回答
332 浏览

marklogic - Guidelines for PDF Conversion

I am using MarkLogic to generate XML files for PDF documents which has images, formatted text (italic and bold), tables etc. Can you please provide some guidelines for the best conversion. I am using normal conversion with following pipelines:

  • Conversion Processing
  • DocBook Conversion
  • HTML Conversion
  • PDF Conversion
  • PDF Conversion (Page Layout, Image Batching)
  • Status Change Handling

The images are not maintained with their title and format also not maintained. Tables are appearing as normal paragraph in the generated XML.

0 投票
1 回答
6386 浏览

c# - 使用 PdfSharp 将 C# 中的 Windows 表单转换为 PDF

我正在尝试将 C# windows 窗体的当前内容转换为 pdf 文档。

我正在使用 PDFSharp dll 进行转换,我不确定如何捕获 Windows 表单并将其转换为 PDF。我认为我应该使用该XGraphics.DrawImage()方法来复制 windows 窗体的内容。

任何帮助或建议将不胜感激!

0 投票
1 回答
402 浏览

segmentation-fault - SWFTools 分段错误

我知道有类似的问题(这里这里),但没有一个答案对我有用。

运行时出现pdf2swf sample.pdf -v -o sample.swf分段错误

“-O 1”标志不起作用,dmesg没有帮助:

我有一个类似的服务器,swftools 工作正常并成功处理相同的文件。我已经尝试像在我的其他服务器上一样安装两个版本 0.9.1,以及在没有帮助的情况下安装可用的最新版本。

我已经安装了以下命令:

有谁知道有什么帮助?

0 投票
1 回答
1361 浏览

windows-server-2008 - 批量/命令行将 Omniform 转换为 PDF

我们有大量的 Omniform 文件(大约 100,000 个)。我们正在将我们的主服务器操作系统从 Windows Server 2003 更新到 Windows Server 2008。Windows Server 2008 不支持 Omniform,因此我们需要将这些文件转换为 pdf(或其他可查看格式)。

到目前为止我已经尝试过:在使用 Process.StartInfo 并使用 PDF Writer 打印机的程序内部使用 Print 或 PrintTo 动词。

使用 Print 动词直接从命令行使用 Print,并将 PDF Writer 设置为默认打印机:

这两个都打印成功并出现PDF。但是,它只打印表格,而不打印输入数据的表格。也就是说,您将得到姓氏,然后是空白,而不是显示输入的姓氏。

如果我打印到普通打印机而不是 PDF Writer,我会得到相同的行为。只显示没有输入数据的表格。

我试过打电话给 Nuance 技术支持,他们建议一次手动进行 1 次。鉴于这需要某人大约半年的全职工作才能完成,这对我们来说不是一个可行的选择。

所以我正在寻找的是以下之一:

  1. 上面命令行打印的解决方案
  2. 一个可以将 OFM 转换为 PDF 的程序。如果需要,这可以是多个步骤(ofm 到 doc,doc 到 pdf 等)。免费软件或购买。
  3. 一些第三方查看器至少可以打开 Omniforms 以在 Server 2008 下查看。(请注意,我们已经尝试安装omniform,但没有成功,如果有人知道如何让它工作,这也是一种选择)。

任何这些方面的帮助将不胜感激。

0 投票
1 回答
2325 浏览

ios - 在 adobe 中打开时 PDF 的颜色与在预览中打开时的颜色不同

我目前正在开发一个应用程序,该应用程序将生成以前由不同(基于 Windows 的应用程序)生成的 PDF。

我将 UIView 转换为 PDF,它可以 100% 工作。问题是,当我将该 PDF 从 ipad 发送到我的 PC 并在 Adob​​e 中打开它时,PDF 中所有绿色的 RGB 值不同,但其他颜色则不同。它非常接近正确的颜色,与原始颜色相比显得暗淡无光,我正在为一个说它必须 100% 相同的客户开发。

如果我在预览中打开两个 PDF,那么 RGB 值在两者上都是正确的,但在 adobe 中是错误的。

我尝试稍微捏造这些值,并使用我能找到的每个不同的颜色选择器来尝试让它们看起来一样,但运气不好。

我试图获得的 RGB 值是:R:78 G:135 B:38。

我回来的是:R:62 G:119 B:57。

我会发布图片,但还不是足够高的用户

如果您需要对我所说的内容进行任何澄清,请告诉我。

提前致谢

0 投票
1 回答
151 浏览

pdf - PDF到源转换

有没有办法找到构建任何 PDF 的来源?原因是如果它是从 XML 构建的,那么我想知道我是否可以从 PDF 中获取 XML 并解析 XML?

0 投票
0 回答
35 浏览

pdf - 可以在 Flash Player VB 中播放 pdf 文件吗?

可能重复:
在 Flash Player 中打开 PDF 或文件夹

在我的 VB windows 应用程序中,用户将上传 pdf 文件,我必须在 flash 播放器中显示它。所以,我想将 pdf 转换为 exe 文件,然后我可以通过调用openwith对话框轻松地玩 flash 播放器下面的shell命令。

但我不知道是否可以通过 VB 将 pdf 文件转换为 exe 文件。如果没有,请建议我在 Flash 播放器中播放 pdf 的好方法...

或者有什么办法可以将 pdf 文件播放到 flash 播放器中?

0 投票
2 回答
646 浏览

ms-word - 用于将 pdf 转换为 word 的 asp.net 网络应用程序

是否有任何清晰和适当的过程可以将 pdf 文件转换为包含 asp.net 网络应用程序中所有格式和图像的 word 文件?