问题标签 [pdf-conversion]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - itextsharp PdfTextExtractor 拼写错误
我们的数据库中有一个 PDF 格式的二进制文件。我将其流式传输并保存为 PDF 文件,并使用两个源进行了测试,最终得到相同的结果:PdfTextExtractor 拼错了一些单词。
例如,PDF 中有一个词“已确认”。PdfTextExtractor 转换后,拼写为“已确认”。
我在调试中逐步完成该过程,它在被 PdfTextExtractor 转换后立即拼写错误,所以我确信它不是不准确的,因为我正在做一些事情。
我能做些什么来提高 PdfTextExtractor 的准确性吗?
这是我目前正在使用的代码:
file-upload - 使用 Carrierwave 在 Rails 中上传 PDF 并将每个页面转换为 PNG/JPEG 并将它们保存到新模型
我对使用carrierwave很陌生。目前我可以上传和对图像执行简单的操作,例如 resize_to_fit。
现在我需要更改我的 name-uploader.rb 文件,所以当我上传 PDF 文件时,它会自动将 pdf 转换为多个图像文件 (PNG/JPEG)。我想了解的一件主要事情是如何检查上传文件的类型?我知道我可以设置要接受的文件类型列表,我已经设置了接受的文件类型列表。
现在,当上传 pdf 文件时,我希望将其转换为多个图像,并为每个图像创建一个包含特定数据和图像的新模型。
- 如何查看上传文件的类型?
- 如何将 PDF 转换为多个图像(PNG/JPEG/等)文件?
- 我可以创建模型,或者从另一个控制器调用一个操作来使用 uploader.rb 文件中生成的 png 来创建模型吗?
- Carrierwave 是这项工作的工具还是我应该使用另一个 gem 来上传文件?
我用过convert => "png"
,但它给了我一个错误。
注意:我已将 RMagic 包含在文件的顶部。
谢谢,
marklogic - Guidelines for PDF Conversion
I am using MarkLogic to generate XML files for PDF documents which has images, formatted text (italic and bold), tables etc. Can you please provide some guidelines for the best conversion. I am using normal conversion with following pipelines:
- Conversion Processing
- DocBook Conversion
- HTML Conversion
- PDF Conversion
- PDF Conversion (Page Layout, Image Batching)
- Status Change Handling
The images are not maintained with their title and format also not maintained. Tables are appearing as normal paragraph in the generated XML.
c# - 使用 PdfSharp 将 C# 中的 Windows 表单转换为 PDF
我正在尝试将 C# windows 窗体的当前内容转换为 pdf 文档。
我正在使用 PDFSharp dll 进行转换,我不确定如何捕获 Windows 表单并将其转换为 PDF。我认为我应该使用该XGraphics.DrawImage()
方法来复制 windows 窗体的内容。
任何帮助或建议将不胜感激!
windows-server-2008 - 批量/命令行将 Omniform 转换为 PDF
我们有大量的 Omniform 文件(大约 100,000 个)。我们正在将我们的主服务器操作系统从 Windows Server 2003 更新到 Windows Server 2008。Windows Server 2008 不支持 Omniform,因此我们需要将这些文件转换为 pdf(或其他可查看格式)。
到目前为止我已经尝试过:在使用 Process.StartInfo 并使用 PDF Writer 打印机的程序内部使用 Print 或 PrintTo 动词。
使用 Print 动词直接从命令行使用 Print,并将 PDF Writer 设置为默认打印机:
这两个都打印成功并出现PDF。但是,它只打印表格,而不打印输入数据的表格。也就是说,您将得到姓氏,然后是空白,而不是显示输入的姓氏。
如果我打印到普通打印机而不是 PDF Writer,我会得到相同的行为。只显示没有输入数据的表格。
我试过打电话给 Nuance 技术支持,他们建议一次手动进行 1 次。鉴于这需要某人大约半年的全职工作才能完成,这对我们来说不是一个可行的选择。
所以我正在寻找的是以下之一:
- 上面命令行打印的解决方案
- 一个可以将 OFM 转换为 PDF 的程序。如果需要,这可以是多个步骤(ofm 到 doc,doc 到 pdf 等)。免费软件或购买。
- 一些第三方查看器至少可以打开 Omniforms 以在 Server 2008 下查看。(请注意,我们已经尝试安装omniform,但没有成功,如果有人知道如何让它工作,这也是一种选择)。
任何这些方面的帮助将不胜感激。
ios - 在 adobe 中打开时 PDF 的颜色与在预览中打开时的颜色不同
我目前正在开发一个应用程序,该应用程序将生成以前由不同(基于 Windows 的应用程序)生成的 PDF。
我将 UIView 转换为 PDF,它可以 100% 工作。问题是,当我将该 PDF 从 ipad 发送到我的 PC 并在 Adobe 中打开它时,PDF 中所有绿色的 RGB 值不同,但其他颜色则不同。它非常接近正确的颜色,与原始颜色相比显得暗淡无光,我正在为一个说它必须 100% 相同的客户开发。
如果我在预览中打开两个 PDF,那么 RGB 值在两者上都是正确的,但在 adobe 中是错误的。
我尝试稍微捏造这些值,并使用我能找到的每个不同的颜色选择器来尝试让它们看起来一样,但运气不好。
我试图获得的 RGB 值是:R:78 G:135 B:38。
我回来的是:R:62 G:119 B:57。
我会发布图片,但还不是足够高的用户
如果您需要对我所说的内容进行任何澄清,请告诉我。
提前致谢
pdf - PDF到源转换
有没有办法找到构建任何 PDF 的来源?原因是如果它是从 XML 构建的,那么我想知道我是否可以从 PDF 中获取 XML 并解析 XML?
pdf - 可以在 Flash Player VB 中播放 pdf 文件吗?
在我的 VB windows 应用程序中,用户将上传 pdf 文件,我必须在 flash 播放器中显示它。所以,我想将 pdf 转换为 exe 文件,然后我可以通过调用openwith对话框轻松地玩 flash 播放器下面的shell命令。
但我不知道是否可以通过 VB 将 pdf 文件转换为 exe 文件。如果没有,请建议我在 Flash 播放器中播放 pdf 的好方法...
或者有什么办法可以将 pdf 文件播放到 flash 播放器中?
ms-word - 用于将 pdf 转换为 word 的 asp.net 网络应用程序
是否有任何清晰和适当的过程可以将 pdf 文件转换为包含 asp.net 网络应用程序中所有格式和图像的 word 文件?