问题标签 [pdf-conversion]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 是否有任何 ePub 库
我想编写让我完全控制将 PDF 转换为 ePUB 的转换器?我正在寻找的是转换器
- - 不应该删减最后一行的单词。如果文本是一个段落,那么 epub 必须是一个段落,没有任何额外的空格字符和剪切词。
- - 应识别 pdf 文档中的书签,并应在 epub 版本中创建目录 (TOC)。
- 应该调整图像的大小。
- 应该是 UTF8,它必须与土耳其字符兼容。
请为此建议我任何图书馆?
pdf-conversion - PDF转HTML或类似
我正在构建一个应用程序来通过浏览器查看 pdf,而无需移动设备上的插件。我尝试使用 ImageMagick 和 ghostscript 将页面转换为图像,但它们太大并且文本变得不清楚。我看到网站提供了将 pdf 转换为 html 的服务并进行了一项下降工作,但我找不到如何完成此操作的示例。任何帮助深表感谢。谢谢!
.net - HTML (URL) 到 PDF 转换器是否作为小部件类型服务存在
我们正在尝试在我们自己的服务器上快捷地安装 .Net PDF 创建器。是否有任何应用程序可以嵌入到站点中并允许用户生成该 URL 或其他 URL 的 PDF?免费或付费无关紧要,为客户构建,因此我们也在努力寻找高质量的 PDF 渲染,谢谢
PS或者有人可以建造这个吗?
flash - 将 Flash Frame 导出为 PDF
我正在寻找一个工具包/命令行/库,它可以让我将帧或 .swf 的单个帧导出为 pdf。我宁愿不必编写自己的转换器。
我正在寻找矢量解决方案……而不是位图。
swf2pdf 上有一个Swftools 线程......但我似乎无法关注它。如果可以更好地解释,或者如果有 gfx2gfx 的编译版本,将不胜感激。
pdf - 将文档从 PDF 转换为文本时如何处理 unicode 字符编码问题
我正在尝试从 PDF 中提取文本。PDF 包含印地语 (Unicode) 文本。我正在使用的提取实用程序是 Apache PDFBox ( http://pdfbox.apache.org/ )。提取器提取文本,但文本无法识别。我尝试在许多编码和字体之间进行更改,但仍无法识别预期的文本。这是一个示例:假设 PDF 中的文本为:पवार
提取后的内容为:̄Ö3⁄4ÖÖ ̧ü
有什么建议吗?
java - java excel到pdf的转换
我需要将xlsx文档转换为pdf格式。我知道iText可以保存 pdf 文档,而Docx4j可以读写 xslx。事实上,我们的应用程序同时使用两者来构建报告。但是我们有非常困难的模板,所以我不能只阅读 xslx(docx4j) 并将其写入 pdf(iText)。格式会丢失,所以我需要另一个转换库。我还听说过像 ( Jxcell ) 这样的商业库,但想使用开源解决方案。
谁能帮我?
c# - 办公文件转PDF
我已经看到了一些关于此的主题,但在我的搜索中没有得到非常直接的答案。我有一个需要接收 doc、docx、xls、xlsx 文件并将它们转换为 PDF 的 Web 应用程序。现在我们有一个使用 Microsoft.Office.Interop.Word 库的进程,它打开文档,将其打印为 PS 文件,然后 GPL GhostScript 将 PS 文件转换为 PDF。
这个过程工作正常,但总的来说有几个步骤,这最初是几年前开发的,当时更难找到 PDF 打印驱动程序和接口。本着更新的精神,我正在寻找一种可能的更好的方法来处理这个问题。主要原因是在我们的应用程序中,我们使用 Web 服务调用来执行转换过程的提升操作,使用较新的 Windows 服务器,特别是用于开发的 Window 7,即使使用模拟打开文件的能力也会导致一些问题与互操作库。
我确信所有这些都可以弄清楚并解决,但我想知道是否有更新更好的方法来解决这个问题。我研究了 PDF995,但没有找到一种以编程方式进入并将文件直接打印到 PDF 的好方法。他们提供的代码是 C++ 中的,我没有找到如何模仿 C# 中的调用。
javascript - 使用 javascript 将 PDF 转换为 DOM
我已经做了很长一段时间了,我能发现的只是这个pdf2dom解析器,可能是这个的逆向工程版本。无论如何,这是我的问题。对于任何渲染引擎,它的输入应该是数据流(在我的例子中是 pdf 内容),它的输出应该是选定的格式(在我的例子中是 DOM、HTML 和 CSS)。
但是,不是使用 java 或 c++,我是否有可能从服务器获取“pdf 数据”流(这是我不知道的)并存储到 javascript 变量中并使用 javascript 呈现并附加它到 DOM?
原始“pdf数据”如何出现(是否有任何特定格式..等)?
欢迎所有输入。
注意:应该与 IE 兼容。
javascript - 如何使用 pdf.js
我正在考虑使用pdf.js(一种允许在网页中嵌入 pdf 的开源工具)。没有任何关于如何使用它的文档。
我假设我所做的是使用标题中引用的脚本制作一个 html 页面,然后在正文中,我使用文件名和位置数组进行某种函数调用。有谁可以帮我离开这里吗?
c# - SharePoint2010 中的 ConversionJob 将 docx 转换为 pdf 需要很长时间或非常慢
我一直在SharePoint 2010中使用ConversionJob将 docx 文件转换为 pdf,这需要很长时间,大约 10 分钟。
这真的很慢还是因为我服务器上的资源有点慢?因为我的开发服务器需要 10 分钟,我担心通过互联网花费的时间。
在 SharePoint 2010 中是否有任何方法可以使其更快或使用任何其他解决方案?
我首先使用 C#、Open XML 来操作和创建 docx,然后使用 SharePoint 2010 ConversionJob 转换为 pdf。