问题标签 [file-conversion]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
command-line - 使用命令行 (os x) 将 dxf 转换为 svg
人们通常希望以相反的方式执行此操作,但我想使用脚本等将 dxf 图像转换为 svg。
如何?
php - 如何在 Windows 服务器上使用 php 将声音文件转换为不同的格式?
我的服务器管理员说,在共享的 Windows 服务器上,不能使用 'exec()'。我会使用 exec() 函数来运行 SoX CMD 命令。什么是替代方案?有趣的是他们说 SoX 已安装,但我如何在没有 exec() 的情况下使用它?我想要实现的是,当用户上传 .mp3 文件时,它会在服务器本身上转换为 .wav。
ms-word - 如何使用“antiword”读取包含间隙 i 文件名的文件?
我正在使用“antiword”将 MSword 文档转换为文本。我有一个名为“care job house keeper catering job13806.doc”的文件,如果在脚本中传递,antiword 无法读取此文件。
如果通过键入 antiword 并在文件名几个字符后按 Tab 手动输入文件名,它将如下所示并完美执行。
java - 如何知道没有扩展名的文件类型
在尝试提出一个基于 servlet 的应用程序来读取文件并操作它们(图像类型转换)时,我想到了一个问题:
- 是否可以检查文件内容并知道文件类型?
- 是否有标准规定每个文件必须在其内容中提供某种类型的标记,以便应用程序不必依赖文件扩展名约束?
考虑一个应用场景:
我正在创建一个能够将不同的文件格式转换为一组输出格式的应用程序。假设用户上传 PDF,我的应用程序可以建议可能的转换格式是 microsoft word 或 TIFF 或 JPEG 等。
由于我的应用程序将逐渐支持不同的文件格式(在一段时间内),我希望我的应用程序检查输入文件,而不是让用户指定格式。并向用户建议可能的输出格式。
我知道这是一个开放式的、广泛的问题。如果需要修改,请告诉我。
谢谢,阿尤斯曼
java - 将不同类型的文档转换为 pdf 的全包工具
我一直在网上寻找可以与 Java 一起使用的工具。无论是 Java API 还是命令行界面,我都可以创建一个 Java 包装器,让我能够将多种类型的文档转换为 PDF。
这是我需要能够转换为 PDF 的文档列表:
- 图像(.tiff、.jpeg、.png、.bmp、.gif)
- MS WORD (.doc, .docx)
- 文本文件(.txt、.rtf)
以下是我迄今为止在网络上发现的与 pdf 转换相关的一些注释
JODConverter - http://www.artofsolving.com/opensource/jodconverter 看起来可以将许多不同类型的格式转换为 PDF 不再积极开发免费
iText 将不起作用 - http://itextpdf.com/itext.php/ “iText 可以将 XML 或 XHTML/CSS 文件转换为 PDF(使用 XML Worker)。将文档从一种格式转换为另一种格式超出了 iText 的范围. 不:iText 不会将 Word 文档转换为 PDF!”
GhostScript - http://www.ghostscript.com/ 将 postscript 转换为 pdf 需要先找到将文件格式转换为 ps 的软件,这可能不是最好的解决方案 免费
Qoppa 软件 - http://www.qoppa.com/solutions/javapdf.html jPDFImages - 从 jpg、tif 和 png 图像创建 pdf jWordConvert - 将 word 文档转换为 PDF(doc、docx) 成本
imagemagick - http://www.imagemagick.org/script/index.php 一次将一个图像转换为 pdf 需要与批处理脚本一起使用,以将所有 pdf 组合成一个除了图像之外什么都不做。自由
如果有关这些产品的任何信息不正确,我们将不胜感激。
是否有一种仍然受到积极支持的解决方案,可以在一个软件中完成所有这些转换?
我觉得这是人们遇到的常见问题,必须有比将多个第三方产品组合在一起更好的解决方案。它可以是开源的,也可以需要许可证和资金。
vba - 为什么我的 Html 到 Excel 转换在循环文件时使用 VBA 会随着时间的推移变慢?
我需要不时将html文件转换为excel。大约有 9000 个包含表格的 html 文件。
我发现使用 excel 2007 vba 转换它们很有用,并制作了一个宏来完成这项工作,我已经考虑到 excel 的一个错误,它会在 Workbooks 上停止宏。按下 SHIFT 键时打开功能,除此之外我禁用了警报、事件和屏幕更新,并使应用程序不可见,因为我不想在我做其他事情时打扰我。
宏似乎很好,但是在运行时,我每分钟的转换率如下:
- 40
- 31
- 25
- 21
- 19
- 18
并且在 500 个文件转换后它现在一直在下降,其当前的速率是每分钟 8 个。
在 2359 个文件之后,速率降低到每分钟 2 个,在测试时我有 visible = true 并且看到打开工作簿需要更多时间。
所以问题似乎出在 Workbooks.Open 上,它在循环开始时尽可能快地工作,但在进一步的循环中它开始变慢。
有没有人偶然发现这个?有什么解决方法吗?我的代码缺少什么吗?有时宏仍然会停止执行,我假设该函数没有捕获 shift 键。
html - 如何在jenkins中导出渲染页面,例如带有html标记的控制台输出?
站点上可见的控制台输出(或构建日志)包含 html 标记(主要来自 ansi color 插件),我打算将其作为电子邮件通知的一部分通过 email-ext 导出(作为内容或附件)。是否有任何现有的插件/方法可以用来有效地做到这一点?除了 wget + dom 解析,我想不出更好的方法,我觉得这比较乏味。
pdf - 在VB6中将PDF文件加载到图片框中
我知道在“组件”窗口的“可插入对象”选项卡中,有“Adobe Acrobat 文档”,但这并不是我真正想要的。我不确定“控件”选项卡中的“Adobe Acrobat 7.0 浏览器控件类型库 1.0”(我尝试使用它时出错)是什么。
这是我需要的功能:
- 读取 PDF 文件中有多少页
- 将每个页面作为背景导入图片框
我在这里看到了关于将 PDF 转换为 TIFF 的内容,所以我不确定这是否是最好的方法?https://stackoverflow.com/questions/2...rt-pdf-to-tiff;我下载了 ImageMagick,但不知道如何使用它,但我会研究它(不确定我是否必须在 ImageMagick 的 convert.exe 上使用“Shell”,或者是否有更好的方法 [比如使用 DLL])
我也看到了这个:http ://www.quickpdflibrary.com/faq/c...age-to-pdf.php
这个看起来很有希望,但它似乎适用于 .NET:http ://social.msdn.microsoft.com/For...-c1d98a90a2a2/
我会努力解决这个问题,但是任何能指出我正确方向的东西都会受到赞赏,并且非常感谢详细的信息 - 甚至可能会获得赏金奖励。;)
html - 将 HTML 转换为 DOCX
我正在寻找将文档转换为HTML
文档的所有现有可能性DOCX
。
语境 :
我有一些用 HTML 编写和维护的文档(没有复杂的东西,只是简单H1
的 , H2
, P
,IMG
元素),我想将它们转换成word
文档。
一个Maven
插件会很棒,或者可以让我在应用程序的发布阶段进行这种转换的东西。
java - 如何将 .txt 转换为 XML
我想制作一个 java 代码,它接受这个 .txt 并将其输出为 .xml 。XML文件应该是同伴模式,例如
文本文件:
XML 中的输出应该是这样的: