问题标签 [odt]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
1395 浏览

emacs - emacs org-odt-export-as-odf-and-open odt 外部 emacs

orgmode 选项用于导出和查看 odt 文件的直观用途应该是在 libre/open 办公室中查看它。但是,到目前为止,我还没有让它发挥作用。它总是在 emacs 中作为压缩存档打开。通过插入我的 .emacs

在访问 org 文件中的文件链接时,我会正确打开它们,但它似乎不会影响导出和查看选项。我已经考虑过改变org-odt-export-as-odf-and-open,但没能看到它有什么不同。任何帮助,将不胜感激。再一次,我想org-odt-export-as-odf-and-open用 xdg-open 或 libreoffice 打开 odf,而不是 Emacs。

谢谢!

0 投票
2 回答
7227 浏览

windows - 在 Windows 上使用 Openoffice 将 ODT 转换为 PDF

我的 Windows 系统中有许多 .odt 文件。我想将这些文件转换为 PDF。我在命令行中尝试过

soffice.bin --headless -convert-to pdf:"writer_pdf_Export" c:\MyOdtFile.odt

但是,它不起作用。此方法只能打开文件,不能转换!我怎样才能做到这一点?

0 投票
2 回答
6768 浏览

python - Python -- 解析文件(docx、pdf 和 odt)并将内容转换为我的数据模型

我正在编写一个用于导入 docx、pdf 和 odt 文件的导入/导出工具;其中写了一本书。

我们已经有了 .epub 格式的工具,并且我们希望将功能扩展到此之外,以便网站的用户可以拥有更大的灵活性。

到目前为止,我查看了PDFMiner,还发现 docx 只是基于openxml格式,所以 word/document.xml 本质上是包含整个内容的文件,我可以用 lxml 解析它。

我的问题是:我希望解析这些文件的内容,并从该内容中提取章节名称、图像(如果有)和章节文本等内容,以便将内容放入数据模型中的:

显然,PDFMiner 有一个 .get_outlines() 函数,它将为我返回 TOC。但它不能将任何返回的元组(章节编号和标题)链接到该章节的实际页面。

更成问题的是 docx/odt;这些只是段落 -- <\w:sdt> -- 元素,带有 attrs 和子元素。

我正在寻找从这些文件类型中推断出一些结构感的想法,如果需要,我可以将这些想法(2 或 3)应用为我们希望通过其中一个导入书籍的用户的建议格式文件格式。

0 投票
1 回答
15368 浏览

c# - 从 OpenDocument ODT 文件获得的具有文档规范的字节数组或字符串加载 XML 的最佳方法是什么?

(注意:最初的问题标题是:从带有文档规范的字符串中加载 XML 的最佳方法是什么?)

我需要从 XmlDocument 对象中的 ODT opendocument (LibreOffice) 文件中获取 XML 内容。ODT 是一个 zip 存档,我设法将 content.xml 部分作为字节数组获取。转换为字符串似乎很简单,但我惊讶地发现 XmlDocument.LoadXml(string) 不接受以 Xml 文档规范行开头的字符串,例如:

例外是:Data at the root level is invalid. Line 1, position 1

我想知道是否有一个库调用来读取这样的字符串?

现在我使用我即兴创作的这个函数,但是在处理 xml 文档时必须在字符级别上做一些事情感觉不必要的复杂:

有没有更好的办法?

注意:我指的是这个较早的问题

但这解决了解析字符串的问题,将字符串转换为字节数组的解决方案,而我不应该解析字符串,也不会将字节数组转换为字符串,而只是跳过这一步直接解压 ODT 后解析字节数组。

0 投票
0 回答
73 浏览

php - 直接通过 php 打开 odt 文件中的 content.xml

是否可以直接通过 php 在 odt 容器(这是一个 zip 容器)中打开 xml 文件?现在我手动提取 odt-container 以从中获取 content.xml 文件。如果我的 php 脚本可以直接处理 odt 文件会容易得多。

更新: $reader->open('zip://'.$odt_file.'#content.xml')

0 投票
1 回答
776 浏览

java - 使用 Java 将 docx/ODT 转换为图像

我正在开发一个基于 Spring REST 服务的 Web 应用程序(UI 基于 HTML5,backbone.js)。实际要求是,上传的文档(可以是任何文档,如 excel、word、ppt、pdf 等)需要一个预览选项,用户可以使用该选项在浏览器中查看文档(用户可能安装或未安装 Office)。

我的想法是将文档转换为图像并将其显示给用户。在搜索中,我发现了多种将 PDF 转换为图像的方法,但没有多少 ODT 到图像(注意:我正在寻找一个开源)。JODConverter, docx4j 可用于将文档转换为 pdf。然后我可以将这些 PDF 转换为图像。但这是正确的方法吗。有没有其他有效的方法来实现同样的目标。请建议并指出正确的方向。

提前致谢。戈皮

0 投票
1 回答
3537 浏览

python - 搜索和替换文本 odfpy

我正在尝试使用 odfpy 为程序制作报告。我的想法是搜索每个关键字,如 [[[e_mail_address]]] 并将其替换为数据库中的一个单词。我在 odfpy api 中找到了函数文本,但转换为字符串会丢失格式。odfpy安装文件中有一个文件:api-for-odfpy.odt。在第 6.2 点 Teletype 模块中,编写了如何从文档中获取所有文本并将它们放入列表中:

现在我正在寻找将当前文本替换为另一个文本的方法。也许:

但是使用时总是出错。如果您有任何使用 odfpy 的经验,请提供帮助。

0 投票
1 回答
78 浏览

wcf - 使用 ODT/ODAC 生成的 EDMX,上下文类未显示在域服务类中

我正在关注使用 Silverlight 创建 RIA 服务解决方案的 msdn 演练。这是文章链接。我已经关注了至少 4 篇其他文章,并在 Internet 上发现了十几篇文章,但所有这些文章都是从 SQL 服务器创建 edmx。就我而言,我必须在后端使用 Oracle,所以我通过 Oracle Development Tool、Oracle Provider for .Net 创建了数据模型。

甲骨文提供者

生成 edmx 并构建所有内容后,

在此处输入图像描述

我继续创建一个域服务类以使用 silverlight 项目中的类,但由于某种原因,上下文类没有加载到它应该加载的下拉列表中。

在此处输入图像描述

由 edmx 生成的示例类如下所示

在此处输入图像描述

我一直在尝试这样做一个星期,在尝试了六次之后,我需要帮助。

0 投票
1 回答
420 浏览

php - odtphp 中的行段

我目前正在使用 odtphp 生成一些发票。(https://github.com/cybermonde/odtphp

我制作了一个包含动态表的段(因此也使用段),因此我使用[!-- BEGIN row.segmentname --]and[!-- END row.segmentname --]标记。

我的第一个段正在工作,但行段不起作用。

这是它打印的错误:

致命错误:未在文档中找到带有消息“详细信息”段的未捕获异常“OdfException”

这是代码中不起作用的部分:

有没有人经历过这个?

我应该怎么做才能完成这项工作?

0 投票
1 回答
1669 浏览

html - LibreOffice 命令行转换模板

我有一个小应用程序可以使用 soffice 命令行将 HTML 文件转换为 ODT。我想为转换添加一个模板。

那可能吗?

我尝试使用-n template.ott(from man libreoffice) 但不起作用。这template.ott是一个简单的模板,标题上有图像。