我将 [Redpaper][1] 下载到我的笔记本电脑上,然后转到Document Conversion Demo,单击选择您的文件并上传我刚刚下载的 PDF,然后单击Answer units JSON作为所需的输出格式。起初,我没有看到任何事情发生。点击输出文档右侧的下载图标,我将转换后的 JSON 输出作为下载文件,并将其填写在网页上。重新加载页面,我得到了转换显示在演示页面上,而无需点击下载。
我是 Node.js 的新手。我使用当前包(即 version )获得了以下代码(基于通过 Node 进行的文档转换) 。watson-developer-cloud
1.8.0
var watson = require('watson-developer-cloud');
var fs = require('fs');
var document_conversion = watson.document_conversion({
username: 'username',
password: 'password',
version: 'v1',
version_date: '2015-12-15'
});
document_conversion.convert({
file: fs.createReadStream('redp5213.pdf'),
conversion_target: "ANSWER_UNITS"
}, function (err, response) {
if (err) {
console.error(err);
} else {
console.log(JSON.stringify(response, null, 2));
}
});
这确实需要十到二十秒才能在咖啡店 WiFi 上运行。
哦,我忘了解决你的问题“为什么[它]试图转换为 HTML ”?文档转换服务总是先转换为 HTML,然后再转换为规范化的 HTML。对于答案单元或纯文本,它需要一个额外的步骤,将规范化的 HTML 转换为请求的格式。这在文档转换 - 定制中有所描述(这让我觉得奇怪的是基本流程文档不碍事)。
[1]:http : //www.redbooks.ibm.com/redpapers/pdfs/redp5213.pdf