-1

我正在尝试在服务器端解析 PDF 表单。我尝试了许多 node.js 模块,如 pdf2json、hummus 和 node-pdftk,我能够获取所有文本字段,但如果选中复选框则无法获取。

我一直在测试不同的文件(比如这个),并且 pdf2json 总是返回一个空字符串作为每个复选框值,而鹰嘴豆泥给出true。使用 pdftk 我得到 FieldValue 和 FieldStateOption 字段并在我阅读此答案时进行比较,但结果似乎都不正确。

有人可以给我一些建议吗?

4

1 回答 1

0

看看使用pdffiller包是否有效。该generateFDFTemplate方法应该可以解决问题。根据自述文件:

var pdfFiller = require('pdffiller');

var sourcePDF = "test/test.pdf";

// Override the default field name regex. Default: /FieldName: ([^\n]*)/
var nameRegex = null;  

var FDF_data = pdfFiller.generateFDFTemplate( sourcePDF, nameRegex, function(err, fdfData) {
    if (err) throw err;
    console.log(fdfData);
});

将打印出:

{
    "last_name" : "",
    "first_name" : "",
    "date" : "",
    "football" : "",
    "baseball" : "",
    "basketball" : "",
    "hockey" : "",
    "nascar" : ""
};

希望这可以帮助 :)

于 2018-05-24T16:54:16.053 回答