我正在尝试在服务器端解析 PDF 表单。我尝试了许多 node.js 模块,如 pdf2json、hummus 和 node-pdftk,我能够获取所有文本字段,但如果选中复选框则无法获取。
我一直在测试不同的文件(比如这个),并且 pdf2json 总是返回一个空字符串作为每个复选框值,而鹰嘴豆泥给出true。使用 pdftk 我得到 FieldValue 和 FieldStateOption 字段并在我阅读此答案时进行比较,但结果似乎都不正确。
有人可以给我一些建议吗?
看看使用pdffiller包是否有效。该generateFDFTemplate
方法应该可以解决问题。根据自述文件:
var pdfFiller = require('pdffiller');
var sourcePDF = "test/test.pdf";
// Override the default field name regex. Default: /FieldName: ([^\n]*)/
var nameRegex = null;
var FDF_data = pdfFiller.generateFDFTemplate( sourcePDF, nameRegex, function(err, fdfData) {
if (err) throw err;
console.log(fdfData);
});
将打印出:
{
"last_name" : "",
"first_name" : "",
"date" : "",
"football" : "",
"baseball" : "",
"basketball" : "",
"hockey" : "",
"nascar" : ""
};
希望这可以帮助 :)