0

我现在要使用 PoDoFo 来解析 PDF。我有源代码 pdofo-toolspodofotxtextract可用在这里:podofotxtextract文件 TextExtractor.cpp 。我将更改此代码以获取文本坐标,在阅读此帖子后:PoDoFo 提取文本并阅读 Adob​​e 规范,以检索我需要使用运算符的联系信息Tm,此运算符是矩阵。所以我在源代码中添加了一个这样的新案例

... other case in if( bTextBlock ) ....
else if( strcmp( pszToken, "Tm" ) == 0 )
{
     std::cout << "I have matrix here Tm " <<  std::endl;                   
}
....

此代码有效,但我不知道如何显示矩阵的值。Adobe 指定: 在此处输入图像描述

如果有人可以帮助我

4

1 回答 1

0

我建议您阅读 Ryan Hodson 的“PDF Succinctly”(第一次 google 搜索将您带到它)和 Acrobat(在类似问题中提出) https://www.adobe.com/content/dam/acom/en/ devnet/pdf/pdfs/pdf_reference_archives/PDFReference.pdf

首先,您误解了 pdf 是如何“编码”的。Podofo 会给你变体和代币。一旦找到令牌,您应该堆叠变体并处理它们(除了令牌打开或关闭块的少数情况,它不会有任何变体)。

当你到达 Tm 代币时,你应该有 6 个变体,这将对应于你粘贴的矩阵的位置。

于 2020-01-04T23:54:12.050 回答