我终于得到了一个作为 PowerShell 模块加载的 C# 项目,并且能够将 PDF 转换为文本。
我的一些 PDF 似乎转换得很好,其他的最后被截断,其中一些只是简单地给我这样的输出:
!nn!
Q9!r
!
!!
-;7!!
H*
Q0-.(;5!!n
#n%-,-Bn
!rn-;7!H+
(-;7
,-;7
,-;79
!-;7nnn;,-
n-n
n>-rn
n!!r
n+*,
,),+I-.n
@55=
!8
(
)%
rr-;7
Q!n-;7
n!Q
!!n
F3Q02
!8nH
@*825
-n-;7
-;7nrQ
&n!!-;7C4-;7
Kn>B)I!!!I
$rn==.=!
r*.//
@5>8636nKnn
我已经检查了我正在测试的 PDF 文件的属性,但我找不到任何突出的原因,因为 PDF 输出像上面这样的乱码。
有人可以给我一些关于其他寻找和/或改变的想法吗?