0

我想解析我用 ABCPDF 下载的 PDF 文档,但我找不到文档中的任何元素或如何访问它们并迭代它们。我想解析出一些文本。

var webClient = new WebClient();
                                var bytes = webClient.DownloadData("http://test.com/test.pdf");

                                var doc = new Doc();
                                doc.Read(bytes);
4

1 回答 1

2

使用Doc.GetText方法从当前页面提取内容,指定返回内容的格式。

doc.PageNumber = 1;
string pageContent = doc.GetText("Text");

上面的示例将按布局顺序返回纯文本。指定“SVG”或“SVG+”会随文本返回附加信息,例如样式和位置。

于 2013-02-15T09:30:41.690 回答