我正在iTextSharp
使用 C# 阅读 PDF 文件。使用PdfTextExtractor.GetTextFromPage()
函数提取文本按预期返回所有文本。
但是对于有说的 PDF,应该删除目录、索引和说页码。我只想获取文本段落。
我通过探索ITextExtractionStrategy
.
我真的一无所知,任何指针都会有所帮助。
我探索了使用 隔离字段AcroFields
,但这看起来很远。
谢谢你。
问候,~Mayur
我正在iTextSharp
使用 C# 阅读 PDF 文件。使用PdfTextExtractor.GetTextFromPage()
函数提取文本按预期返回所有文本。
但是对于有说的 PDF,应该删除目录、索引和说页码。我只想获取文本段落。
我通过探索ITextExtractionStrategy
.
我真的一无所知,任何指针都会有所帮助。
我探索了使用 隔离字段AcroFields
,但这看起来很远。
谢谢你。
问候,~Mayur