0

我想通过在每一页上搜索特定单词(可能在一页或更多页上)将该页面的全部内容转换为 PDF。例如,我们有一个文件有三页,第一页有一个特殊词,第三页有下一个特殊词。我想将 PDF 从第一页保存到第二页,然后分别保存第三页。PDF 文件将根据该页面上的特定单词命名。

我的问题是我不知道如何循环每个页面并阅读该页面的内容以获取特殊单词并将页面保存为 PDF。谢谢你

4

1 回答 1

0

这是你如何做到的。

  1. DocumentModel.GetPaginator使用方法对 Word 文档进行分页。
  2. FrameworkElement.ToText使用扩展方法读取每个页面的文本内容。
  3. 使用方法将所选页面保存为 PDF DocumentModelPage.Save

换句话说,请尝试以下操作:

string search = "Your Specific Word";
string inputPath = "input.docx";

// Load Word document.
var document = DocumentModel.Load(inputPath);

// 1. Get document's pages.
var pages = document.GetPaginator().Pages;

for (int i = 0, count = pages.Count; i < count; ++i)
{
    // 2. Read page's text content.
    DocumentModelPage page = pages[i];
    string pageTextContent = page.PageContent.ToText();

    // 3. Save page as PDF.
    if (pageTextContent.Contains(search))
    {
        string outputPath = $"{search}_{i}.pdf";
        page.Save(outputPath);
    }
}
于 2019-12-24T05:38:34.777 回答