我有一个非常大的 PDF 目录,其中包含超过 50K 的零件编号。想编写一个将零件编号转换为可点击链接的过程。一直在使用 Acrobat、iTextSharp、PDFSharp 和其他一些工具,但似乎看不到以前是否做过类似的事情?
我是否需要手动更新每个链接,或者是否有希望使这个过程自动化?
谢谢!
我有一个非常大的 PDF 目录,其中包含超过 50K 的零件编号。想编写一个将零件编号转换为可点击链接的过程。一直在使用 Acrobat、iTextSharp、PDFSharp 和其他一些工具,但似乎看不到以前是否做过类似的事情?
我是否需要手动更新每个链接,或者是否有希望使这个过程自动化?
谢谢!
使用Docotic.Pdf 库可以轻松完成此任务。
该库可以从具有边界矩形的页面中检索所有单词。此外,该库可以在 PDF 页面的指定位置创建超链接。
这是您的任务的简短示例。以下代码打开指定文件,查找所有以 L 开头的单词并将这些单词“转换”为链接。
public static void makeWordsHyperlinks(string file, string outputFile)
{
using (PdfDocument pdf = new PdfDocument(file))
{
foreach (PdfPage page in pdf.Pages)
{
PdfCollection<PdfTextData> words = page.GetWords();
foreach (PdfTextData word in words)
{
// let's take anything starting from L
// you can discriminate words as you like, of course
if (word.Text.StartsWith("L", StringComparison.InvariantCultureIgnoreCase))
{
// build lookup query. you can use any url, of course
string lookupUrl = string.Format(@"https://www.google.ru/#q={0}", word.Text);
// let's draw rectangle around word.
// just to make links easier to find
page.Canvas.DrawRectangle(word.Bounds, PdfDrawMode.Stroke);
page.AddHyperlink(word.Bounds, new Uri(lookupUrl));
}
}
}
pdf.Save(outputFile);
}
}
我假设您的零件编号类似于 XXX-YYYYY。如果您的零件编号由几个单词组成,那么任务会有点困难。您将需要组合单词及其边界矩形。
免责声明:我为图书馆的供应商工作。