情况如下:
我的驱动器文档列表中有一个 pdf 和 google 文档。我想构建一个界面,可以在这些文档中搜索关键字并返回文档名称以及与搜索参数匹配的文本的可能预览。这是可能的还是可能的一些变化?
问候,
肖恩
情况如下:
我的驱动器文档列表中有一个 pdf 和 google 文档。我想构建一个界面,可以在这些文档中搜索关键字并返回文档名称以及与搜索参数匹配的文本的可能预览。这是可能的还是可能的一些变化?
问候,
肖恩
从 Google Doc 获取文本很简单:
// Get text from GDOC
var gdocDoc = DocumentApp.openById(gdocFile.id);
var text = gdocDoc.getBody().getText();
Get pdf-attachments from Gmail as text中的 pdfToText() 实用程序使用高级 Drive 服务和 DocumentApp 将 PDF 转换为 Google-Doc 到文本。您可以通过这种方式获取 OCR 文本,或将其直接保存到云端硬盘上任何文件夹中的 txt 文件中。
// Start with a Blob object
var blob = DriveApp.getFilesByName("my.pdf")[0];
// filetext will contain text from pdf file, no residual files are saved:
var filetext = pdfToText( blob, {keepTextfile: false} );
获得文本后,搜索关键字变得非常容易!
if (filetext.indexOf( keyword ) !== -1) {
// Found keyword...
}