0

我正在上传一个 PDF 文件,我想搜索上传中包含的特定单词

在 php.ini 中仅使用 grep 命令的文件。

提前致谢。

4

2 回答 2

2

正如 Amal Murali 在评论中所写,您必须将 PDF 内容转换为文本。这已经在 StackOverflow 解决了,即如何从 PDF 文档中提取文本?. 然后你可以使用 preg_match_all,或者如果你真的想使用 grep,你可以使用 proc_open 并通过管道传递文本。

因此,使用来自http://pastebin.com/hRviHKp1的类(文章链接),这里是 preg_match_all 的示例:

include('class.pdf2text.php');
$a = new PDF2Text();
$a->setFilename('Videographer_RFP.pdf');
$a->decodePDF();
preg_match_all ('some pattern', $a->output(), $matches);
print_r($matches);

请注意,我没有测试过代码。

于 2013-10-12T16:33:50.183 回答
2

您可以使用 pdfgrep 查看此链接如何搜索多个 pdf 文件的内容? 我也用过几次,它也支持递归搜索。

谢谢和问候,
阿洛克·塔克

于 2013-10-12T16:22:25.230 回答