我正在尝试通过 PHP 代码搜索 pdf 文件中的字符串。我已经编写了 php 代码来搜索 TEXT 文件中的字符串,该代码需要搜索字符串,并将此字符串与 TEXT 文件的内容进行匹配,并返回字符串与文本文件内容匹配的完整行。
我想用 PDF 文件做这种类似的工作,但没有得到任何线索,我搜索了一个类 class.pdf2text.php,但这个类以文本格式返回 pdf 文件的全部内容。
我需要一些指导和建议,才能完成这项任务。
这是我的代码
include('class.pdf2text.php');
$a = new PDF2Text();
$a->setFilename('file.pdf');
$a->decodePDF();
$data = $a->output();// stored the whole text into a variable
$myfile = "file.txt";
$fh = fopen($myfile, 'w');
fwrite($fh, $data);// write all the text into a text file
$file = 'file.txt';
$searchfor = 'string to search';
header('Content-Type: text/plain');
$result = getLineWithString($file, $searchfor);// search test string in text file
function getLineWithString($file, $searchfor) {
$lines = file($file);
foreach ($lines as $line) {
if (strpos($line, $searchfor) !== false) {
return $line;enter code here
}
}
return -1;
}
echo $result;