我在使用 php 读取 docx 文件中的图像超链接时遇到问题。我也无法在同一个 docx 文件中读取页眉和页脚的内容。我发现 PHPDOCX 是处理 DOCX 文件的近邻,但我仍然找不到这个答案。您的帮助将不胜感激。先感谢您。
纳瓦拉杰
不确定 docx,但它适用于 doc,请在下面尝试
function parseWord($userDoc)
{
$fileHandle = fopen($userDoc, "r");
$line = @fread($fileHandle, filesize($userDoc));
$lines = explode(chr(0x0D),$line);
$outtext = "";
foreach($lines as $thisline)
{
$pos = strpos($thisline, chr(0x00));
if (($pos !== FALSE)||(strlen($thisline)==0))
{
} else {
$outtext .= $thisline." ";
}
}
$outtext = preg_replace("/[^a-zA-Z0-9\s\,\.\-\n\r\t@\/\_\(\)]/","",$outtext);
return $outtext;
}
$text = parseWord("1.doc");
echo $text;
它将识别超链接,然后您可以使用简单的逻辑。页眉和页脚也被拉出