使用 php 的 DOMDocument->LoadHTMLFile('test.html'); 继续向我返回错误,在第 36 行报告内容中的错误。删除一个又一个字符,结果发现这是一个明显的空白空间,这是罪魁祸首。在另一个编辑器(Editra)中复制/粘贴该句子,显示出一个奇怪的 RS 字符。
它是什么,更重要的是,我怎样才能避免它再次发生?
使用 php 的 DOMDocument->LoadHTMLFile('test.html'); 继续向我返回错误,在第 36 行报告内容中的错误。删除一个又一个字符,结果发现这是一个明显的空白空间,这是罪魁祸首。在另一个编辑器(Editra)中复制/粘贴该句子,显示出一个奇怪的 RS 字符。
它是什么,更重要的是,我怎样才能避免它再次发生?
这是一个记录分隔符
可用作分隔符来标记数据结构的字段。如果用于分层级别,US 是最低级别(划分纯文本数据项),而 RS、GS 和 FS 是递增级别,以划分由其下一级项组成的组。
SEQ:^^
- 十二月:30 - 十六进制:1E - 首字母缩略词:RS
你可以做的是strtr()
用来去除不可见的字符。Joel Degan 在 PHP.net 上的一个示例应该可以帮助您上路。
我记得,在这种情况下,PHP 抛出了一个非致命错误。它会抱怨很多事情,如果文件不是由您创建的,您将无能为力。您可以做的是使用不良的编程实践并通过在命令前加上 @ 来抑制错误。
@DOMDocument->LoadHTMLFile('test.html');
它仍应加载文件,但您将“忽略”错误。无知是福?