解析是我在开发过程中经常遇到的事情,但作为一名初级人员,我认为我会在需要时掌握其中的窍门。在我当前的项目中,有人告诉我要为某个功能查找和使用 HTML 解析器,我在网上找到了一对。
但是 HTML 解析器实际上做了什么?解析一个对象意味着什么?
解析是我在开发过程中经常遇到的事情,但作为一名初级人员,我认为我会在需要时掌握其中的窍门。在我当前的项目中,有人告诉我要为某个功能查找和使用 HTML 解析器,我在网上找到了一对。
但是 HTML 解析器实际上做了什么?解析一个对象意味着什么?
解析通常适用于文本 - 读取文本并将其转换为更有用的内存格式的行为,在某种程度上“理解”它的含义。因此,例如,XML 解析器将获取字符(或字节)序列并将它们转换为元素、属性等。
在某些情况下(尤其是编译器),词法分析和句法分析之间存在分离,因此解析器的真正“理解”部分处理一系列标记(标识符、运算符等)而不是原始字符。
解析是获取一组数据并从中提取有意义的信息。使用 HTML 解析,您希望读取一些 html 并返回一组结构化的标签和文本
您可以从这里开始:http ://en.wikipedia.org/wiki/Parsing 。简短摘录:
解析或句法分析是分析一串符号的过程,无论是自然语言还是计算机语言,都符合形式语法的规则。解析一词来自拉丁语 pars(orationis),意思是(语音的)部分。
分析(一串字符)以便将字符组与基础语法的句法单元相关联。
解析器是一个编译器/解释器组件,它将数据分解为更小的元素,以便于翻译成另一种语言。解析器以一系列标记或程序指令的形式获取输入,并且通常以解析树或抽象语法树的形式构建数据结构。
这是在 HTML 中识别标记 [标签、属性] 的过程。