Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
Web 解析器可以区分网页上的静态和动态文本吗?例如网页上有一个字符串
你好“神奇四侠”
在这个“你好”是一个静态数据,“神奇四侠”是一个动态数据(比如从数据库值填充)
Web 解析器是否可以检测出哪个是静态内容和动态内容?
我认为这是不可能的。客户端对服务器中的执行代码一无所知,因此无法知道文本是否由 PHP、ASP 或任何其他语言生成……甚至是静态的。
您可以查看 URL 和 HTTP 标头,以有根据地猜测文件是静态提供的(直接来自文件系统)还是生成的。然而,大多数“网页解析器”没有得到这些信息,而且几乎所有生成的页面都包含静态位。(有时它们直接包含在源代码中,或者它们可能来自模板或 SSI 文件。)将这些静态位与其他位区分开是不可能的。