作为思想实验的一部分,我试图确定服务器是否有任何希望只提供一条数据供浏览器环境接收和使用,即爬取我网站的机器人无法读取该数据。
显然,如果该信息是在源代码中发送的,或者实际上是通过任何常用的 HTTP 方式发送的,那么它可以被机器人获取 - 到目前为止,非常简单。
但是,如果信息是由服务器而不是作为 websocket 消息传输的呢:难道这不是只能由浏览器环境中的一些相应(并且可能经过身份验证的)JavaScript 接收,从而阻止它被机器人拦截吗?
(这是基于我的假设,即机器人没有客户端环境,本质上是一个恶意的服务器端脚本,通过类似 cURL 的方式调用站点,伪装成用户)。
表述这个问题的另一种方式可能是:对于 websockets 的 web 实现,消息的接收总是由客户端环境(即 JS)完成吗?