我有一个关于我们可以将内容节点的限制推到多远的问题。
我的设置是一台机器是无状态的,另一台是内容节点。我注意到当推送大量文档(大约 50k 个字符)时,节点将失败大约 8000 万个文档,这大约是 1 TB 的数据。
内容节点有 4Tb 的存储空间,用于 115Go 的内存。我不保存任何属性,只保存摘要和索引。
问题是我无法正确地确定内容节点失败的原因是什么,例如,要查看哪些指标来识别问题。
我彻底阅读了尺寸调整文档,但没有找到答案。也许你有一些关于在哪里看的提示?
我有一个关于我们可以将内容节点的限制推到多远的问题。
我的设置是一台机器是无状态的,另一台是内容节点。我注意到当推送大量文档(大约 50k 个字符)时,节点将失败大约 8000 万个文档,这大约是 1 TB 的数据。
内容节点有 4Tb 的存储空间,用于 115Go 的内存。我不保存任何属性,只保存摘要和索引。
问题是我无法正确地确定内容节点失败的原因是什么,例如,要查看哪些指标来识别问题。
我彻底阅读了尺寸调整文档,但没有找到答案。也许你有一些关于在哪里看的提示?
您是否检查了内容节点上的 vespa.log 文件?你可能会在那里得到一些提示。
此外,根据您的系统配置,您可能会用完内容节点上的文件描述符。
您能否定义“节点将失败”?它是如何失败的?如果您设法耗尽内存,OOM 杀手可能会针对您的质子箱进程 ( https://linux-mm.org/OOM_Killer )。失败前的资源利用率是多少?