Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我们正在开发一个新闻网站,我们有大量数据,大约 100 万条新闻和 500 GB 的媒体。我们对最佳实践进行了一些研究,但是在处理这个问题时缺乏资源。
我们得出的结论是,我们必须通过取消发布旧年容器(2009、2010、...2014)来归档很少访问的旧新闻,以便在后台和前台拥有一个快速的网站,在取消发布容器后,我们注意到检查索引文件仍然很大,并且新闻节点不再通过原始 URL 可用,因为我们取消了它们的父节点。
请向我提供任何可以帮助的见解。
如果您取消发布父文件夹,新闻文章将不再可用,正是因为您取消发布了节点。如果您在 Umbraco 中取消发布路径的任何部分,则将不再提供其下方的页面。
索引仍然很大,因为未发布的内容仍然存储在某些索引中。
我知道一些机构已经处理了与您尝试做的类似的事情,他们通过将旧文章归档到 Elastic 或其他类似的外部索引服务来处理它。然后删除原始文章以保持站点快速。然后,该站点的存档页面提供来自外部索引的存档文章,而不是来自 Umbraco。然而,这确实意味着旧文章实际上变成了只读的。