我所说的自动链接是指将内联在页面内容中的 wiki 链接生成到页面的超链接(如果存在)或创建链接(如果页面不存在)的过程。
使用我正在使用的解析器,这是一个两步过程 - 首先,解析页面内容并提取源标记中指向 wiki 页面的所有链接。然后,在生成最终的 HTML 标记之前,我将现有页面的数组返回给解析器。
处理此过程的最佳方法是什么?似乎我需要保留网站上每个页面的缓存列表,而不是每次都提取页面标题的索引。还是单独检查每个链接以查看它是否存在更好?如果列表没有被缓存,这可能会导致大量的数据库查找。对于拥有数千页的大型 wiki 站点,这仍然可行吗?