我想知道哪种方法更好地将网页内容保存到数据库进行缓存?
- 使用 ntext 数据类型并将内容保存为平面字符串
- 使用 ntext,但压缩内容然后保存
- 使用 varbinary(MAX) 保存内容(我如何将平面字符串转换为二进制?;-))
- 您向我建议的另一种方法
更新
更深入地说,我有许多表(URL、缓存、ParsedContents、Words、Hits 等),对于 URL 表中的每个 url,我正在发送请求并将响应保存到缓存表中。这是我引擎的下载器(Google 的 URLResolver)部分。然后索引器部分的行为是执行与此相关的解析等任务。并且压缩/解压缩仅在新内容被缓存或解析时执行