vespa - 查看加载到 vespa 中的所有文档

Question

有没有办法获取加载到 vespa 中的所有文档？

我尝试使用正则表达式进行查询，但没有按预期工作。

select * from entity where ID matches "[.]+";

ID 不是属性，但我尝试使用属性字段，两者都没有响应任何值。

score 5 · Accepted Answer

使用vespa-visit工具或在 document/v1 REST API中使用访问而不是搜索通常更适合转储文档。

如果你想使用搜索，使用这个查询来匹配一个类型的所有文档：

select * from yourdocumenttype where sddocname contains 'yourdocumenttype';

要使用它遍历所有文档，使用文档中的某个字段将文档集划分为较小的块并一次查询一个块会更有效（例如，如果您有时间戳字段，请添加范围条件到查询以在每个查询中检索一段时间的文档）。

（正则表达式仅在流模式下受支持。）

score 3 · Accepted Answer

要从 Vespa 转储所有文档，请使用vespa-visit：

“访问”是与搜索界面不同的界面 - 它是为具有高吞吐量的大数据传输而构建的，但不一定是低延迟

团队使用访问来提取完整转储或子集，使用选择表达式

2 回答 2