当我使用 ElasticSearch 时,我可以将 json 文档保存到其中并默认通过它们进行搜索。我还可以指定一些索引设置,我可以在其中描述字段类型和索引设置。我的问题是关于在 ElasticSearch 中存储数据的内部实现。就像在 MongoDB 中一样,我可以在此处存储动态 json 数据,因此所有文档都将按原样保存(实际上在 BSON 中,但在这里不适用)。例如:
{
firstName:"A",
lastName: "B"
}
在这里我们可以看到“方案数据”比“实际数据”占用更多的磁盘空间。因此,在 MongoDB 中,将“方案数据”的大小最小化是一种很好的做法,如下所示:
{
f:"A",
l:"B"
}
并在应用程序代码中提供一些映射以支持此方案。在 Elasticsearch (Lucene) 中,我可以指定一些方案,因此在内部它只能保存“实际数据”而不是“实际+方案”,但我不确定这一点,因为我也可以存储动态 json 数据。
所以问题是我应该在 ElasticSearch 中实现这样的优化吗?