数据库中索引的工作方式:参考 Xenph Yan 的答案
在表中的字段上创建索引会创建另一个数据结构,该结构包含字段值和指向与其相关的记录的指针。然后对该索引结构进行排序,允许对其执行二进制搜索。
我理解 ORC 索引的方式是,ORC 每 10'000 行(默认情况下)保留有关行的统计信息(最小值、最大值、总和),如果我查询数据,它会查看统计信息以确定是否需要读取行块与否。
那么ORC索引不对数据进行排序是否正确?
我有一个 69 列的大表,其中包含非常非结构化的数据,我希望能够对每一列执行临时查询。为此,我希望能够通过索引(或至少其中大多数)对每一列进行排序。快速查询的数据中没有“关键”列。