oracle - Oracle 12c - 大小大于 5 TB 的表

Question

在我们的数据库（Oracle 12c、Exadata）中，我们计划存储销售数据。包含销售数据的输入文本文件每天都会出现（每天约 1000 个文件，每个文件包含约 20000 行）。文本文件被读取并尽快传输到数据库。根据我们的计算，它将在一年内增长到 5 TB。

数据格式： [transaction date][category][sales_number][buyer_id][other columns]

销售数据来自具有相同字段的 10 个不同类别。数据在逻辑上可以只存储在一个表中，也可以分为 10 个表（相对于类别）。

在 oracle 中存储此类大数据的最佳实践是什么？应该应用什么样的分区和索引策略？

限制条件：数据应在 2-3 天内提供给营销部门进行分析。基于 [sales_number] 或 [category]、[buyer_id] 或 [buyer_id] 列的查询。

score 2 · Accepted Answer

如果类别的数量已知并已修复，那么您可以为每个类别使用一个子分区。一种方法可能是这样的：

CREATE TABLE SALES_DATA
(
  TRANSACTION_DATE TIMESTAMP(0) NOT NULL,
  CATEGORY NUMBER NOT NULL,
  SALES_NUMBER NUMBER, 
  BUYER_ID NUMBER,
  [OTHER COLUMNS]
)
PARTITION BY RANGE (TRANSACTION_DATE) INTERVAL (INTERVAL '1' DAY)
SUBPARTITION BY LIST (CATEGORY)
SUBPARTITION TEMPLATE 
    (
        SUBPARTITION CAT_1 VALUES (1), 
        SUBPARTITION CAT_2 VALUES (2),
        SUBPARTITION CAT_3_AND_4 VALUES (3,4), 
        SUBPARTITION CAT_5 VALUES (5),
        ...
        SUBPARTITION CAT_10 VALUES (10),
        SUBPARTITION CAT_OTHERS VALUES (DEFAULT)        
    )
    (
        PARTITION P_INITIAL VALUES LESS THAN (TIMESTAMP '2018-01-01 00:00:00')  
    );

sales_number 和buyer_id 需要本地索引。如果需要，您可以将每个（子）分区放入单独的表空间中。

oracle - Oracle 12c - 大小大于 5 TB 的表

1 回答 1

Related

Reference