我有一个包含时间戳列的日志文件。时间戳采用 unix 纪元时间格式。
我想根据带有分区年、月和日的时间戳创建一个分区。
到目前为止,我已经这样做了,但它抛出了一个错误。
PARSE ERROR cannot recognize input '(' in column type
这是我的代码。
from (
from raw_data
MAP ${PREFIX}raw_data.line
USING 's3://scripts/clean.py'
AS (timestamp STRING, name STRING)
) map_out
INSERT OVERWRITE TABLE date_base_data_temp PARTITION(year(timestamp), month(timestamp)), day(timestamp)))
select map_out.name;