我正在尝试通过映射将字段从 s3 csv 文件映射到雪花表,因为雪花表中的列比旧的过时 s3 文件中的列更多。
COPY INTO "ANALYTICS"."JIRA"."HISTORY"(ISSUE_ID, DATE, FIELD, CHANGED_FROM, CHANGED_TO, ETL_PROCESS_STATUS, ETL_DATETIME_LOCAL, ETL_TRANSFORMATION_NAME, ETL_PDI_VERSION, ETL_PDI_BUILD_VERSION, ETL_PDI_HOSTNAME, ETL_CHECKSUM_MD5)
FROM
(select t.$1, t.$2, t.$3, t.$4, t.$5, t.$6, t.$7, t.$8, t.$9, t.$10, t.$11, t.$12, t.$13
FROM s3://ibucket/jira_scripts/history/2016-12-07.csv.gz t)
CREDENTIALS = (
aws_key_id='',
aws_secret_key='')
FILE_FORMAT = (
field_delimiter='|'
null_if=('')
date_format='YYYY-MM-DD'
timestamp_format='YYYY-MM-DD HH24:MI:SS.FF'
)
TRUNCATECOLUMNS = TRUE
我能够在没有映射的情况下运行,因为我收到一个错误,即表中的列多于输入文件中的列。
我得到的映射错误是:SQL 编译错误:在以下位置找到无效的 URL 前缀:'s3://ibucket/jira_scripts/history/2016-12-07.csv.gz'
感谢您的任何指示。