0

我正在尝试通过映射将字段从 s3 csv 文件映射到雪花表,因为雪花表中的列比旧的过时 s3 文件中的列更多。

COPY INTO "ANALYTICS"."JIRA"."HISTORY"(ISSUE_ID, DATE, FIELD, CHANGED_FROM, CHANGED_TO, ETL_PROCESS_STATUS, ETL_DATETIME_LOCAL, ETL_TRANSFORMATION_NAME, ETL_PDI_VERSION, ETL_PDI_BUILD_VERSION, ETL_PDI_HOSTNAME, ETL_CHECKSUM_MD5) 
FROM 
    (select t.$1, t.$2, t.$3, t.$4, t.$5, t.$6, t.$7, t.$8, t.$9, t.$10, t.$11, t.$12, t.$13 
        FROM s3://ibucket/jira_scripts/history/2016-12-07.csv.gz t)
    CREDENTIALS = (
            aws_key_id='',
            aws_secret_key='')
        FILE_FORMAT = (
            field_delimiter='|'
            null_if=('')
            date_format='YYYY-MM-DD'
            timestamp_format='YYYY-MM-DD HH24:MI:SS.FF'
        )
        TRUNCATECOLUMNS = TRUE

我能够在没有映射的情况下运行,因为我收到一个错误,即表中的列多于输入文件中的列。

我得到的映射错误是:SQL 编译错误:在以下位置找到无效的 URL 前缀:'s3://ibucket/jira_scripts/history/2016-12-07.csv.gz'

感谢您的任何指示。

4

0 回答 0