问题标签 [teradatasql]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
teradata - Teradata 中的 CAST 到 TIMESTAMP 字段
我有时间戳存储在格式的 VARCHAR 字段中Tue Jul 28 04:05:16 PDT 2020
。我可以将其转换为 Teradata 中的 timestamp(0) 字段吗?
sql - 如何通过查询在 Teradata SQL 中设置 SAMPLE 大小
我正在使用 Teradata Studio,我正在寻找一种方法来使以下代码更易于维护,而不是这样:
我想从表中获取 500 和 600 的样本大小,因此如果我们的利益相关者想要更改样本大小,我们不需要更改代码:
但是,即使我将 select-statment 的结果转换为 INT/Numeric,我也会收到错误:语法错误,期望在“THEN”关键字和“SELECT”之间出现整数或十进制数或浮点数'关键字。
示例功能根本不可能吗?
teradata - 使用 Teradata TPT Export 强制对输出文件进行编码
如果可以通过 TPT Export 为输出 .dat 数据文件强制执行特定编码 (ANSI/UTF8),我正在寻找选项。
导出的数据文件要求为ANSI格式,目前同一个TPT导出脚本在不同的环境中生成不同编码的文件。(开发/测试/生产),可能是由于默认环境设置。
我尝试了 CHARACTER SET ASCII 并在一台机器上生成 UTF8,而在另一台机器上生成 ANSI。(服务器操作系统 AIX)
另一种选择是使用一些后期脚本将输出文件转换为所需的编码。
python-3.x - Pyodbc 批量插入 Teradata 表
如何使用 Pyodbc 有效地将 10-50k+ 行(来自例如 Series 或 Dataframe)插入 Teradata 表?
背景:
- 我正在用 Python 构建一个 GUI 应用程序
- 不能使用 Teradata 库(因为我无法使用这些库打包软件)
teradata - 时间戳(0)到 AM/PM 格式的 Teradata 转换
我有一张包含以下数据的表格。START_TIME 的数据类型是 timestamp(0) & AVG_RUN_TIME_MINS 是 Integer。我想打印EXPECTED_COMPLETION_TIME等于 - (START_TIME + AVG_RUN_TIME_MINS),输出格式为 - '10:00 AM' 或 '08:00 PM'。
如何实现这个场景?
python - 在 unix 上,在没有驱动程序的情况下将 python 连接到 teradata
我正在使用 python 3.x 和 unix 来访问 teradata。我对 teradata 和 python 完全陌生。我可以很容易地用 python 连接到 oracle,但是对于 teradata,没有驱动程序问题。由于公司政策,我将无法进行任何 unix 端安装。您能否建议蚂蚁解决我可以在没有任何驱动程序的情况下使用 python 连接到 teradata 的地方,我知道我可能听起来很愚蠢,但这就是我的情况。TIA
stored-procedures - 使用 Teradata 存储过程的倒三角形
我想要使用 teradata sql 的倒三角形。我在下面写了递归查询并获取输出。但我想使用存储过程打印倒三角形。
使用递归 atr_col(id, val) AS ( sel 1, cast(' ' as varchar(1000)) as val from (sel 1 as dummy) a union all sel tb2.id+1, trim(tb2.val)|| ' ' from atr_col tb2 where tb2.id<=val) sel val from atr_col order by id desc;
python - 在 python 中读取 teradata 表的性能缓慢
我正在尝试从 Teradata big 读取表格,这需要很长时间。我的表有 500 万行和 60 列,需要 30 分钟才能加载到内存中。我正在使用 teradatasql 包,但同一张表需要 5 分钟才能使用 RJDBC 包加载到 R 中。
Python 代码(这需要 30 分钟)
R 代码(只需 3 分钟)
我试图在 python 中增加光标的数组大小,但它并没有大大提高执行时间。
teradata - 更新 Teradata 中的大表
我正在尝试每天更新 Teradata 中的一个大表。更新语句占用了大量的 AMPCPUTime。
表包含 650 亿行,更新了 100-2 亿行。
表是具有非唯一 PI 的集合表。数据分布相当均匀,倾斜因子为 0.8。
减少AMPCPU时间的方法是什么?
更新是使用阶段表完成的。联接位于 PI 列的子集上。
尝试:将阶段表的 PI 更改为与目标表相同。解释计划说正在执行合并更新。但是 AMPCPUTime 正在增加。尝试删除和插入,但删除和插入也需要更多的 AMPCPUTime。
sql - sql join 概念——性能调优
在下面的 teradata SQL 代码中,我想将表 A (col1、col2、col3)中的 3 个不同列与员工表的名称列连接起来。下面的操作工作正常,但想在一个联接中执行此操作, 我们可以用替代方法来避免同一张表上的多个联接吗?由于视图的多次连接,我收到了假脱机空间错误。