问题标签 [teradatasql]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
66 浏览

python-3.x - 使用 pandas 加载 teradata 表需要花费大量时间

当使用 teradatasql 和主要函数 pandas.read_sql(query,teradata_con) 从 Teradata 服务器加载超过 1000 万条记录时,Pandas 变得异常缓慢。从 teradata 表加载 1-150 万条记录需要 40-45 分钟。

我也使用了 chunksize 选项,但它并没有减少执行时间,只是它在同一时间以块的形式加载数据。我也尝试探索 IOPro 包,但没有得到太多信息。有什么办法可以减少执行时间?因为,当我直接在管理工具中执行相同的 sql 查询时,与 pandas 相比,它需要 1/3 时间。

0 投票
1 回答
301 浏览

python - R包teradatasql dbGetQuery永远返回更大的数据,而python工作得非常快

我有一个数据库表,我试图从中获取 5+ 百万行的两列。

以下 python 中的代码可以完美快速地运行(大约 3 分钟即可获取完整的 5 行以上数据,通过查询检索并写入 CSV):

R 中的以下带有teradatasql包的代码适用于要检索的显式提供的行数的小值。但是,当 n 足够大时(实际上并没有那么大),或者当我要求它检索完整的 5+ 行数据集时,它会花费大量时间或几乎永远不会返回。

知道发生了什么吗?

以下是一些版本信息供参考:

0 投票
1 回答
209 浏览

python - 如何在 teradatasql lib 中设置查询范围?

我正在使用这个teradata 模块,然后我换成了这个模块。

事实上,在旧版本中,很容易通过在函数中设置 queryBands 参数来设置 queryband udaExec.connect。在这个新模块中,我找不到像在旧模块中那样设置查询带的简单方法。

有谁知道实现这一目标的最佳方法?

0 投票
3 回答
91 浏览

sql - 在其他条件下查找 MIN 值 Teradata

我正在使用 Teradata SQL。

我有一张包含这些列的表格 orgprice - 原价 sprice - 销售价格 saledate - 销售日期

我需要在数据库中找到物品的销售价格不等于物品的原始价格的最早销售日期*

我尝试像这样使用 MIN:

但这只是总体上返回了 min saledate 值,where 子句被忽略了。

我该怎么做呢 ?

0 投票
2 回答
39 浏览

teradata - 如何仅获取不匹配的数据

我有下面的查询,TBL1 X 是我的源表,TBL2 Y 是我的目标表。我只想从 TBL1 X 中获取以下任何字段与 TBL2 Y 中相应字段不匹配的数据。我不能 100% 确定代码是否正确。有人可以帮忙吗

---- 如果满足 X.PHARM_ID= Y.CLAIM_ID 且满足以下任何条件,我希望返回记录。

0 投票
1 回答
91 浏览

sql - Teradata SQL 助手

如何使用 teradata 执行以下操作,

输入字符串 -'data1 data2 (1) (Ab-123)'

需要输出 - Ab-123

所以基本上我想要最后一个括号中的数据。

0 投票
0 回答
475 浏览

python-3.x - [Version 17.0.0.2] [Session 8085885] [Teradata SQL Driver] 接收 Start Response 消息头失败

我正在使用teradatasql带有 python 的模块进行插入查询并收到此错误。我正在尝试同时运行多个脚本,但我想我不能同时执行多个插入查询?

0 投票
0 回答
135 浏览

teradata-sql-assistant - Teradata 存储过程结果输出

我怎样才能打印var2

0 投票
0 回答
23 浏览

teradata - 重复导致 teradata 中的性能问题

假设 teradata 中的多集表 A 有 10 行(仅举例 - 可以有 > 100k 行)。所有行都是整行重复。我在逻辑上删除了 9 行 active_date 关闭(当前时间戳)。现在表 A 有 10 行,但只有 1 行使用 active_date (9999) 处于活动状态。如果我编写查询以仅获取那 1 条活动记录,查询性能会因为逻辑删除的其他 9 行而降低吗?请解释如何。

0 投票
1 回答
138 浏览

sql - Teradata 时间戳值调整

图片有人可以帮我实现以下我目前陷入困境的2个要求:

  1. 仅当作业的状态为“进行中”且大于 SLA_TMLINE 时,我才需要在几分钟内计算和填充字段“DURATION_CROSSED_AFTER_SLA”的帮助。如果 SLA_TMLINE 为“NA”,则字段也将为“NA”。SLA_TMLINE 值仅在时间(EST)中给出,计算时将自动假定当前日期,例如:对于 JOB_ID 1373,SLA_TMLINE 给出为 - 06:00 AM,这意味着 '8/22/2020 06:00: 00'。
  2. 此外,如果作业的状态为“进行中”,并且如果当前时间戳(0)> SLA_TMLINE 为当天+“1”小时,那么我们需要将作业的状态(B.STATUS)显示为“长时间运行”,而不是'进行中'。

基本上,我们将有以下工作状态:

从以上 5 个工作状态中,表中没有“LONG RUNNING”状态,但我们将根据第 5 点得出它。2 以上。