问题标签 [udf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql - 与 UDF 交叉应用
上面的函数返回产品 ID 大于 10 的所有产品记录。
当与 CROSS APPLY 一起使用时,如下所示
我得到的结果是一些小于 10 的产品 ID,这是不可能的。
该示例使用随处可用的 NORTWIND 数据库示例。
ORDER DETAILS 表和 PRODCUTS 表由 ProductID 链接
当 UDF 被调用(如上)结果显示一些 productID < 10
你能看到错误在哪里吗?
python - 用 Python 为 Pig 编写 UDF
我已经在这个问题上苦苦挣扎了几个小时。希望任何人都可以帮助我。输入是bag结构,比如{([1,2]),([3,4])}
,目标是输出bag中对应元组元素的和,比如(4,6)
。非常感谢。
我的代码:
类型错误:+ 不支持的操作数类型:“int”和“unicode”
hive - 如何将外部属性传递到 hive udf
我正在编写一个配置单元 UDF,我必须在其中调用一个 REST API 并返回一个字符串数组。我已经用硬编码的 REST API url 编写了函数。但是现在为了使端点可配置,我想取出主机属性并将其放入配置中。可能吗?如果是的话,那怎么能通过呢?
hadoop - Pig 的 UDF 中存在“in”会导致问题
我在 pig 中尝试了我的第一个 UDF 并编写了以下函数 -
但是,当我尝试按如下方式使用它时,Pig 会抛出一条错误消息,在我的 UDF 上下文中至少对我来说不容易理解:
谁能帮我弄清楚这有什么问题?
我已经阅读了文档,但对我来说,上面的示例中似乎没有什么明显的错误。我在这里错过了什么吗?
这些是我在 pom.xml 中使用的库:
有没有兼容性问题?
谢谢,
-维普尔帕塔克;
junit - UDF 的问题
我有一个接受包作为输入并将其转换为地图的 UDF。map 的每个键都由包中的不同元素和对应于它们的计数的值组成
但它没有通过junit测试
nested - 将嵌套元组取消嵌套到单个术语
我写了一个 udf ( extends EvalFunc<Tuple>
),它有作为输出的元组和内部元组(嵌套)。
例如转储看起来像:
现在我想处理每个术语,区分它并给它一个 id ( RANK
)。为此,我需要去掉括号。在这种情况下,简单FLATTEN
的没有帮助。
最终输出应该是这样的:
我的代码(不是 udf 部分,也不是原始解析):
c++ - c++ usigned long long range vs mysql unsigned bigint range
我有一个返回unsigned long long值的 MySQL UDF。当我在 MySQL 中调用此函数并且数据已保存在数据库中时,MySQL 会返回警告:
“ BIGINT UNSIGNED 值超出范围”。
如何在数据库中保存大的无符号长长数字?
MySQL 版本:5.5.43
操作系统:Ubuntu 14.04
请帮忙。
hadoop - 如何创建一个在猪中有嵌套包的输出模式
我正在尝试 Pig UDF 并且一直在阅读它。虽然在线内容很有帮助,但我仍然不确定我是否了解如何创建具有嵌套包的复杂输出模式。
请帮忙。要求如下。例如,我正在分析电子商务订单数据。一个订单中可以订购多个产品。
我有按订单级别分组的产品级别数据。这是我的 UDF 的输入。因此,包含每个订单中产品信息的订单级别的每个分组数据都是我的输入。
输入架构:
我将在 UDF 中计算订单级别和产品级别的指标。例如: sum(products) 是一个订单级别的度量,每个产品的颜色是一个产品级别的度量。因此,在发送到 UDF 的订单级别分组的 ForEach 行,我想计算订单级别和项目级别的指标。
预期的输出架构:
然后,目标是将订单级别和产品级别的数据保存在来自 pig 的两个单独的输出表中。
有没有更好的方法来做同样的事情?
regex - Slight adaptation of a User Defined Function
I would like to extract a combination of text and numbers from a larger string located within a column within excel.
The constants I have to work with is that each Text string will
•either start with a A, C or S, and •will always be 7 Characters long •the position of he string I would like to extract varies
The code I have been using which has been working efficiently is;
However today I have learnt that sometimes my data may include scenarios like this;
What I would like is to adapt my code so If the 8th character is "Underscore" and the 1st character of the 7 characters is either S, A or C please extract up until the "Underscore"
Secondly I would like to exclude commons words like "Support" & "Collect" from being extracted.
Finally the 7th letter should be a number
Any ideas around this would be much appreciated.
Thanks
hadoop - 猪拉丁按字段加入
我有一个猪拉丁相关的问题:
我在下面有这些数据(在一行中):
现在我有另一个数据集:
我想让这两个数据集加入。我将从数据集 B 中获取相应的值,并将该值放在数据集 A 的值旁边。所以预期的输出如下:
然后我可以将值相乘(0.123133 x 0.454535 .. and so on)
,因为它们现在在同一行,这就是我想要的。
当然,我可以逐列加入,但值会出现“行尾”,然后我可以使用另一个 foreach 生成来清理它。但是,我想要一些更简单的解决方案,没有太多可能导致性能问题的连接。
数据集 A 是文本(一种方式的句子..)。
那么我有什么选择来实现这一目标?你能帮忙的话,我会很高兴。