我正在尝试编写自己的 UDF 来从端点加载数据。下面是场景
// A = load the user information from the cassandra db
// B = iterate through the data and make string of userids (1,2,3)
// C = send it to some UDF which can go to some external api to fetch the user information
// D = join A and C on user id
// E = group by information fetched from UDF
// dump E;
据我了解,只有 4 种 UDF。加载、过滤、EvalFunc 和存储。我试过 LoadFunc 但看起来它总是需要一些文件名位置来加载信息。我不想从文件中读取。
有什么办法可以实现上述场景。