我有一个脚本,它以 hadoc 格式在输入和输出中采用复杂的 json 对象(每行一个)。我想使用 pig 使用 STREAM 通过此脚本流式传输一些数据。如何强制 pig 以 json 格式将数据发送到流式传输?我正在寻找类似的东西
C = stream A through `stream.py` USING JsonStorage()
我有一个脚本,它以 hadoc 格式在输入和输出中采用复杂的 json 对象(每行一个)。我想使用 pig 使用 STREAM 通过此脚本流式传输一些数据。如何强制 pig 以 json 格式将数据发送到流式传输?我正在寻找类似的东西
C = stream A through `stream.py` USING JsonStorage()
猪中似乎还没有这样的实现。最好的选择可能是使用输出 json 字符串的ToJson UDF,然后在流函数中将字符串加载为 json 对象,例如,使用 python 的 json.loads(inputstring)。