我一直在从事一个包含 hive 查询的项目。
INSERT INTO OVERWRITE .... TRANSFORM (....) USING 'python script.py' FROM .... LEFT OUTER JOIN 。. . 左外连接。. . 左外连接
一开始一切正常,直到我们加载了大量的虚拟数据。我们只是在某些字段上写入相同的记录,但有细微的变化。之后我们再次运行它,我们得到一个 Broken pipe 错误,没有太多信息。没有关于错误的日志,只有 IOException: Broken pipe 错误。. . .
为了简化脚本并隔离错误,我们将脚本修改为
for line in sys.stdin.readlines():
print line
以避免该级别的任何错误。我们仍然有同样的错误。