有没有办法将 Dataproc Spark 作业的输出发送到 Google Cloud 日志记录?如 Dataproc 文档中所述,作业驱动程序(Spark 作业的主机)的输出可在控制台中的 Dataproc->Jobs 下获得。我希望在 Cloud Logging 中也有日志的原因有两个:
- 我想查看执行者的日志。通常主日志会说“executor lost”,没有更多细节,如果有更多关于 executor 正在做什么的信息会非常有用。
- Cloud Logging 具有出色的过滤和搜索功能
目前,Cloud Logging 中显示的唯一 Dataproc 输出是来自 yarn-yarn-nodemanager-* 和 container_*.stderr 的日志项。我的应用程序代码的输出显示在 Dataproc->Jobs 中,但没有显示在 Cloud Logging 中,而且它只是 Spark 主服务器的输出,而不是执行程序的输出。