我正在使用 GeoSpark 1.3.1,我正在尝试查找 POLYGON 中包含的所有地理点。我使用 sql 命令:
val result = spark.sql(
|SELECT *
|FROM spatial_trace, streetCrossDf
|WHERE ST_Within (streetCrossDf.geometry, spatial_trace.geometry)
""".stripMargin)
result.show()
查询工作正常,但是当我尝试显示结果时失败。似乎是图书馆的输出问题。我在 zeppelin notebook 中这样做。有人可以告诉我我做错了什么吗?我收到以下错误:
org.apache.spark.SparkException:作业因阶段失败而中止:阶段 10.0 中的任务 0 失败 4 次,最近一次失败:阶段 10.0 中丢失任务 0.3(TID 15、10.42.22.236、执行程序 3):java.lang。 ClassCastException: org.apache.spark.unsafe.types.UTF8String 不能在 org.apache.spark.sql.geosparksql.strategy.join.TraitJoinQueryExec$$anonfun$ 处转换为 org.apache.spark.sql.catalyst.util.ArrayData toSpatialRdd$1.apply(TraitJoinQueryExec.scala:164) at org.apache.spark.sql.geosparksql.strategy.join.TraitJoinQueryExec$$anonfun$toSpatialRdd$1.apply(TraitJoinQueryExec.scala:163) at scala.collection.Iterator$$ anon$11.next(Iterator.scala:410) at scala.collection.Iterator$class.foreach(Iterator.scala:891) at scala.collection.AbstractIterator.foreach(Iterator.scala:1334) at scala.collection.TraversableOnce$ scala 中的 class.foldLeft(TraversableOnce.scala:157)。collection.AbstractIterator.foldLeft(Iterator.scala:1334) at scala.collection.TraversableOnce$class.aggregate(TraversableOnce.scala:214) at scala.collection.AbstractIterator.aggregate(Iterator.scala:1334) at org.apache.spark .rdd.RDD$$anonfun$aggregate$1$$anonfun$22.apply(RDD.scala:1122) at org.apache.spark.rdd.RDD$$anonfun$aggregate$1$$anonfun$22.apply(RDD.scala: 1122) 在 org.apache.spark.SparkContext$$anonfun$36.apply(SparkContext.scala:2157) 在 org.apache.spark.SparkContext$$anonfun$36.apply(SparkContext.scala:2157) 在 org.apache.spark .scheduler.ResultTask.runTask(ResultTask.scala:90) at org.apache.spark.scheduler.Task.run(Task.scala:121) at org.apache.spark.executor.Executor$TaskRunner$$anonfun$10.apply (Executor.scala:402) 在 org.apache.spark.executor.Executor$TaskRunner 的 org.apache.spark.util.Utils$.tryWithSafeFinally(Utils.scala:1360)。在 java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624) 在 java.lang.Thread 的 java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149) 运行(Executor.scala:408) .run(Thread.java:748)