这可能是一个非常简单的问题。
但我自己并没有走得太远。
我正在尝试在 Databricks 中使用 PySpark 来执行相当于查询的 SQL:
select
a.*
, b.MASTER_ID as PLAYER_ID
from vGame a
join PLAYER_XREF b
on a.PLAYER_NAME = b.PLAYER
请注意,两侧的两个属性on
名称不同。
你能告诉我相同的pyspark版本吗?在我看来,与此相比,这里的许多切线帖子都超过了顶级复杂。
我发现了这个,这真的很接近,但返回的数据框是 ta & tb 的所有列。
inner_join = ta.join(tb, ta.name == tb.name)