我知道需要用半左连接替换 IN 查询(例如,Hive 不支持 in,存在。我如何编写以下查询?),但我不知道如何将它与 WHERE 子句结合起来:
SELECT *
from foo
WHERE userId IN
(SELECT distinct(userId) FROM foo WHERE x=true ORDER BY RAND() LIMIT 100);
谢谢。
编辑:更改查询。目的是创建条目的随机样本(统计方面)。