表 1 中有数千行包含许多未知和无效的子字符串。每个子字符串用逗号分隔,数据不区分大小写。
表 1(包含无效子串)
Row COLUMN_A
1 Beta, gamma, eta, lambda, good
2 Alpha, beta,theta, zeta
3 Alpha, sigma, beta, morning
4 Delta, gamma, zeta, etc
Etc…
表 2(包含所有有效子串)
COLUMN_B
alpha
beta
gamma
theta
lambda
将 Column_A 中每一行中的每个子字符串与 Column_B 中的所有值进行比较。
- 删除表 1 的所有行中不等于表 2 的 Column_B 中的任何值的任何子字符串。例如,在第 1 行中,“eta”和“good”将被删除。
- 对表 1 中的所有剩余行重复该过程,直到删除所有无效子字符串。