0

抱歉,如果标题错误或令人困惑。

我正在处理两个源文件(想想转换为 excel 或加载到单独的 oracle 表中的 csv 文件)。从业务角度来看,这两个文件中的数据是关联的。

文件 1 包含一组行和列。例如:

card_type, amount
VISA, 100
MASTERCARD, 300
DISCOVER, 200
AMEX, 150
DEBIT, 400

文件 2 包含类似的数据,但以未知的方式聚合:

deposit_id, deposit_date, amount
1, 03/01/2015, 400
2, 03/01/2015, 350
3, 03/01/2015, 400

现在显然我过度简化了很多。

我正在寻找的是一种确定文件 1 中的行如何与文件 2 中的行相关的方法。

在这种情况下,可能的结果是:

file1 (visa + mastercard = 400) = file2 deposit_id 1 (400)
file1 (debit = 400) = file2 deposit_id 1 (400)
file1 (visa = mastercard = 400) = file2 deposit_id 3 (400)
file1 (debit = 400) = file2 deposit_id 3 (400)
file1 (discover + amex = 350) = file2 deposit_id 2 (350)

...等等...

有时有些行可能会被排除(根本不使用)。也许有使用 2x 的行。也许有 1 个协会,也许有 2 或 3 个。谁知道呢!不幸的是,数据文件的定义不是很好(在这里谈论旧的大型机系统)。

显然,我可以尝试自己手动解决,但我最终尝试了大量的组合,这些组合是死胡同,只会浪费时间。拥有一个可以接受输入并尝试查看它们可能如何相关的系统会很棒。我意识到每个可能的解决方案都需要在事后由我自己手动分析,以确保它有意义并且适用于所有数据集。

如果我正在寻找的东西是否可能,或者描述我的问题的正确术语,我将不胜感激。

如果可能的解决方案是查询形式,甚至是提供该功能的现有应用程序/程序/网站,我很好。

谢谢!

4

0 回答 0