我有两个训练数据文件,每个文件都单独拆分为训练和测试拆分数据。如何使用给定文件提取训练样本
我有四个文件
- file1:一些功能
- 文件 2:文件 1 共有的几列的一些其他功能
用一个例子详细说明
文件 1 列 - 时间戳、事件、结果、
test 1 是从文件 1 中拆分出来的测试数据,
文件 2 列 - 时间戳、用户类型、事件持续时间、结果、
test2 包含从文件 2 中拆分出来的测试数据.....
当我这样做时,我无法合并训练数据或测试数据,我要么报告数据丢失(内连接)或不明确的数据(在外连接的情况下)。我需要用这两个数据执行逻辑回归
测试 1 和测试 2 是测试数据集,分别从文件 1 和文件 2 中剥离为测试数据
我需要对训练样本执行逻辑回归并使用文件 3 和文件 4 对其进行测试。由于这种单独的拆分,我在合并时遇到了问题。有人可以建议一些最好的方法来克服这个问题吗?