1

我有两个训练数据文件,每个文件都单独拆分为训练和测试拆分数据。如何使用给定文件提取训练样本

我有四个文件

  • file1:一些功能
  • 文件 2:文件 1 共有的几列的一些其他功能

用一个例子详细说明

文件 1 列 - 时间戳、事件、结果、

test 1 是从文件 1 中拆分出来的测试数据,

文件 2 列 - 时间戳、用户类型、事件持续时间、结果、

test2 包含从文件 2 中拆分出来的测试数据.....

当我这样做时,我无法合并训练数据或测试数据,我要么报告数据丢失(内连接)或不明确的数据(在外连接的情况下)。我需要用这两个数据执行逻辑回归

测试 1 和测试 2 是测试数据集,分别从文件 1 和文件 2 中剥离为测试数据

我需要对训练样本执行逻辑回归并使用文件 3 和文件 4 对其进行测试。由于这种单独的拆分,我在合并时遇到了问题。有人可以建议一些最好的方法来克服这个问题吗?

4

0 回答 0