所以我的数据集看起来像这样:
A B
0 AAABBABAABBAAABBBBAABBBABAAABAAAAABBBABBBAAABB... True
1 AABAABABBBABAAAAABAAABBAABAABBABABBAAABABBBBAB... True
2 BAAABBBBABABABBBABBAAABAAAAAAABBBBAABABABBBAAB... True
3 BAABBABBABBAAAABABBBAAAAAAAABAAABBAAAABBAABBAA... True
4 ABBABBBABBAABAABABBAAABAAAAABABABAABBAABBBAABA... True
我已经将它处理成这样:
0 1 2 B
0 A B B True
1 A B B True
2 A B B True
3 A B B True
4 A B B True
如果我使用 ID3 作为决策树,我应该如何处理我的数据?
这里 1 行组合了 100 个 As 或 B,因此有 100 个特征。