我有一组训练数据,包含 20 个多项选择题(A/B/C/D),由一百名受访者回答。答案纯粹是分类的,不能缩放为数值。其中 50 名受访者被选中免费试用产品。选择过程未知。从这些信息中可以挖掘出哪些有趣的知识?
以下是我迄今为止提出的清单 -
- 百分比研究(示例 - 在 Qs.5 中回答 B 并被选为免费产品试用的人的百分比)
- 条件概率(示例 - 如果一个人在 Qs.5 中回答 B,他将被选中参加免费产品试用的概率是多少)
- 朴素贝叶斯分类器(这可用于预测是否会为任何问题子集的给定值集选择一个人)。
您能想到可以执行的任何其他有趣的分析或数据挖掘活动吗?
由于响应不可量化/不可评分,因此可以消除通常的疑点,例如相关性。
我的方法正确吗?