2

如果进行一项调查以确定总体客户满意度,并且有 20 个一般性问题和一个最终摘要问题:“1-10 您的总体满意度是多少”,如何确定哪些问题与摘要问题的答案最相关?

简而言之,哪些问题真正重要,哪些只是在调查中浪费空间……

4

2 回答 2

1

有关某些特征的相关性的信息由与这些特征相关的线性分类和回归权重给出。

对于您的特定应用,您可以尝试训练 L1 或 L0 正则化回归器(http://en.wikipedia.org/wiki/Least-angle_regression、http://en.wikipedia.org/wiki/Matching_pursuit)。这些正则化器将许多回归权重强制为零,这意味着可以有效地忽略与这些权重相关的特征。

于 2013-01-17T20:13:27.923 回答
0

有许多不同的方法可以回答这个问题,而且复杂程度也各不相同。我将从计算所有成对答案组合的相关矩阵开始,从而指示哪些单个问题与总体满意度得分最相关(或最负相关)。这在带有分析工具库的 Excel 中非常简单。

接下来,我将研究集群技术,从简单开始,然后仅在必要时逐步提高。对调查数据所应用的领域一无所知,很难说哪种算法最有效,但对于初学者来说,如果你的集群可能都具有相似的大小,我会看看 k-means 和变体。但是,如果绝大多数响应非常相似,我会研究基于期望最大化的算法。用于探索数据和测试各种算法功效的优秀开源工具包称为Weka

于 2013-01-17T19:43:31.550 回答