在weka我加载了一个 arff 文件。我可以使用可视化选项卡查看属性之间的关系。
但是我无法理解抖动滑块的含义。它的目的是什么?
您可以在邮件列表档案中找到答案:
可视化面板中的抖动功能只是将人工随机噪声添加到绘制点的坐标中,以便将数据分散一点(以便您可以看到可能被其他人遮挡的点)。
我不知道weka,但通常抖动是一个周期信号变化到某个参考间隔的术语。我猜滑块允许您设置某个范围或阈值,低于该范围或阈值的数据点被视为常规数据点,或者修改输出以引入一些变化。维基百科条目可以为您提供一些背景知识。
更新:从此pdf,抖动滑块用于此目的:
处理标称属性的“抖动”选项(并检测“隐藏”数据点)
根据随附的幻灯片,它似乎在可视化中引入了一些变化,可能是为了显示两个数据点何时重叠。
更新 2:这个谷歌书籍摘录(Ian H. Witten,Eibe Frank 的数据挖掘)似乎证实了我的猜测:
[jitter] 是一种随机位移,应用于 X 和 Y 值以分离位于彼此之上的点。如果没有抖动,同一数据点的 1000 个实例看起来与 1 个实例相同
我不知道你提到的产品,但抖动通常意味着随机化样本位置。例如,在光线追踪中,您通常会通过屏幕上的每个像素渲染一条光线。抖动为每条光线添加一个随机偏移,以减少由常规混叠引起的问题。