我最近对数据挖掘和机器学习领域产生了兴趣。浏览庞大的数据集并尝试关联隐藏的模式和趋势的想法令人着迷。到目前为止,我已经完成了以下工作
- 使用 Weka 加载简单的数据集并生成决策树
- 不断地阅读书籍、维基、博客等
- 开始玩 SQL Server DM 和 Python API
- 对网络上免费提供的数据集选项有一个想法(freedb、UN 等)
阻碍我的是,当我试图超越分类/关联并进入先验/先验算法时,我被卡住了,因为理解数学方程和逻辑不是(谦虚地说)我的强项之一。
所以我的问题是,在数据挖掘领域(以产品所有者或构建者的角色)有没有天生不是数学家的人?如果是这样,由于 Weka 和 Rapid-miner 等免费工具都需要一些数学/统计背景,您将如何理解该领域?
PS:如果我在查询中犯了一些错误,例如在数据挖掘和分析是分开的时候混合使用,请原谅我,因为我还在弄湿我的脚。我希望我的核心问题很清楚。