0

开始机器学习的最简单方法是什么?

我有一个非常实际的应用程序。

一些经理把一个“东西”的数据仓库扔在我的腿上,让我告诉他们是什么推动了销售。

数据包括:

sales by client (clients being doctors offices)
sales by doctor
products they bought
client demographics
all kinds of different date information

总结数据,它基本上是公司与所有客户进行的每笔交易的完整数据以及每笔交易的详细信息。

数据全部存储在sql server 2008中。

问题: c#/python 中是否有任何工具可以连接到数据库以开始分析趋势/模式/关系?

更具体地说: 如何将使用 python 或 c# 的机器学习算法应用于我的数据以提取某种有意义的信息?

4

3 回答 3

1

您将获得捆绑在 SQL Server 2008 中的数据挖掘工具。您应该首先在 Google 上搜索“SQL Server 2008 中的数据挖掘简介”之类的实际示例。

于 2012-11-27T02:05:26.800 回答
1

我不知道从哪里开始处理这个问题。首先,这里的问题不是“机器学习”。没有软件可以接收一堆数据库表并回答诸如“什么在推动销售”之类的问题。天哪,人们甚至没有做好这方面的工作,所以对无人监督的计算机提出了很多要求。

我不清楚数据是否包含问题的答案。数据确实包含对已售商品和各种其他因素的描述。这些“推动”销售是否相当主观。

其他人对编程工具提出了宝贵的建议。我强烈建议您专注于数据挖掘工具而不是编程工具。SQL Server 确实有一个内置工具。我不确定这是否有帮助。您可以在此处找到工具列表。其中一些是免费软件。如果您通过编程访问它们,您将面临两个问题。首先是您将只关注问题的“编程”方面而不是结果。第二个是即使你找到了好的结果,你也无法将它们传达给其他人。

最后,我对他们真正想要的猜测是一种可以沿各个维度对数据进行切片和切块的工具——在 SQL Server 中也可以使用。您可以按照事实表结构将一组表放在一起(正如 Ralph Kimball 在他的书中所描述的,例如“数据仓库工具包”)。这听起来像是一个报告问题,而不是机器学习问题。

于 2012-11-27T05:14:59.427 回答
1

谷歌有一个预测/机器学习 API,如果你对结果更感兴趣而不是理解,那么它非常棒(尽管有一些背景肯定会有所帮助,这样你就可以知道你正在尝试做什么甚至是有道理的)。

https://developers.google.com/prediction/

于 2012-11-27T05:25:24.573 回答