我正在评估数据挖掘包。
到目前为止,我已经找到了这两个:
谢谢
根据 KDnuggets 2007、2008 和 2009 年年度民意调查,RapidMiner 是全球数据挖掘专家中使用最广泛的开源数据挖掘解决方案: KDnuggets Data Mining Tool Poll 2009
RapidMiner 是开源的,100% Java,RapidMiner 比 Weka 和 KNIME 更灵活,提供更多的功能。
关于 SVM 实现:Weka 提供了一种这样的实现(LibSVM),而 RapidMiner 提供了四种 SVM 实现(LibSVM、MySVM、EvoSVM、SMO-SVM),其中一些具有更高级的功能。
另一种选择是Orange。它包括各种算法和数据挖掘技术,您可以通过 Python 脚本或 GUI 直接访问它们。
重新发明轮子并直接在 R 中编码!
Pentaho非常适合商业智能。所以也许你想看看它。我在这方面有一些经验,主要是做数据仓库的,还挺开心的。
如果您对一些与频繁模式挖掘、关联规则和顺序模式挖掘相关的Java代码感兴趣,我有一个小型开源项目,其中包含与这些主题相关的 42 种算法:http://www.philippe-fournier-viger。 com/spmf/
但是,请注意,它不提供任何用户界面。但它提供了一些您在其他数据挖掘包中找不到的非常专业的算法。
我在一门高中课程中使用过Weka ,它有一个很好的SVM实现。这是四五年前的事了。
( KNIME ) 是相当广泛的数据挖掘平台。
根据 KDnuggets 2011 年民意调查,RapidMiner 再次成为全球使用最广泛的数据挖掘解决方案: http ://www.kdnuggets.com/2011/05/tools-used-analytics-data-mining.html
Have a look at ELKI, which is like WEKA except it is much much stronger on clustering and outlier detection, while WEKA essentially only does classification well.
如前所述,Pentaho 是 WEKA 所属的一个强大的商业智能套件。
所以我也推荐 Weka,只是为了你有一个很好的解决方案来扩展你的应用程序和一个很棒的社区。