1

我一直在网上寻找以了解当前的 Web 应用程序如何在服务器端和客户端管理它们的数据。

比如,我对 Google Suggest、基于我的“喜欢”的个人推荐等很感兴趣。

因此,当我搜索可以学习此类数据结构和算法的内容时,我遇到了加州大学伯克利分校提供的这门课程 - http://extension.berkeley.edu/cat/course460.html

这门课程的描述与我真正想学的完全吻合。

研究为许多最有效的 Web 应用程序提供强大功能的算法。谷歌建议的列表的阶段来自哪里?哪些技术可以产生个人推荐?社交网络、混搭和混合媒体网站如何选择和分类相似的二进制内容分组?在本课程中,您将深入了解当前用于搜索、推荐、分组、分类和分类器组合的算法和数据结构。

但是,似乎无法找到有关此课程的更多详细信息。

有人可以帮我找到一本书/在线课程/网站,让我可以了解更多关于这个主题的信息吗?

4

1 回答 1

3

Rex Griffiths 和我本周刚刚发布了一个关于所有这些内容的视频播客。您可以在http://StatCasts.com上找到它。我们应该带来有趣的东西并教一些东西。您可以在 twitter ( @StatCastsCom ) 上关注我们,我们会尝试实时链接到我们在这方面看到的很酷的东西,或者只是去看演出。我们会有很多其他人的东西的链接。另外,Rex 和我都是活跃的开发人员,并且拥有相当多的开源软件,我们为这类事情提供了一些开源软件。

斯坦福大学的机器学习课程真的很有趣,但是如果没有他们的一些离线讨论,有点难以理解。

在课程之外,您可以查看软件包或书籍以及它们周围的社区。他们倾向于填补关于这类事情的空白。所以,这里有一个列表:

  • Mahout ,一个用于Hadoop的机器学习库。曼宁也有一本关于这方面的书。如果您想学习如何使用大数据做这些事情,这是一个很好的解决方案。
  • Modeling with Data,Ben Klemens 的一本很棒的书,他在布鲁金斯学会工作,解释了这种事情的一个非常好的基础。
  • Weka和一本名为Data Mining的书。这是参与而不迷路的好方法。Weka 有一个易于使用的界面,使用起来并不比电子表格难多少。
  • R 语言是处理这类事情的好地方。你通常会在这个包中找到任何你想做的分析。我有几本书在这里踢。 R Book是我最喜欢的,虽然它有点贵。
  • Octave是 GNU 对MatLab(商业软件)的回应。他们背后都有令人难以置信的资源。

我认为 Ben Mabey为这类事情 整理了一个非常好的插板,里面充满了很好的教学链接。

最后,我的东西是Fathom,一个解决这类问题的开源框架和http://openmobi.us,一个为想要直接使用它的人实现 Fathom 库的网站。通过这些项目,我试图让人们更容易参与构建他们自己的模型并将它们用于他们的业务或教育。

于 2011-04-09T18:08:13.683 回答