我是一个不错的 c/c++ 程序员,但对 web 开发知之甚少。我对推特/社交数据挖掘感兴趣。那么哪个是更好的工具 - RoR 或 Django?我在 ruby 和 python 中都处于零级。但是 python 的语法似乎更容易理解/学习。但主要的问题是哪个工具有更好的挖掘相关 API?
谢谢!!
我是一个不错的 c/c++ 程序员,但对 web 开发知之甚少。我对推特/社交数据挖掘感兴趣。那么哪个是更好的工具 - RoR 或 Django?我在 ruby 和 python 中都处于零级。但是 python 的语法似乎更容易理解/学习。但主要的问题是哪个工具有更好的挖掘相关 API?
谢谢!!
他们都有你需要的一切。但我认为 Python 在这里做得更好。Python 有一个非常有趣的文本挖掘库,称为NLTK和Numpy/Scipy用于分析计算,它可以让您获得几乎 c 的可比性能。另一方面,对于纯数据挖掘,我建议使用 python+ Pandas(Pandas 写得很好,速度很快,据我所知没有 ruby 等价物)或 python + 一些称为 thru rpy的 R 代码。如果在您的数据挖掘代码中您需要计算一些符号数学,您可以决定使用Sympy(速度较慢,因为它是用 python 编写但非常完整)或Theano(速度更快但功能较少;它甚至可以让您的代码在 GPU 上运行通过 CUDA)
如果您只是从 twitter 收集数据,则不需要像 Django 或 RoR 这样的 MVC 框架。实际上,您可以使用C++ 库从 Twitter 收集数据,将它们存储在数据库中,建立索引等,然后使用 C 或 C++ 对您的数据执行数据挖掘任务。或者,您可以随时随地进行分析。
如果您想构建自己的 Web 界面来展示您的工作,或者类似的,Django 和 RoR 都是非常好的且易于上手的框架。
这不是一个真正的问题,请阅读常见问题解答