我的一个网络应用程序收到了很多文章提交,其中一些写得不太好。仅仅通过提供好文章和坏文章的语料库来创建一个识别“好”和“坏”写作的工具有多大可能?
请注意,这些文章(至少已经处理过的文章)已经过审查和评分,所以理论上我可以使用这些数字来确认输出。
我没有创建“学习”算法的背景,因此即使只是指向有关该主题的基础书籍的指针也会有所帮助,尤其是为 Python 语言编写的书籍。
我的一个网络应用程序收到了很多文章提交,其中一些写得不太好。仅仅通过提供好文章和坏文章的语料库来创建一个识别“好”和“坏”写作的工具有多大可能?
请注意,这些文章(至少已经处理过的文章)已经过审查和评分,所以理论上我可以使用这些数字来确认输出。
我没有创建“学习”算法的背景,因此即使只是指向有关该主题的基础书籍的指针也会有所帮助,尤其是为 Python 语言编写的书籍。
我认为这将是一个难以进行的学习算法。但是,如果您确实想尝试或只是有兴趣了解该主题,Coursera 提供了许多值得一试的免费在线课程。
本课程目前未针对作业等进行,但您可以在预览模式下观看讲座,据我所知,这非常适合初学者: https ://class.coursera.org/machlearning-001/lecture/preview
如果你想要一些练习,那么我强烈建议你看看 Kaggle ( http://www.kaggle.com/ ),它为数据科学/机器学习问题举办公开比赛。有些比赛甚至有示例代码可以帮助您入门,泰坦尼克号比赛有一些 Python 示例代码,尽管正在处理的问题比您提出的问题要简单得多。