Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我想收集一个openEdX论坛上的所有消息进行定量分析。最常用的专业词是什么,等等。但是如何下载/挖掘 openEdX 论坛?
我想您可以访问 Open edX 平台?您需要从所有线程和所有消息中提取文本。与论坛交互的库位于lms.lib.comment_client. 例如,要获取特定课程的所有线程,请执行:
lms.lib.comment_client
lms.lib.comment_client.Thread.search({ 'course_id': course_id, })
对于每个线程,您必须遍历评论并提取它们的正文,并最终提取它们的标题。thread.to_dict()我相信您可以使用该方法从线程中获取评论。
thread.to_dict()