有没有办法将特定的句子/段落分类为有趣。很少有关于人们应该在这方面更进一步的指示。
5 回答
对此有研究,称为计算幽默。这是一个跨学科领域,包含计算语言学、心理语言学、人工智能、机器学习等方面的元素。他们试图找出是什么让故事或笑话变得有趣(例如,意想不到的联系,或以令人惊讶的方式使用禁忌话题)等)并将其应用于文本(生成有趣的故事或衡量文本的“有趣性”)。
有关于它的书籍和文章(例如Graeme Ritchie的)。
是的,您应该使用训练语料库来构建能够检测有趣句子的预测模型。有时这在文献中被称为“情绪分析”。看看这篇关于使用 LingPipe 进行情绪分析的文章。
如果您可以使用 Java,则可以使用他们的库(请参阅许可证矩阵)。我发现它非常有用,与您的上下文不完全相同。
实现这一目标的唯一方法是让几千人(猴子不会这样做,抱歉)浏览数千个有趣的句子/故事,对它们进行评分,然后构建某种专家系统/神经网络它。考虑到问题的范围和它的主观性(对一个人来说有趣的事情可能对另一个人来说并不有趣 - 甚至是冒犯性的),我会说这是一项不可能完成的任务。
您可以使用与垃圾邮件过滤器相同的技术。而不是垃圾邮件/非垃圾邮件,您将其分类为有趣/不有趣。查看朴素贝叶斯分类器以获取更多信息。
另外,如果您认真考虑进入该领域,请尝试计算幽默@Google Scholar 。也提到了情绪分析,请参阅维基百科。
当然,这一切都取决于您的范围和目标......