1

我正在尝试使用文本分类来解决时间线检测问题。作为一个新手,我对如何解决这个问题感到困惑。这是分类问题吗?即,我可以使用年份(时间线)作为结果并将其作为分类问题来解决吗?

4

1 回答 1

0

您应该能够按照您的建议将此作为分类问题来解决。一个选项可以是查找或构建一个由带有设置周期标记的文本组成的语料库,并在该数据集上训练分类算法。

另一种选择是在这样的数据集上训练一个词空间模型,并为不同的时间段(例如 50 年代、60 年代等)生成向量。然后,您可以为要分类的文本创建一个文档向量,并找出这些时间向量中的哪一个产生最佳匹配。

可能行不通,但看看你得到什么结果可能会很有趣。

希望这可以帮助!

于 2012-10-31T12:39:03.780 回答