我正在研究如何为我的论文从文档中提取关键词。
在我的研究中,我使用朴素贝叶斯分类器机器学习来创建候选术语特征的训练模型。其中一个功能是PoS tag,我认为这个功能对于指定一个术语是否是关键短语很重要。
但是朴素贝叶斯(NB)分类器的输入是数字,PoS 标签是一个字符串。
所以我不知道如何将 PoS 标签特征表示为一个数字,以便成为 NB 分类器的输入特征。
请帮我给你的建议。
谢谢和问候, Hien Su
我正在研究如何为我的论文从文档中提取关键词。
在我的研究中,我使用朴素贝叶斯分类器机器学习来创建候选术语特征的训练模型。其中一个功能是PoS tag,我认为这个功能对于指定一个术语是否是关键短语很重要。
但是朴素贝叶斯(NB)分类器的输入是数字,PoS 标签是一个字符串。
所以我不知道如何将 PoS 标签特征表示为一个数字,以便成为 NB 分类器的输入特征。
请帮我给你的建议。
谢谢和问候, Hien Su