我想识别我拥有的文本上的一些实体,我发现了很多算法(NaiveBayes、隐藏马尔可夫模型、条件随机场等),但似乎几乎所有这些都需要大量的训练数据来对实体进行分类。
我想知道是否有一些算法可以在没有训练数据中的文本的情况下识别,但可能只有代表我想要识别的数据的单词,或者可能是一些字符串模式,或者其他方式。
我唯一要避免的是必须将大量文本作为训练数据。
我想识别我拥有的文本上的一些实体,我发现了很多算法(NaiveBayes、隐藏马尔可夫模型、条件随机场等),但似乎几乎所有这些都需要大量的训练数据来对实体进行分类。
我想知道是否有一些算法可以在没有训练数据中的文本的情况下识别,但可能只有代表我想要识别的数据的单词,或者可能是一些字符串模式,或者其他方式。
我唯一要避免的是必须将大量文本作为训练数据。