有哪些好的算法可以用城市/地区或原产地自动标记文本?也就是说,如果博客是关于纽约的,我怎么能以编程方式讲述。是否有任何包装/文件声称可以肯定地做到这一点?
我已经研究了一些基于 tfidf 的方法、专有名词交集,但到目前为止,还没有取得惊人的成功,我会很感激想法!
给定一些主题列表,更一般的问题是关于将文本分配给主题。
简单/天真的方法更喜欢完全使用贝叶斯方法,但我很开放。
有哪些好的算法可以用城市/地区或原产地自动标记文本?也就是说,如果博客是关于纽约的,我怎么能以编程方式讲述。是否有任何包装/文件声称可以肯定地做到这一点?
我已经研究了一些基于 tfidf 的方法、专有名词交集,但到目前为止,还没有取得惊人的成功,我会很感激想法!
给定一些主题列表,更一般的问题是关于将文本分配给主题。
简单/天真的方法更喜欢完全使用贝叶斯方法,但我很开放。