我有一组 Books 对象,类Book定义如下:
Class Book{
String title;
ArrayList<tags> taglist;
}
其中title是书名,例如:Javascript for dummies。
taglist是我们示例的标签列表:Javascript 、jquery、“web dev”、..
正如我所说,有一套书谈论不同的事情:IT、生物学、历史……每本书都有一个标题和一组描述它的标签。
我必须按主题将这些书自动分类为单独的集合,例如:
它的书:
- 傻瓜Java
- 傻瓜的Javascript
- 在 30 天内学习 Flash
- C++ 编程
历史书籍:
- 世界大战
- 1960年的美国
- 马丁路德金生平
生物学书籍:
- ……
你们知道适用于这类问题的分类算法/方法吗?
一种解决方案是使用外部 API 来定义文本的类别,但这里的问题是书籍使用不同的语言:法语、西班牙语、英语..