可能的重复:
文本分类到类别
我目前正在研究一种解决方案,以根据他们的描述在包含 10k 家餐厅的数据库中获取食物类型。我正在使用关键字列表来决定提供哪种食物。
我读了一点关于机器学习的书,但我根本没有这方面的实践经验。任何人都可以向我解释是否/为什么它会更好地解决像这样的简单问题吗?我发现准确性比性能更重要!
简化示例:
["China", "Chinese", "Rice", "Noodles", "Soybeans"]
["Belgium", "Belgian", "Fries", "Waffles", "Waterzooi"]
一个可能的描述可能是:
“Hong's Garden Restaurant 为我们的顾客提供美味、价格合理的中餐。如果您发现自己在周六晚上 8 点突然想吃 米饭、面条或大豆,请不要担心!我们 7 天营业一周,提供外卖服务,薯条也可以在这里买!”