我有一个问题是预测用户面临的问题的解决方案。
问题设置是这样的:
我们有一个问题和解决方案的数据库。对于每个问题,我们都有三个参数来表示它。
- JobName(字符串 - 作业名称)
- JobId(整数 - 作业的 ID)
- RootCause(字符串 - 导致该问题的原因)。
每个问题都有一个由遇到该问题的用户添加的相应解决方案。该解决方案参数是
- 解决方案(字符串 - 用户为该问题输入的解决方案)
所以我们想利用那个数据库来预测新问题的解决方案(一个问题是一组作业名、作业ID、根本原因——都是字符串)
我们最初提出了这个解决方案。 我们只想识别与我们的查询问题相似的问题(作业名称、作业标识、根本原因),并为最接近的问题提供解决方案。 但在这种情况下,我们无法像在房价预测问题中那样测量训练误差。
一般来说,我们如何解决这个问题,我们需要使用什么样的机器学习模型?