python - 对不同字符串参数之间的文档相似性进行建模的最佳方法是什么？

Question

我有一个问题是预测用户面临的问题的解决方案。

问题设置是这样的：

我们有一个问题和解决方案的数据库。对于每个问题，我们都有三个参数来表示它。

每个问题都有一个由遇到该问题的用户添加的相应解决方案。该解决方案参数是

所以我们想利用那个数据库来预测新问题的解决方案（一个问题是一组作业名、作业ID、根本原因——都是字符串）

我们最初提出了这个解决方案。 我们只想识别与我们的查询问题相似的问题（作业名称、作业标识、根本原因），并为最接近的问题提供解决方案。 但在这种情况下，我们无法像在房价预测问题中那样测量训练误差。

一般来说，我们如何解决这个问题，我们需要使用什么样的机器学习模型？

score 0 · Accepted Answer

看来，你想建立一种推荐系统。根据问题的原因，提出建议的解决方案列表。一种可能的解决方案 - 使用word2vec进行矢量化RootCause，然后尝试使用矢量相似性找到类似的问题。

1 回答 1