我正在寻找扩展我的推荐系统以包含其他功能(维度)。到目前为止,我正在跟踪用户如何评价某些文档,并使用它来进行推荐。我有兴趣添加更多功能,例如用户位置、年龄、性别等。到目前为止,一些 mysql 表已经足以处理这个问题,但我担心随着我添加更多功能它会很快变得混乱。
我的问题:我怎样才能最好地表示和保存这种多维数据?Python 特定提示会有所帮助。
谢谢
我正在寻找扩展我的推荐系统以包含其他功能(维度)。到目前为止,我正在跟踪用户如何评价某些文档,并使用它来进行推荐。我有兴趣添加更多功能,例如用户位置、年龄、性别等。到目前为止,一些 mysql 表已经足以处理这个问题,但我担心随着我添加更多功能它会很快变得混乱。
我的问题:我怎样才能最好地表示和保存这种多维数据?Python 特定提示会有所帮助。
谢谢
我推荐使用张量,它是多维数组。您可以使用任何数据表或简单的文本文件来存储张量。每一行或每一行都是一个记录/交易,其中列出了不同的特征。
SQL 数据库在您的情况下应该可以正常工作。事实上,您可以将所有训练示例存储在一个数据库中,每一行代表一个特定的训练集,每一列代表一个特征。您可以在需要时通过添加列来添加功能。在关系数据库中,由于各种不一致的原因,您可能会在查询数据时遇到访问错误。尝试使用 NoSQL 数据库。我个人在 python 上使用 MongoDB 和 Pymongo 将训练示例存储为 JSON 格式的字典。(这种方式更容易用于网络应用程序)。