我试图找出在关系数据库中存储信息的复杂算法的最佳实践。
具体来说:我想在包含许多文档的 TFxIDF 向量的大型 MS SQL Server 数据库上实现 k-means 算法(文档聚类算法)的变体(这些向量用作算法的输入)。
我的第一个想法是使用存储过程、函数、视图和所有其他基本 SQL Server 工具在 SQL 中完成所有工作,但后来我想也许我应该编写托管代码(我精通 C#),这些代码将在SQL 服务器。
性能是这里的一个问题,所以我也需要考虑到这一点。
我将不胜感激有关我应该采取的道路的任何建议。
谢谢!