3

您如何检查来自两个不同社交媒体网站的两个个人资料是否相同?存在哪些算法来实现这一点,从而为匹配分配权重度量?

假设我有一个来自 LinkedIn 的个人资料和另一个来自 Facebook 的个人资料。我知道这两个配置文件的属性。我可以实施什么算法来找到这两个配置文件之间的匹配距离。

谢谢阿布舍克 S

4

1 回答 1

6

您可以尝试机器学习算法,特别是分类

为简单起见,假设您想要一个二进制答案:是或否(这可以稍后改进)。

你必须做的:

  1. 从两个配置文件中提取您拥有的功能,并为两个组合配置文件创建一个实例。这将是一个需要分类的实例
  2. 创建一个训练集。训练集是一组您知道分类的“实例”(通常来自手动标记它们)。
  3. 在给定训练集的情况下运行分类算法 - 这将“猜测”您稍后将获得的未分类实例的分类。

您可能想要使用的一些算法是:

  1. SVM - 被许多人认为是当今存在的最佳分类算法。
  2. 决策树- 特别是C4.5 - 非常直观的分类器(人类可读!)并且易于使用,而且 - 分类时间非常短。
  3. K 最近邻- 直观且易于使用,但在特征数量很大时表现不佳。

于 2012-05-25T06:12:52.207 回答