我有一个涉及将文件上传到该站点的站点的想法。但我想要 - 并且想知道是否可能 - 是当用户单击“浏览”并选择文件时,如果站点可以在将文件上传到之前自动扫描站点的数据库以查找类似文件地点。当您在此站点上提出问题时,类似于自动的“相关问题”。
问问题
74 次
2 回答
1
当然,这是可能的。但是您必须提出自己的定义,以及寻找相似之处的算法。
文件类型差异
不同的文件类型应该以不同的方式进行比较。例如,一个文本文件非常适合通过 diff 查找相似文件,但比较相似的图像或视频要困难得多。
比较的难度
此外,与大量文件进行比较是一件非常昂贵的事情,因为它通常是成对完成的。一些索引方法虽然可以帮助提高搜索效率,但我没有看到一个简单的方法来快速做到这一点。
众源替代方案
另一种选择是让网站的用户指出相似之处,这样您就可以简单地显示投票相似的最受欢迎文件的列表。当然,这在上传新文件时无济于事,但它可以帮助您深入了解用户发现的相似之处。
许多网站比较内容相似性的做法是允许用户标记项目。如果一个项目与另一个项目共享许多相同的标签,它们很可能是相似的。这可能是最简单的方法。
这还具有可以将任何内容类型与任何其他内容类型进行比较的好处。因此,与视频具有相同标签的文本文件可以呈现为相似。
于 2009-10-07T18:26:19.673 回答
0
可以在不上传文件的情况下获取文件名,因此您可以根据文件名进行搜索。内容仅在上传后可用。
于 2009-10-07T18:25:57.363 回答