我正在将我收集的大约 13000 本书放在一个 mySQL 数据库中。我拥有的大多数副本都可以通过 ISBN 唯一标识。我需要将此区分代码用作另一个数据库表的外键。
然而,我的很多书都可以追溯到 ISBN 之前的时代。所以对于这些,我正在尝试设计一个方案来唯一地分配一个代码,有点像 SKU。
该代码将严格供私人使用。它应该有一个重要的特性,当我获得一份 ISBN 之前的出版物时,我可以通过检查作品来构建代码,并根据结果搜索数据库以查看我是否已经拥有其他副本。
许多年前,我想我看到了一些大学(?)目录的搜索方案,您可以在其中根据由标题中的 8 个字母组成的连接字符串(或代码)执行标题搜索,和 4 来自作者,也许还有其他一些数据。例如,要搜索 Stephen Hawking 和 Roger Penrose 的“The Nature of Space and Time”,您可以对字符串“Nature SHawk”执行搜索,该字符串由标题中的 8 个字符组成(省略非归档词和停用词)和4 来自作者。
我无法找到有关此类计划的任何信息,或者此类方法是否以任何方式标准化。
当然,可以按照这些思路制作一些东西,但我想知道这里的人们是否听说过这样的计划,是否有关于如何解决这个问题的想法。所以请记住“可复制性”的重要属性:使用该方案,检查一个前 ISBN 日期的作品应该——忽略非常特殊或排他性的情况——通常会导致一个代码可以单独用于随后确定是否这样的副本已经在数据库中。
感谢您的时间。