对于我正在创建的学术克隆网站,最好支持文档标签(见下文)。
该站点有多个用户,每个用户都有一个(长)出版物列表,他们可以单独添加/编辑。
在最简单的形式中,发布条目由超链接甚至纯文本组成。例如:
- A. Baynes、J. Watson 和 S. Holmes,“观察和推理在取证中的作用”,应用犯罪解决,221, 210-243 (1901)。doi: 10.1032/acsolv2714
(以上是一篇虚构的文章,但它包含了大多数引用中所期望的所有元素。)
对于那些不熟悉 DOI 链接的人,这些是固定的文本字符串,可以使用 dx.doi.org 解析到相关文章的页面。此外,版权/许可条款通常禁止作者在其网站上为其文章提供完整的 PDF/HTML。这些文章通常位于付费墙后面(通常可以从大多数大学/主要研究实验室访问)。因此,对文章本身运行全文搜索不是一种选择。
回到问题定义,我假设用户将他们的出版物添加为链接,但我想让他们能够指定一个逗号分隔的单词/短语(或标签)列表,以便更准确地识别文章的内容.
对于上述文章,适当的标签列表将是:
法医、血红蛋白、证据退化
在每个用户将这些标签附加到文章之后,我想创建一个后端,让网站的访问者能够简单地在搜索字段中输入这些标签,并找到所有与血红蛋白有关的出版物。
该搜索应该为网站的所有用户提取所有将血红蛋白列为标签的出版物。
我故意使用血红蛋白作为标签来说明相关标签不需要(通常不是)文章标题中指定的文本的一部分。
此外,Plone“集合”功能不足以解决此问题。集合通常由管理员生成。这意味着 a) 对此类事情的管理员干预是必不可少的,并且 b) 标签最好由用户定义,而不是由管理员定义。