例如来自 Microsoft - “KB2756872”或来自国家漏洞数据库 - “CVE-2010-1428”或来自 Red Hat - “RHSA-2010:0376”或来自 OID - “1.3.6.1.4.1.311”或来自 UUID/GUID - “550e8400-e29b-41d4-a716-446655440000”。
我想把几个工作放到 UID 上。看下...
我开发了博客软件,并有想法在每篇文章的正文中放置唯一的 ID,以便可以轻松识别来自本地存储的副本对应于远程发布的副本。
此外,我想在许多不同的博客服务上发帖,这样如果一个失败了,可以从另一个访问文章。所以链接可能会死,但如果我添加 UID - 任何人都可以尝试网络搜索以在其他服务上查找帖子!
这也允许收集一些文章传播统计数据。许多网站只是复制内容(复制和重写机器人和人)来破坏搜索引擎。使用 UID,我可以轻松识别此类网站...
所以我的问题是如何制作 UID(以哪种形式),以便它可以很容易地被搜索引擎(网络,如 Google/Yahoo,以及企业,如 Lucene/Solr/Sphinx/Xapian/等)索引。
我知道搜索引擎的一些限制,例如:
- 每个搜索部分仅 >= 3 个字符
- 它不是像 gfh6wytrh6wu56he5gahj763 这样的索引灰尘
所以这个任务并不容易...
任何建议表示赞赏(书籍/博客文章/等)。