Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在寻找TREC 格式的规范。我一直在谷歌搜索,但我没有找到任何线索。
有谁知道在哪里可以找到有关它的任何信息?
AFAIK TREC 是 NIST 文本检索会议的缩写。为了让索引器知道文档边界在文件中的位置,每个文档必须具有开始文档和结束文档标记。这些标记类似于 HTML 或 XML 标记,实际上是 TREC 文档的格式。
TrecParser:此解析器可识别 TEXT、HL、HEAD、HEADLINE、TTL 和 LP 字段中的文本。
资料来源:TREC 维基百科
资料来源:狐猴指南
它也是 TechSmith Camtasia 的新录制文件格式。https://feedback.techsmith.com/techsmith/topics/mac_upgrade-ri5ox
发现:http: //sourceforge.net/apps/trac/lemur/wiki/Indexer%20File%20Formats
它也是 IBM Watson 用于知识摄取的文件格式