11

我正在寻找TREC 格式的规范。我一直在谷歌搜索,但我没有找到任何线索。

有谁知道在哪里可以找到有关它的任何信息?

4

4 回答 4

6

AFAIK TREC 是 NIST 文本检索会议的缩写。为了让索引器知道文档边界在文件中的位置,每个文档必须具有开始文档和结束文档标记。这些标记类似于 HTML 或 XML 标记,实际上是 TREC 文档的格式。

TrecParser:此解析器可识别 TEXT、HL、HEAD、HEADLINE、TTL 和 LP 字段中的文本。

资料来源:TREC 维基百科

资料来源:狐猴指南

于 2013-06-02T10:31:31.490 回答
1

它也是 TechSmith Camtasia 的新录制文件格式。https://feedback.techsmith.com/techsmith/topics/mac_upgrade-ri5ox

于 2014-05-23T11:17:14.450 回答
0

发现:http: //sourceforge.net/apps/trac/lemur/wiki/Indexer%20File%20Formats

于 2012-05-09T09:04:54.173 回答
0

它也是 IBM Watson 用于知识摄取的文件格式

于 2014-11-17T12:41:52.893 回答