在 GSA(Google Search Appliance)中,我正在研究如何让它只抓取元数据(名称、类型、大小、上次修改时间等)而不是文件的内容。虽然我意识到这会影响结果的有用性,但我有我的要求。
归结为文件的元数据是公开的,但文件的内容是受限制的。虽然这似乎是一个经过安全调整的问题,但它稍微多一点,因为我不希望 GSA 在索引中存储有关文件内容的任何信息。假设不信任 GSA 服务器来保存内容。这仅适用于整个数据集的一小部分。
关于如何将 GSA 和连接器配置为仅抓取元数据而不抓取内容的任何想法?