我有一个问题,如果你能回答我,我将不胜感激。
我需要为不同类型的文档(包括 Google Docs、PDF、DOC 等)实现模式匹配搜索。从我在这方面的研究来看,这种模式匹配在 GAE 上似乎不能直截了当。
我可以请您指导我如何在 GAE 上实现模式匹配吗?您是否推荐任何开源搜索引擎或本地 Google 搜索 API 来定制用于 GAE 上的模式匹配搜索?
如果你能回答我,我将不胜感激。非常感谢。
问候, 萨尔戈尔
我有一个问题,如果你能回答我,我将不胜感激。
我需要为不同类型的文档(包括 Google Docs、PDF、DOC 等)实现模式匹配搜索。从我在这方面的研究来看,这种模式匹配在 GAE 上似乎不能直截了当。
我可以请您指导我如何在 GAE 上实现模式匹配吗?您是否推荐任何开源搜索引擎或本地 Google 搜索 API 来定制用于 GAE 上的模式匹配搜索?
如果你能回答我,我将不胜感激。非常感谢。
问候, 萨尔戈尔
AFAIK AppEngine 的设计目的是在将数据写入数据库之前强烈倾向于数据处理,而不是在读回期间/之后。虽然这通常会导致存储更多数据,但通常可以显着提高应用程序性能。
应用于您的案例,我会说您应该尝试想出一种方法,在将文档写入数据存储区时为您的文档构建和存储某种索引。然后使用此索引进行模式匹配。
由于您的问题尚不清楚您在谈论哪种模式匹配,因此很难提供更具体的建议。但是,例如,如果您只是在谈论关键字搜索,那么对于每个文档,您可以在数据存储区中拥有第二个实体,该实体存储文档的数据存储区键并包含具有多个值的属性(App Engine 数据存储区:如何设置属性上有多个值?)列出文档中存在的所有关键字。然后,您可以对这些“索引对象”进行简单的等式查询,以查找与您的搜索词匹配的所有文档。