-1

我有大量存储在 MongoDB 中的推文。推文看起来像这样:

"_id" : ObjectId("4c02c58de500fe1be1000005"),
"contributors" : null,
"text" : "Hello world",
"user" : {
    "following" : null,
    "followers_count" : 5,
    "utc_offset" : null,
    "location" : "",
    "profile_text_color" : "000000",
    "friends_count" : 11,
    "profile_link_color" : "0000ff",
    "verified" : false,
    "protected" : false,
    "url" : null,
    "contributors_enabled" : false,
    "created_at" : "Sun May 30 18:47:06 +0000 2010",
    "geo_enabled" : false,
    "profile_sidebar_border_color" : "87bc44",
    "statuses_count" : 13,
    "favourites_count" : 0,
    "description" : "",
    "notifications" : null,
    "profile_background_tile" : false,
    "lang" : "en",
    "id" : 149978111,
    "time_zone" : null,
    "profile_sidebar_fill_color" : "e0ff92"
},
"geo" : null,
"coordinates" : null,
"in_reply_to_user_id" : 149183152,
"place" : null,
"created_at" : "Sun May 30 20:07:35 +0000 2010",
"source" : "web",
"in_reply_to_status_id" : {
    "floatApprox" : 15061797850
},
"truncated" : false,
"favorited" : false,
"id" : {
    "floatApprox" : 15061838001

例如,如果我想查找关于某个主题的推文,例如佳能,那么我应该如何编写一个查询来检查“文本”并找到所有关于“佳能”的推文?

4

1 回答 1

1

MongoDB 没有直接在文本中搜索的原生查询支持。有官方文档向您展示了如何实现全文搜索的简单方法:
http ://www.mongodb.org/display/DOCS/Full+Text+Search+in+Mongo

它涉及将文本拆分为单词,并将它们存储在您索引的数组中。这使您可以匹配数组的内容。如何拆分它们是您的选择。也许你只是做单词,小写,然后匹配一个小写的关键字。或者,也许您需要自动完成功能,以便对每个单词或语音等进行变体。这就是词干。

它不像全文搜索引擎那样强大,旨在做到这一点,但它确实有效。根据您使用的语言,某些框架具有搜索包。例如,我将 mongodb 与django 的 nonrel 项目一起使用,并且有一个搜索应用程序,它提供了词干提取和不同的搜索工具。

于 2012-05-13T05:30:27.340 回答