3

我正在开发一个在后端使用 RavenDB 的应用程序。这是我第一次使用 Raven,我正在努力使用 Map/Reduce。

我一直在阅读文档,但不幸的是我在这个过程中没有得到任何进展。

基本上我有成千上万的这样的文件。

{
  .....
  "Severity": {
    "Code": 6,
    "Data": "Info"
  },
  "Facility": {
    "Code": 16,
    "Data": "Local Use 0 (local0)"
  },
  .....
}

除此之外,我需要使用如下所示的输出进行单个查询。

{"Severity": [
    {"Emergency":0},
    {"Alert":0},
    {"Critical":0},
    {"Error":0},
    {"Warning":0},
    {"Notice":0},
    {"Info":2711},
    {"Debug":410}
],
"Facility": [
    {"Kernel Messages":0},
    {"User-Level Messages":0},
    {"Mail System":0},
    {"System Daemons":0},
    {"Security/Authorization Messages":0},
    {"Internal Syslogd Messages":0},
    {"Line Printer Subsystem":2711},
    {"Network News Subsystem":410},
    ....
    {"Local Use 0 (local0)": 2574},
    ...
]}

其中 Severity/Facility Array 中的“Key”是Data上述 json 数据的一部分,Severity/Facility Array 中的“value”是Count每种Code类型的文档。

示例:
以上述数据为指导,

我的数据库中有 2711 个文档的Info严重性。
我的数据库中有 410 个文档的Debug严重性。
我的数据库中有 2574 份文档local0
ETC...


我想做的是在应用程序启动时生成适当的索引(或检查它们是否已经存在),但我什至不知道从哪里开始。

注意:应用程序需要生成索引,仅手动将其写入 RavenDB Web UI 是不够的。

4

1 回答 1

4

您将需要结合多种技术来实现这一点,但这是非常可行的。

这是一个适合您的索引。

public class MyIndex : AbstractMultiMapIndexCreationTask<MyIndex.ReduceResult>
{
    public class ReduceResult
    {
        public string Source { get; set; }
        public string Code { get; set; }
        public string Data { get; set; }
        public int Count { get; set; }
    }

    public MyIndex()
    {
        AddMap<MyDoc>(docs => from doc in docs
                              select new
                                     {
                                         Source = "Severity",
                                         doc.Severity.Code,
                                         doc.Severity.Data,
                                         Count = 1
                                     });

        AddMap<MyDoc>(docs => from doc in docs
                              select new
                                     {
                                         Source = "Facility",
                                         doc.Facility.Code,
                                         doc.Facility.Data,
                                         Count = 1
                                     });

        Reduce = results => from result in results
                            group result by new { result.Source, result.Code }
                            into g
                            select new
                            {
                                g.Key.Source,
                                g.Key.Code,
                                g.First().Data,
                                Count = g.Sum(x => x.Count)
                            };

        TransformResults = (database, results) =>
                           from result in results
                           group result by 0
                           into g
                           select new
                           {
                               Severity = g.Where(x => x.Source == "Severity")
                                           .ToDictionary(x => x.Data, x => x.Count),
                               Facility = g.Where(x => x.Source == "Facility")
                                           .ToDictionary(x => x.Data, x => x.Count)
                           };
    }
}

您还需要一个用于转换结果的容器类:

public class MyDocCounts
{
    public IDictionary<string, int> Severity { get; set; }
    public IDictionary<string, int> Facility { get; set; }
}

你会像这样查询它:

var result = session.Query<MyIndex.ReduceResult, MyIndex>()
                    .As<MyDocCounts>()
                    .ToList().First();

.ToList()看起来可能是多余的,但它是必要的,因为我们在转换中进行分组。

完整的单元测试在这里。其输出如下所示:

{
  "Severity": {
    "AAA": 20,
    "BBB": 20,
    "CCC": 20,
    "DDD": 20,
    "EEE": 20
  },
  "Facility": {
    "FFF": 20,
    "GGG": 20,
    "HHH": 20,
    "III": 20,
    "JJJ": 20
  }
}
于 2013-02-25T03:53:47.473 回答