0

我有一些数据正在尝试使用rmongodb包从 mongodb 检索到 R 中。在某个时间点,存储文档中字段的顺序发生了变化。

我试图强制我的投影查询通过明确指定尝试的方法来保持投影字段的顺序:SO问题如下:

data <- mongo.find.all(mongo_conn, table,
                          fields = list('id1' = 1, 'id2' = 2,
                                        'time' = 3, 'latitude' = 4,
                                        'longitude' = 5, '_id' = 0))

我似乎找不到一个好的答案。它按照它们在数据库中的顺序返回字段,当然,这些字段已更改为列表。

这意味着,它对我必须编写什么样的循环代码来将返回的结果组织成类似结构的数据框造成明显的破坏。

知道如何按指定顺序获取字段而不是数据库中的内容吗?

4

1 回答 1

1

在你链接到它的答案中说

简单的答案是你不能这样做。

另请参阅相关的 mongodb 票证

但是,要以类似data.frame结构的方式获得结果,请使用mongolite,使用起来要容易得多

考虑这个使用mtcars数据的例子

data("mtcars")

library(mongolite)  

mongo <- mongo(db = "test",
               collection = "mtcars",
               url = "mongodb://localhost")

## insert into database
mongo$insert(mtcars)
# Complete! Processed total of 32 rows.
# [1] TRUE

mongolite::find会自动将查询结果简化为data.frame结构

df_results <- mongo$find()
# Imported 32 records. Simplifying into dataframe...

head(df_results)
#                     mpg cyl disp  hp drat    wt  qsec vs am gear carb
# Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
# Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
# Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
# Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
# Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
# Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1

或者,使用聚合框架

mongo$aggregate(pipeline = '[{ "$project" : { "mpg" : 1, "wt" : 1, "_id" : 0}  },
                             { "$limit" : 5 }]')

# Imported 5 records. Simplifying into dataframe...
#     mpg    wt
# 1 21.0 2.620
# 2 21.0 2.875
# 3 22.8 2.320
# 4 21.4 3.215
# 5 18.7 3.440

现在有点无耻的自我推销。我一直在研究返回 data.table 对象的 mongolite 扩展。这里的想法是提高返回对象的速度,但前提是返回的结果集可以使用rbindlist.

该软件包是mongolitedt,并且仍在开发中。

# devtools::install_github("SymbolixAU/mongolitedt")
library(mongolitedt)

bind_mongolitedt(mongo)

mongo$aggregatedt(pipeline = '[{ "$project" : { "mpg" : 1, "wt" : 1, "_id" : 0}  },
                             { "$limit" : 5 }]')

## now have a data.table object returned
#  Imported 5 records.
#     mpg    wt
# 1: 21.0 2.620
# 2: 21.0 2.875
# 3: 22.8 2.320
# 4: 21.4 3.215
# 5: 18.7 3.440

## clean up
rm(mongo); gc()
于 2016-06-20T11:55:20.900 回答