我创建了一个小型 Java 应用程序(使用 Spring Data)来测试 MongoDB 的地理空间查询性能。
public class MongoThread {
public static void main(String[] args) throws Exception {
if(args.length != 1) {
System.out.println("Usage: MongoThread <nb_thread>");
System.exit(0);
}
int nbThread = Integer.parseInt(args[0]);
ApplicationContext ctx = new AnnotationConfigApplicationContext(SpringMongoConfigStandalone.class);
MongoOperations db = (MongoOperations) ctx.getBean("mongoTemplate");
for (int x=0; x<nbThread; x++) {
double lat = Math.random() * 60;
double lng = Math.random() * 60;
double radius = 3000 + 50 * Math.random();
MyThread t = new MyThread("Thread #" + x, db, lat, lng, radius);
t.start();
}
//create1MEntries(db);
}
private static void create1MEntries(MongoOperations db) {
if (!db.getCollectionNames().contains("Item")) {
db.createCollection("Item");
}
db.indexOps(Item.class).ensureIndex(new GeospatialIndex("loc"));
for(int i=0; i<1000000; i++) {
Item item = new Item();
item.setName("item" + i);
item.setLoc(new double[]{Math.random() * 180, Math.random() * 180});
db.save(item, "Item");
}
}
}
class MyThread extends Thread {
String name;
MongoOperations db;
double lat, lng, radius;
public MonThread (String name, MongoOperations db, double lat, double lng, double radius) {
this.name = name;
this.db = db;
this.lat = lat;
this.lng = lng;
this.radius = radius;
}
public void run() {
long t1 = Calendar.getInstance().getTimeInMillis();
List<Item> items = db.find(new Query(Criteria.where("loc")
.near(new Point(lat,lng)).maxDistance(radius/111.12)).limit(100), Item.class, "Item");
System.out.println(name + " - " + items.size() + " results found around " + radius + " of (" + lat + "," + lng + ")");
long t2 = Calendar.getInstance().getTimeInMillis();
System.out.println(name + " - " + (t2-t1) + "ms");
}
}
public class Item {
@Id
private String id;
private String name;
private double[] loc;
}
在多次运行测试以在内存中加载数据后,我得到以下结果:
在我的开发计算机上(Win7 64 位,i7 860 @2.8 Ghz,RAM 8GB 1066Mhz):对于 100 个线程,我在大约 500 毫秒(450 毫秒到 550 毫秒之间)内得到所有响应
在我的服务器上(由 OVH 托管:Debian 6.0 64 位,i3 2130 2x2(HT) 3.4GHz,RAM 16GB 1333Mhz):对于 100 个线程,我在大约 1700 毫秒(1600 毫秒和 1900 毫秒之间)得到所有响应
我不是硬件,也不是 Linux 专家,但我希望这台服务器比我的 Windows 计算机做得更好(或者至少一样好)。我在几个论坛上读到 MongoDB 在 Linux 上确实更快,重要的硬件特性是(按此顺序):RAM、CPU(但 Mongo 不使用多核)和硬盘驱动器。
我增加了最大打开文件数(使用 ulimit -n 99999),因为我读到它可以减慢 MongoDB,但它对结果没有影响。
你知道瓶颈来自哪里吗?