1

我创建了一个小型 Java 应用程序(使用 Spring Data)来测试 MongoDB 的地理空间查询性能。

public class MongoThread {

public static void main(String[] args) throws Exception {

    if(args.length != 1) {
        System.out.println("Usage: MongoThread <nb_thread>");
        System.exit(0);
    }

    int nbThread = Integer.parseInt(args[0]);

    ApplicationContext ctx = new AnnotationConfigApplicationContext(SpringMongoConfigStandalone.class);
    MongoOperations db = (MongoOperations) ctx.getBean("mongoTemplate");

    for (int x=0; x<nbThread; x++) {
        double lat = Math.random() * 60;
        double lng = Math.random() * 60;
        double radius = 3000 + 50 * Math.random();
        MyThread t = new MyThread("Thread #" + x, db, lat, lng, radius);
        t.start();
    }

    //create1MEntries(db);
}

private static void create1MEntries(MongoOperations db) {
    if (!db.getCollectionNames().contains("Item")) {
        db.createCollection("Item");
    }
    db.indexOps(Item.class).ensureIndex(new GeospatialIndex("loc"));
    for(int i=0; i<1000000; i++) {
        Item item = new Item();
        item.setName("item" + i);
        item.setLoc(new double[]{Math.random() * 180, Math.random() * 180});
        db.save(item, "Item");
    }
}
}

class MyThread extends Thread {

String name;
MongoOperations db;
double lat, lng, radius;

public MonThread (String name, MongoOperations db, double lat, double lng, double radius) {
    this.name = name;
    this.db = db;
    this.lat = lat;
    this.lng = lng;
    this.radius = radius;
}

public void run() {
    long t1 = Calendar.getInstance().getTimeInMillis();
    List<Item> items = db.find(new Query(Criteria.where("loc")
            .near(new Point(lat,lng)).maxDistance(radius/111.12)).limit(100), Item.class, "Item");
    System.out.println(name + " - " + items.size() + " results found around " + radius + " of (" + lat + "," + lng + ")");
    long t2 = Calendar.getInstance().getTimeInMillis();
    System.out.println(name + " - " + (t2-t1) + "ms");
}
}

public class Item {
    @Id
    private String id;
    private String name;
    private double[] loc;
}

在多次运行测试以在内存中加载数据后,我得到以下结果:

  • 在我的开发计算机上(Win7 64 位,i7 860 @2.8 Ghz,RAM 8GB 1066Mhz):对于 100 个线程,我在大约 500 毫秒(450 毫秒到 550 毫秒之间)内得到所有响应

  • 在我的服务器上(由 OVH 托管:Debian 6.0 64 位,i3 2130 2x2(HT) 3.4GHz,RAM 16GB 1333Mhz):对于 100 个线程,我在大约 1700 毫秒(1600 毫秒和 1900 毫秒之间)得到所有响应

我不是硬件,也不是 Linux 专家,但我希望这台服务器比我的 Windows 计算机做得更好(或者至少一样好)。我在几个论坛上读到 MongoDB 在 Linux 上确实更快,重要的硬件特性是(按此顺序):RAM、CPU(但 Mongo 不使用多核)和硬盘驱动器。

我增加了最大打开文件数(使用 ulimit -n 99999),因为我读到它可以减慢 MongoDB,但它对结果没有影响。

你知道瓶颈来自哪里吗?

4

1 回答 1

4

我不认为这是 linux vs windows 的问题。我的意思是,与 Windows 机器上的 i7 相比,i3 处理器相当低端。

如果您真的想比较两个操作系统之间的性能,我建议让您的设置在相同的硬件上运行..

于 2012-11-25T20:23:59.833 回答