我是 Java 新手,我不知道 Java 集合实现之间的区别。
我必须处理多达 10 万条导入数据的记录。该列表中可能有重复项。我必须把所有这些都放到数据库中。在导入之前我清理了数据库表,所以一开始在 DB 中没有重复。
使用休眠模式批量插入数据。我想做这样的事情:
SomeCollectionClass<Integer> alreadyInsertedRecords;
//...
if (!alreadyInsertedRecords.contains(currentRecord.hashCode()) {
save_to_database(currentRecord);
alreadyInsertedRecords.put(currentRecord.hashCode());
} else {
logger.log("Record no 1234 is a duplicate, skipping");
}
我应该使用哪个集合类来检查记录是否已插入数据库?
正如我所说,可能有超过 100 000 条记录,因此集合应该快速搜索、快速插入并且具有较小的内存占用。