Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
对于用例,我有 1000 万个字段(将每个字段视为随机数),其中字段不是唯一的(存在重复项)。我需要按升序对数据进行排序
这些集合中的哪一个会给排序后的输出提供更好的性能? 或者也许是别的什么?
您需要自己编写一些测试代码。
编写一些代码来填充 1000 万个字段的列表,然后使用上述每个项目来找出哪种方法最快。
集合不允许重复,因此(除非您有具有不同键的相同项目)它们是不可能的。
另外,根据您的意思,请考虑 1000 万个随机数(我假设您的意思是很多值),您可能会考虑使用数据库引擎来实现这一壮举。(这样的HSQL可以解决问题)。
处理所有这些数字可能会让您处理内存问题(可以通过使用外部排序技术来处理)。但我认为在这种情况下,使用数据库引擎应该会给您带来最大的收益。