3

我已经写过 Sieve of Eratosthenes,它应该并行工作,但事实并非如此。当我增加线程数时,计算时间并没有变短。任何想法为什么?

主班

import java.util.Date;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;

public class ConcurrentTest {
    public static void main(String[] args) throws InterruptedException {
        Sieve task = new Sieve();
        int x = 1000000;
        int threads = 4;
        task.setArray(x);
        Long beg = new Date().getTime();
        ExecutorService exec = Executors.newCachedThreadPool();
        for (int i = 0; i < threads; i++) {
            exec.execute(task);
        }
        exec.shutdown();
        Long time = 0L;
    // Main thread is waiting until all threads are terminated
    // ( it means that computing is done)
        while (true)
            if (exec.isTerminated()) {
                time = new Date().getTime() - beg;
                break;
            }

        System.out.println("Time is " + time);
    }
}

筛类

import java.util.concurrent.ConcurrentHashMap;

public class Sieve implements Runnable {
    private ConcurrentHashMap<Integer, Boolean> array = 
                       new ConcurrentHashMap<Integer, Boolean>();
    private int x;
    public void run() {
        while(true){
    // I am getting synchronized number to check if it's prime
            int n = getCounter();
    // If no more numbers to check, stop loop
            if( n == -1)
                break;
    // If HashMap contains number, we can further
            if(!array.containsKey(n))continue;
            for (int i = 2 * n; i <= x; i += n) {
    // Compound numbers are removed from HashMap, Eg. 6, 12 and much more.
                    array.remove(i);
            }
        }
    }
    private synchronized int getCounter(){
        if( counter < x)
            return counter++;
        else return -1;
    }
    public void setArray(int x) {
        this.x = x;
        for (int i = 2; i <= x; i++)
            array.put(i, false);
    }
}

我用不同数量的线程做了一些测试。这些是结果:

Nr of threads 1    Time is 1850, 1795, 1825
Nr of threads 2    Time is 1845, 1836, 1814
Nr of threads 3    Time is 1767, 1820, 1756
Nr of threads 4    Time is 1732, 1840, 2083
Nr of threads 5    Time is 1791, 1795, 1803
Nr of threads 6    Time is 1825, 1728, 1707
Nr of threads 7    Time is 1754, 1729, 1686
Nr of threads 8    Time is 1760, 1717, 1817
Nr of threads 9    Time is 1721, 1699, 1673
Nr of threads 10   Time is 1661, 1722, 1718
4

1 回答 1

4

当我增加线程数时,计算时间并没有变短

tl;博士:你的问题太小了。如果将 x 增加到 10000000,则差异将变得更加明显。但是,它们不会是您所期望的。

我在八核机器上尝试了您的代码,并稍作修改:

  1. 对于计时,我在 Date 上使用System.nanoTime()而不是 getTime()。
  2. 我使用 ExecutorService 的awaitTermination方法而不是 spinloop 来检查运行是否结束。

我尝试使用固定线程池缓存线程池分叉连接池启动您的 Sieve 任务,并比较线程变量的不同值的结果。

我在 x=10000000 的机器上看到以下结果(以毫秒为单位):

    线程数 = 1 2 4 8 16
    固定线程池 = 5451 3866 3639 3227 3120
    缓存线程池= 5434 3763 3709 3258 3078
    分叉池 = 6732 3670 3735 3190 3102

这些结果向我们展示了从单个执行线程更改为两个线程的明显好处。但是,额外线程的好处会迅速下降。有一个有趣的平台,从 2 个线程到 4 个线程,边际收益高达 16 个。

此外,您还可以看到不同的线程机制具有不同的初始开销:我没想到 Fork-Join 池的启动成本比其他机制高得多。

因此,正如所写的,对于小型但非平凡的问题集,您不应该真的期望通过两个线程获得好处。

如果您想增加额外线程的好处,您将需要查看您当前的实现。例如,当我使用incrementAndGet()从同步的 getCounter() 切换到AtomicInteger时,我消除了同步方法的开销。结果是我所有的四个线程数都下降了大约 1000 毫秒。

于 2013-09-19T13:22:48.183 回答