3

我正在使用两个线程将两个矩阵相乘(但是,该程序也被编写为按比例放大,因此我可以使用三个、四个等线程代替)。每个线程计算/完成最终矩阵的一行(或列)的工作。如果一个线程在一行上工作,那么其他线程不应该在该行上工作。它/他们应该移动到下一个可用行。

首先,我不确定我实现问题的方式是否正确。如果你能看到更好的方法,请告诉我。

其次,按照我的做法,每次我测试它(使用不同大小的矩阵——甚至是巨大的矩阵)时,只有一个线程可以完成这项工作。也就是说,每次都是同一个线程访问 run() 方法的同步块。其他线程都进入了 run() 方法,但为什么只有一个线程总是获得锁并完成所有工作?

这是我的运行方法:

 public void run() {
    System.out.println(Thread.currentThread().getName());
    while (i < number of columns in final matrix) {
        synchronized (this) {
            if (i < number of columns in final matrix) {
                for (int j = 0; j < Main.B[0].length; j++) { 
                    for (int k = 0; k < Main.A[0].length; k++) { 
                        Main.C[i][j] += Main.A[i][k] * Main.B[k][j];
                    }
                }
                i++;
            }
        }
    }
} 

这是我的驱动程序类中创建线程并启动程序的代码:

MyRunnable r = new MyRunnable();
Thread thread1 = new Thread(r);
Thread thread2 = new Thread(r);
thread1.start();
thread2.start();

try {
    thread1.join();
    thread2.join();
    } catch (InterruptedException ie) {
        System.out.println("\nThe following error occurred: " + ie);
        }
    }

我想我的问题是双重的——我的方法对于手头的问题是否正确?如果是这样,(如果不是),为什么一个线程总是抓住锁并完成所有工作?我已经在 20x20 矩阵上检查了最多 6 个线程的程序,并且总是只有一个线程在做这项工作。

4

5 回答 5

5

正如一些评论所建议的那样,问题出在锁定(即synchronized(this)部分)上。在您的情况下,同步是在this, 的单个实例上完成的MyRunnable,因此当一个线程在synchronized块内完成工作时,所有其他线程将等待工作完成。如此有效,一次只有一个线程在做真正的工作。

这是解决问题的方法。由于您需要您的线程在不同的行上并行工作,因此这项工作不能通过锁同步(因为锁定意味着相反:一次只有一个线程可以完成工作)。您需要同步的是每个线程决定它将在哪一行工作的部分。

这是一个示例伪代码:

public void run(){
  int workRow;
  synchronized(this){
    workRow = findNextUnprosessedRow();
  }
  for(int i=0; i<matrix[workRow].length; i++){
    //do the work
  }
}

请注意,由于上述原因,故意不同步实际工作。

您使用线程的方式是正确的,因此没有问题,但是,我建议您查看 Java 的并发 API:线程池。以下是如何在您的上下文中使用它的示例:

//Creates a pool of 5 concurrent thread workers
ExecutorService es = Executores.newFixedThreadPool(5);

//List of results for each row computation task
List<Future<Void>> results = new ArrayList<Future<Void>>();
try{
  for(int row=0; row<matrix.length; row++){
    final int workRow = row;

    //The main part. You can submit Callable or Runnable
    // tasks to the ExecutorService, and it will run them
    // for you in the number of threads you have allocated.
    // If you put more than 5 tasks, they will just patiently
    // wait for a task to finish and release a thread, then run.
    Future<Void> task = es.submit(new Callable<Void>(){
      @Override
      public Void call(){
        for(int col=0; col<matrix[workRow].length; col++){
          //do something for each column of workRow
        }
        return null;
      }
    });
    //Store the work task in the list.
    results.add(task);
  }
}finally{
  //Make sure thread-pool is shutdown and all worker
  //threads are released. 
  es.shutdown();
}

for(Future<Void> task : results){
  try{
    //This will wait for threads to finish. 
    // i.e. same as Thread.join()
    task.get();
  }catch(ExecutionException e){
    //One of the tasks threw an exception!
    throw new RuntimeException(e);
  }
}

这种方法更简洁,因为工作分配是在主线程(外部 for 循环)完成的,因此不需要同步它。

使用线程池时,您还可以获得一些好处:

  • 它很好地处理了每个线程计算期间的任何异常。在使用裸线程时,就像在您的方法中一样,很容易“丢失”异常。

  • 线程被池化。也就是说,它们会自动重用,因此您无需担心产生新线程的成本。这在您的情况下特别有用,因为您需要在矩阵中的每行生成一个线程,我怀疑这可能相当大。

  • 提交的任务ExecutorService被包装在一个有用的Future<Result>对象中,这在每个计算任务实际返回某种结果时最有用。在您的情况下,如果您需要对矩阵中的所有值求和,则每个计算任务都可以返回该行的总和。然后你只需要总结这些。

有点长,但希望它能解决一些问题。

于 2012-05-05T06:43:57.877 回答
4

您的问题是您将整个区域与synchronized(this). 这意味着一次只允许一个线程进入循环进行计算。当然,这可能意味着多个线程可以计算不同的部分,但不能同时计算多个线程。这也意味着您的“并行”解决方案并不比一个线程快。

如果您想并行进行计算,请查看Java 6 中的并行矩阵乘法和 Java 中的Fork Join 矩阵乘法,它们应该涵盖该主题

于 2012-05-05T06:09:53.047 回答
2

线程调度取决于特定的 VM 实现。在某些实现中,线程将继续运行,直到它以某种方式阻塞或被更高优先级的线程抢占。在您的情况下,所有线程都具有相同的优先级,因此进入synchronized块的第一个线程永远不会阻塞,它不会被抢占。一些调度程序实现了优先级老化,这样一个饥饿的线程最终会增加优先级,但你可能没有运行足够长的时间来产生效果。

Thread.yield()在块结束后添加一个调用synchronized。这告诉调度程序选择一个新线程来运行(可能是同一个,但可能是不同的)。

于 2012-05-05T06:12:54.417 回答
1

您的 run 函数具有第一个获取锁的线程,该线程在仍拥有锁的同时连续完成所有工作。对于下一行,也许另一个线程会获得锁,但它会阻塞所有其他线程,直到它完成。

我要做的是拥有一个与行数相同的布尔数组,并使用它们来声明处理每一行的任务。这将类似于以下伪代码:

//before creating the threads, pre-fill BoolList with trues
function run()
{
  while (true)
  {
    lock(BoolList)
    {
      //find first true value and set it to false
      //if no true found, return
    }
    //do the actual math of multiplying the row we claimed above
  }
}

还要记住,创建一个新线程的开销是足够的,多线程这个程序只对大型矩阵是值得的。

于 2012-05-05T06:04:17.933 回答
1

正如mru在他的评论中已经说过的那样,您的问题是所有行计算都是在“同步(此)”块内执行的。因此,所有线程都将等待一行处理完毕,然后再开始下一行,并且始终获取锁的同一线程可能是优化的结果,因为您几乎是单线程进行计算的。您可能会考虑只决定在同步块内处理哪一行:

int rowToProcess;
synchronized (this) {
    if (i < number of columns in final matrix){
        rowToProcess = i;
        i++;
        }
    else
        return;
    }
于 2012-05-05T06:16:06.943 回答