6

在这样一个相当简单的情况下,我希望iter()人造丝 par_iter()替换一个,但我没有这样做。

之前的代码:

indexes_to_increment
    .iter()
    .for_each(|x| self.some_data[*x as usize] += 1);`

这是人造丝修改的代码:

extern crate rayon;
use rayon::prelude::*;

fn main() {
    let mut a = SomeStruct::new(vec![1, 0, 0, 1]);
    a.add_factor_indexes(&vec![1, 2]);
    println!("{:?}", a); // spits out "SomeStruct { some_data: [1, 1, 1, 1] }"
}

#[derive(Debug)]
struct SomeStruct {
    some_data: Vec<u8>,
}

impl SomeStruct {
    fn new(some_data: Vec<u8>) -> SomeStruct {
        SomeStruct { some_data }
    }
    fn add_factor_indexes(&mut self, indexes_to_increment: &[u8]) {
        //indexes_to_increment.iter().for_each(|x| self.some_data[*x as usize] += 1);
        indexes_to_increment
            .par_iter()
            .for_each(|x| self.some_data[*x as usize] += 1);
    }
}

操场

虽然我知道以下错误消息告诉我该怎么做,但此时我无法这样做。

error[E0387]: cannot borrow data mutably in a captured outer variable in an `Fn` closure
  --> src/main.rs:23:27
   |
23 |             .for_each(|x| self.some_data[*x as usize] += 1);
   |                           ^^^^^^^^^^^^^^
   |
help: consider changing this closure to take self by mutable reference
  --> src/main.rs:23:23
   |
23 |             .for_each(|x| self.some_data[*x as usize] += 1);
   |                       ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^

如果我知道indexes_to_increment向量 inadd_factor_indexes只包含唯一u8的 s 并且可以用一个集合替换,那会改变什么吗?

4

2 回答 2

8

此错误消息正是Rust 旨在为您提供的错误预防类型的示例。换句话说,编译器会阻止您同时可变地访问同一块内存。

从概念上讲,您尝试运行的代码应该是安全的,因为您总是访问完全不相交的向量片段,不会有任何重叠的相同索引的可变借用,但编译器无法判断。它所看到的只是self.some_data多次可变借用;它不知道闭包的实现是Index做什么的或闭包的主体是做什么的。

可以在向量中找到所有匹配的插槽,然后遍历所有结果:

fn add_factor_indexes(&mut self, indexes_to_increment: &[u8]) {
    self.some_data
        .par_iter_mut()
        .enumerate()
        .filter(|&(i, _)| indexes_to_increment.contains(&(i as u8)))
        .map(|(_, v)| v)
        .for_each(|x| *x += 1);
}

并且可以替换为一组

如果它是大量数据,我会推荐它,因为它需要重复查找。

于 2017-10-26T03:07:18.437 回答
2

当线程不共享非常量数据时,Rayon 效果最好。例如,如果每个闭包传递到par_iter只对自己的数据块进行操作,并且在最后一步将它们重新组合在一起,Rayon 不会抱怨。(谷歌 MapReduce 是这种策略的一个流行示例,可以很好地扩展到云系统。)

除了 Shepmaster 提出的解决方案之外,修复代码的一种直接方法是从 切换Vec<u8>Vec<AtomicUsize>,并使用该fetch_add方法来增加索引。由于fetch_add接受了共享参考,Rayon 将接受它,它会做你想做的事。

extern crate rayon;
use rayon::prelude::*;
use std::sync::atomic::{AtomicUsize, Ordering};

fn main() {
    let mut a = SomeStruct::new([1, 0, 0, 1].iter()
        .map(|n| AtomicUsize::new(*n as usize)).collect());
    a.add_factor_indexes(&vec![1, 2]);
    println!("{:?}", a);
}

#[derive(Debug)]
struct SomeStruct {
    some_data: Vec<AtomicUsize>,
}

impl SomeStruct {
    fn new(some_data: Vec<AtomicUsize>) -> SomeStruct {
        SomeStruct { some_data }
    }
    fn add_factor_indexes(&mut self, indexes_to_increment: &[u8]) {
        indexes_to_increment
            .par_iter()
            .for_each(|x| {
                self.some_data[*x as usize].fetch_add(1, Ordering::SeqCst);
            });
    }
}
于 2017-10-28T16:19:44.490 回答