我有一个巨大的文件(仅包含 ascii 字符),我需要找到最常出现的字符。
我的方法:
- 拆分文件并将其分发到多个处理节点。
- 每个节点将对字符进行计数并生成字符计数数组[256]。
- 父节点将接收所有节点的所有计数数组并计算出现频率最高的字符。
但我想知道节点是否需要传输整个计数数组来计算最常见的字符?有没有办法减少节点之间传输的处理数据量。
注意:我是分布式编程的新手,因此尝试熟悉基本技术。
我有一个巨大的文件(仅包含 ascii 字符),我需要找到最常出现的字符。
我的方法:
但我想知道节点是否需要传输整个计数数组来计算最常见的字符?有没有办法减少节点之间传输的处理数据量。
注意:我是分布式编程的新手,因此尝试熟悉基本技术。