我正在尝试对包含;
分隔项的平面输入文件进行分区。一行中的第一项表示一个类别,我想对该类别进行分区,以便为每个类别创建一个分区,该分区将由专用线程处理。但我对如何在自定义中实现这种分区逻辑感到困惑Partitioner
。分区似乎发生在面向块的步骤之前,因此在读取,写入之前,所以看起来我需要逐行读取自定义分区程序中的文件,从行中获取类别字段并收集具有相同类别的行并创建ExecutionContext
对于这些集合中的每一个?
我在寻找正确的方向吗?有经验的人可以提供一个使用文件(可能是伪代码)的小例子吗?