我有一个场景,其中员工记录写在平面文件中,例如:
flatFile.txt
============
1|name1|dept1|10000
2|name2|dept2|12000
3|name3|dept3|9500
....
....
现在我想每次都读取这个平面文件并将上面的员工记录转换成一些新的 xml 文件,所以最后我应该有以下数据的 xml 文件:
<EMPLOYEES>
<EMPLOYEE>
<ID>1</ID>
<NAME>name1</NAME>
<DEPARTMENT>dept1</DEPARTMENT>
<SALARY>10000</SALARY>
</EMPLOYEE>
<EMPLOYEE>
<ID>2</ID>
<NAME>name2</NAME>
<DEPARTMENT>dept2</DEPARTMENT>
<SALARY>12000</SALARY>
</EMPLOYEE>
...
...
</EMPLOYEES>
现在要实现这个概念,我需要处理数据的验证,例如:
- 身份证和工资应该是数字
- 名称长度应小于 20
- 平面文件的单行应包含以上 4 个字段
如果任何验证失败,则需要将它们与错误行号一起反映在 xml 文件中,例如:
<NAME type="Error" Line="2"></NAME> (name length is greater than 20 in 2nd record of a flat file)
或者
<EMPLOYEE type="Error" Line="1"></EMPLOYEE> (first record doesn't contains enough fields)
现在应用程序需要以这样一种方式设计,即组件可以插入替代品。例如,应该可以将用于基于分隔符解析输入文件的解析器替换为另一个将其解析为固定长度的解析器。
所以不知何故,我将不得不以分层的方式设计这个概念,比如
Parsing -> Validation -> Output Generation.
现在为了实现这个概念,我给出了一个想法,如下:
- 使用 BufferedReader 从文件中读取所有记录并使用 StringTokenizer 对其进行标记。
- 为每条记录初始化员工对象并将它们添加到某个集合(列表)中。
- 将错误(字段不匹配或任何其他验证失败)保留到 Map>。
- 使用一些 XML Builder API 将列表写入或编组到 xml 中(不清楚哪个是最好的)。
谁能给我更好的建议或任何提示来实现实施?