我有以下按顺序调用的方法:
- 私有 StringBuilder ReadPDF();
- 私有 StringBuilder CleanText(StringBuilder sb);
- 私人无效 ParseText();
ParseText 调用 ReadPDF 调用 CleanText;
我正在解析的 PDF 有 15MB 的文本,使用普通的 core 2 duo 计算机从文件中提取所有数据需要 10 分钟。
如何并行化这些任务?
编辑:澄清一下,阅读 PDF 需要很少的时间,问题在于解析提取的文本,更具体地说是在 CleanText 阶段。我需要并行化的原因是清理单个页面是即时的,但是清理 2k+ 个页面需要很长时间。