这是我的场景。用户在我的软件中选择了一个文档,我的软件从文档中提取了一些关键数据。该软件处理两种格式;PDF 和 DOCX。对于这些类型中的每一种,都有几个模板,上传的文档应该属于这些模板之一。我不知道这是否是一个众所周知的问题,以及是否存在解决这种情况的既定设计模式(这就是我在 SO 上的原因)。这是我到目前为止设计的:
由于每个模板都有特定的结构/内容,我正在考虑为每个模板创建单独的类。将有一个名为 IExtractor 的顶级接口,然后将有两个名为 PdfExtractor 和 DocxExtractor 的顶级类,每个类都实现 IExtractor 接口。所有 PDF(或 DOCX)模板共有的任何功能都将进入这些父类。
在这两个父类下面,会有几个模板类,每个模板一个。例如,一个名为 Template571_PdfExtractor 的类继承自 PdfExtractor,具有特定于模板 571 的方法,但提供的结果与任何其他提取器相同。
如果这很重要,我正在使用 C# 4.0。这是骨架:
界面:
interface IExtractor
{
void ExtractDocument(System.IO.FileInfo document, dsExtract dsToFill);
}
两个父类:
public class DocxExtractor : IExtractor
{
public virtual void ExtractDocument(System.IO.FileInfo document, dsExtract dsToFill)
{
}
}
public class PdfExtractor : IExtractor
{
public virtual void ExtractDocument(System.IO.FileInfo document, dsExtract dsToFill)
{
}
}
具体类之一:
public class Template571_PdfExtractor : PdfExtractor
{
public virtual void ExtractDocument(System.IO.FileInfo document, dsExtract dsToFill)
{
}
}
现在有几个关键问题我不确定。所有这些都围绕着我不知道如何以及在哪里实例化具体(模板)类的对象的问题。我可以使用文件扩展名来决定是否需要进入 PdfExtractor 树节点或 DocxExtractor 节点。之后,是文件的内容告诉我用户文档所属的模板。那么我把这个“决定”代码放在哪里呢?我的想法是将它放在 PdfExtractor 类(或 DocxExtractor )中。这是正确的方法吗?
对不起,我有点长,但我不知道如何完全描述我的情况。谢谢你的想法。
舒贾特