c# - 如何使用 MSpec 有效地测试固定长度的平面文件解析器？

Question

我有这个方法签名：List<ITMData> Parse(string[] lines)

ITMData拥有 35 个属性。

您将如何有效地测试这样的解析器？

问题：

我应该加载整个文件（我可以使用 System.IO）吗？
我应该将文件中的一行放入字符串常量中吗？
我应该测试一条或多条线
我应该测试 ITMData 的每个属性还是应该测试整个对象？
我的测试命名如何？

编辑

我将方法签名更改为 ITMData Parse(string line).

测试代码：

[Subject(typeof(ITMFileParser))]
public class When_parsing_from_index_59_to_79
{
    private const string Line = ".........";
    private static ITMFileParser _parser;
    private static ITMData _data;

    private Establish context = () => { _parser = new ITMFileParser(); };

    private Because of = () => { _data = _parser.Parse(Line); };

    private It should_get_fldName = () => _data.FldName.ShouldBeEqualIgnoringCase("HUMMELDUMM");
}

编辑 2

我仍然不确定是否应该只测试每个类的一个属性。在我看来，这让我可以为规范提供更多信息，即当我解析从索引 59 到索引 79 的单行时，我得到了 fldName。如果我测试一个类中的所有属性，我会丢失此信息。我是否过度指定了我的测试？

我的测试现在看起来像这样：

[Subject(typeof(ITMFileParser))]
public class When_parsing_single_line_from_ITM_file
{
    const string Line = ""

    static ITMFileParser _parser;
    static ITMData _data;

    Establish context = () => { _parser = new ITMFileParser(); };

    private Because of = () => { _data = _parser.Parse(Line); };

    It should_get_fld??? = () => _data.Fld???.ShouldEqual(???);
    It should_get_fld??? = () => _data.Fld???.ShouldEqual(???);
    It should_get_fld??? = () => _data.Fld???.ShouldEqual(???);
    It should_get_fld??? = () => _data.Fld???.ShouldEqual(???);
    It should_get_fld??? = () => _data.Fld???.ShouldEqual(???);
    It should_get_fld??? = () => _data.Fld???.ShouldEqual(???);
    It should_get_fld??? = () => _data.Fld???.ShouldEqual(???);
    ...

}

score 4 · Accepted Answer

我应该加载整个文件（我可以使用 System.IO）吗？

如果你这样做，它就不再是一个单元测试——它变成了一个集成或回归测试。如果您希望它显示单元测试不会显示的可能错误，您可以这样做。但这不太可能。

至少在开始时，您可能最好使用单元测试。

我应该将文件中的一行放入字符串常量中吗？

如果您打算编写多个使用相同输入行的测试，那么当然可以。但就个人而言，我可能倾向于编写一堆不同的测试，每个测试都传递不同的输入字符串。那时，没有太多理由制作一个常量（除非它是一个局部常量，在测试方法中声明）。

我应该测试一条或多条线吗？

您没有指定，但我将假设您的输出与您的输入是一对一的——也就是说，如果您传入三个字符串，您将ITMData返回三个 s。在这种情况下，对多线测试的需求将受到限制。

几乎总是值得测试退化的情况，在这种情况下它将是一个空字符串数组（零行）。并且可能值得至少进行一次包含多行的测试，这样您就可以确保迭代中没有愚蠢的错误。

但是，如果您的输出与输入是一对一的，那么您确实有另一种方法想要退出——您应该有一种ParseSingleLine方法。那么你Parse只不过是迭代行和调用ParseSingleLine. 您仍然需要对 Parse 进行少量测试，但您的大部分测试将集中在ParseSingleLine.

score 2 · Accepted Answer

如果我遇到这样的问题，我通常会这样做：

提前一个简短的免责声明：我认为我会更多地走“集成测试”或“作为一个整体测试解析器”的路线，而不是测试单独的行。在过去，我不止一次遇到过很多实现细节泄漏到我的测试中的情况，当我更改实现细节时，我不得不经常更改测试。我猜是过度规范的典型案例；-/

我不会在解析器中包含文件加载。正如@mquander 建议的那样，我宁愿使用 TextReader 或 IEnumerable 作为输入参数。这将导致更快的测试，因为您可以在内存中指定解析器输入并且不必接触文件系统。
我不是手动滚动测试数据的忠实拥护者，因此在大多数情况下，我使用嵌入式资源和 ResourceManager 通过 assembly.GetManifestResource() 直接从规范程序集中加载测试数据。我的解决方案中通常有一堆扩展方法来简化资源的读取（例如 TextReader TextResource.Load("NAME_OF_SOME_RESOURCE")）。
关于 MSpec：我使用每个文件一个类来解析。对于在解析结果中测试的每个属性，我都有一个单独的 (It) 断言。这些通常是一个衬里，因此额外的编码量并不大。在文档和诊断方面，恕我直言，这是一个巨大的优势，因为当没有正确解析属性时，您可以直接看到哪个断言失败，而无需查看源代码或搜索行号。它也出现在您的 MSpec 结果文件中。此外，您不会隐藏其他失败的断言（您修复一个断言只是为了看到规范在下一行与下一个断言失败的情况）。这当然会迫使您更多地考虑您在规范中使用的措辞，但对我来说，这也是一个巨大的优势，因为我马是语言形成思维的观点的支持者。换句话说，如果您不知道如何为您的断言命名，那么您的规范或实现可能有些可疑。
关于解析器的方法签名：我不会返回像 List<T> 或数组这样的具体类型，我也建议不要返回可变的 List<T> 类型。你在这里基本上说的是：“嘿，我完成后你可以乱搞解析结果”，这在大多数情况下可能是你不想要的。我建议改为返回 IEnumerable<T> （或 ICollection<T> 如果您以后真的需要修改它）

score 1 · Accepted Answer

我通常会尝试考虑常见的成功和失败场景，以及边缘情况。需求也有助于设置适当的用例。考虑使用Pex枚举各种场景。

score 0 · Accepted Answer

关于您的新问题：

我应该测试 ITMData 的每个属性还是应该测试整个对象？

如果您想安全起见，您可能应该至少有一个测试来检查每个属性是否匹配。

我的测试命名如何？

关于这个话题有很多讨论，比如这个。一般规则是您的单元测试类中有多个方法，每个方法都旨在测试特定的东西。在你的情况下，它可能是这样的：

public void Check_All_Properties_Parsed_Correctly(){.....}

public void Exception_Thrown_If_Lines_Is_Null(){.....}

public void Exception_Thrown_If_Lines_Is_Wrong_Length(){.....}

因此，换句话说，测试您认为解析器“正确”的确切行为。完成此操作后，您在更改解析器代码时会感到更加轻松，因为您将拥有一个全面的测试套件来检查您没有破坏任何东西。记住要经常进行实际测试，并在进行更改时保持测试更新！MSDN上有一个关于单元测试和测试驱动开发的相当好的指南。

一般来说，我认为您可以通过谷歌搜索找到大多数问题的答案。还有几本关于测试驱动开发的优秀书籍，它们不仅会带您了解TDD 的原理，还可以带您了解为什么。如果您相对编程语言不可知论者，我会推荐 Kent Beck 的Test-Driven Development By Example，否则类似Microsoft .NET 中的 Test-Driven Development。这些应该会让你很快走上正确的轨道。

编辑：

我是否过度指定了我的测试？

在我看来，是的。具体来说，我不同意你的下一行：

如果我测试一个类中的所有属性，我会丢失此信息。

您究竟以何种方式丢失信息？假设有两种方法可以进行此测试，除了每个测试都有一个新类：

每个属性都有不同的方法。您的测试方法可以称为CheckPropertyX、CheckPropertyY等。当您运行测试时，您将准确看到哪些字段通过了，哪些字段失败了。这显然满足了您的要求，尽管我会说这仍然是矫枉过正。我会选择选项2：
有几种不同的方法，每种方法都测试一个特定的方面。这是我最初推荐的，我想你指的是什么。当其中一个测试失败时，您只会获得有关每个方法失败的第一件事的信息，但是如果您很好地编写了 Assert 代码，您将确切地知道哪个属性不正确。考虑以下代码：

Assert.AreEqual("test1", myObject.PropertyX, "Property X was incorrectly parsed"); Assert.AreEqual("test2", myObject.PropertyY, "Property Y was incorrectly parsed");

当其中一个失败时，您将知道哪条线失败了。修复相关错误并重新运行测试后，您将查看是否有任何其他属性失败。这通常是大多数人采用的方法，因为为每个属性创建一个类甚至方法会导致代码过多，并且需要进行太多工作来保持最新状态。

c# - 如何使用 MSpec 有效地测试固定长度的平面文件解析器？

4 回答 4

Related

Reference