5

我试图了解代码分析器(在本例中为Drone Profiler)如何运行 .NET 应用程序与直接运行它不同。我需要知道这一点的原因是因为我的开发计算机的 .NET 安装存在一个非常奇怪的问题/损坏,它在分析器之外表现出来,但非常奇怪的是不在内部,如果我能理解为什么我可以修复我的计算机的问题。

这个问题似乎只影响对 System.Net.NetworkInformation 方法的调用(并且仅在 .NET 3.5 到 2.0 中,如果我针对 4 构建一些东西,一切都很好)。我构建了一个小测试应用程序,它只做一件事,它调用 System.Net.NetworkInformation.IsNetworkAvailable()。在探查器之外,我在 System.dll 中出现“致命的执行引擎错误”,这就是它提供的所有信息。据我了解,错误通常是由本机方法调用引起的,这可能发生在 System.dll 让某些本机 DLL 执行 IsNetworkAvailable() 逻辑时。

  • 我尝试使用Process Monitor找出探查器的内部和外部差异,记录两种情况的事件并进行比较。在调用 iphlpapi.dll 和 winnsi.dll 之后以及在名为 dnsapi.dll 的分析器运行代码和非分析器代码开始加载崩溃报告相关内容之前,这两个日志都是相同的。在那一刻,当它似乎出错时,探查器运行代码创建了 4-6 个新线程,而非探查器(崩溃)代码只创建了 1 或 2 个。我不知道这意味着什么,如果有的话。

可以说是不必要的背景

我的 Windows 7 包括 .NET 安装(3.5 到 2.0)一直运行良好,直到我的硬盘驱动器出现一些损坏并且 checkdisk 开始发现坏集群。我将驱动器映像到了一个新的驱动器上,除了 .NET 的这个问题外,一切正常。

我需要重新安装 Windows 或恢复到映像备份来解决此问题。

以下是我调查过的一些事情:

  • 我对磁盘故障前后似乎最相关的文件/目录(Windows 和程序文件下的 .NET 内容)进行了比较,并且没有看到我没有预料到的任何变化(没有明显的文件损坏)。
  • 我已经区分了软件和系统注册表配置单元前后的磁盘故障,并且没有看到任何似乎相关的变化。
  • 我创建了一个新用户帐户并清理了所有环境变量,以防环境相关。没变。
  • 我做了“sfc /scannow”,它没有发现完整性问题。
  • 我尝试“ngen update”来重新生成预编译代码,以防我错过了可能被损坏的东西并且没有任何改变。
  • 我删除了我的病毒扫描程序,看看它是否有干扰,没有区别。
  • 我尝试在安全模式下运行测试代码,同样的崩溃问题。

我假设我需要修复我的 .NET 安装,但由于 Windows 7 包含 .NET 3.5 - 2.0,您不能只重新运行 .NET 安装程序来重做它。我无权访问 Windows 磁盘来尝试自行重新安装 Windows(计算机有恢复分区,但无法使用);该驱动器还使用全盘加密解决方案,重新安装会很困难。

我绝对不想在这里从头开始安装新的 Windows,重新安装数十个软件包,尝试记住数十个与开发相关的自定义/等等。

鉴于这一切......有人有任何有用的建议吗?作为一名开发人员,我需要 .NET 3.5 - 2.0 工作,并且需要针对它进行构建和测试。

谢谢!

昆西

4

2 回答 2

1

简短的回答是我的 System.ni.dll 文件已损坏,我更换了它,一切都很好。

长答案可能会通过其解决方案的方法来帮助其他人......

我的问题与 .Net 相关的损坏方式导致应用程序无法运行,除非通过探查器。我下载了SlimTune 开源分析器的源代码,在本地构建它,并在调用 Process.Start() 之前设置了一个断点。然后,我比较了通过分析器与手动成功启动应用程序所涉及的所有参数。我发现的唯一有意义的区别是在环境变量中添加了 .NET 配置文件参数:

  • cor_enable_profiling=1
  • cor_profiler={38A7EA35-B221-425a-AD07-D058C581611D}

然后我尝试在我自己的用户环境中设置这些,瞧!现在我手动运行的任何应用程序都可以工作。(我实际上在几个小时前尝试过做同样的事情,但我使用了一个包含在示例中的 GUID,它没有指向真正的分析器,显然 .NET 知道我给了它一个虚假的 GUID,并且没有在分析模式下运行。)

我现在回去开始阅读有关 CLR 如何执行 PE 文件的内容,希望弄清楚为什么我的应用程序在启用分析的情况下运行很重要。我学到了很多东西,但似乎没有什么适用的。

然而,我确实记得我应该重新检查 chkdsk 日志,我一直在列出因驱动器故障而损坏的文件。失败后,我将所有列出的文件 id 转换为文件路径/名称,并且我已经替换了所有 100 多个文件,我可以从备份中找到,但当我现在回去查看时,我发现了一个注释,虽然我已经替换了 4 个或5 .NET 相关文件成功有一个这样的文件我无法替换,因为它正在“使用中”。那个文件?System.ni.dll!!!我现在能够从备份中替换这个文件,瞧我的 .NET 安装恢复正常,无论是否配置文件,应用程序都能正常工作。

令人沮丧的是,当这个事件第一次发生时,我完全认为问题与损坏的文件有关,特别是与一个名为 System.dll 的文件有关,该文件包含失败的方法。所以我对所有名为 System.dll 的文件进行了比较和重新比较。但当时我没有意识到 System.ni.dll 是 System.dll(或类似的)的本地编译表现。而且因为我已经对 .NET 相关目录进行了比较和重新比较,但没有注意到这一点(不知道我是怎么错过的),所以我放弃了这种方法。

无论如何...长话短说,这是一个损坏的 System.ni.dll 导致了我的问题,其中一个或多个集群的内容被替换为 0x0 并且它恰好表现为我观察到的奇怪问题。

于 2012-08-25T02:37:12.457 回答
0

这听起来像是一个时间问题,分析器通过让它变慢一点来“修复”它。

许多分析器使用检测(更多信息在这里),这会稍微减慢应用程序的速度。显然,它减慢了一个线程的速度,以至于另一个线程可以做更多的工作,从而防止了崩溃。此类错误通常不会直接在开发人员的机器上表现出来,而是一旦在具有更多内核或超线程的处理器上运行时就会出现。有时它们只出现在发布版本中(反之亦然在调试版本中)。时序问题可能很难追踪,因为相同的代码在不同的条件下(在分析器或调试器中)可能会给出不同的结果。

根据您的描述,我将尝试对如何修复它进行疯狂猜测:

尝试在启动新线程的源中查找。然后在它们生成后添加System.Threading.Thread.Sleep(500);一行来暂停主线程并给新线程一些时间来启动。

如果没有源代码和一些崩溃的堆栈跟踪,这是相当多的猜测。

于 2012-08-23T22:22:04.197 回答