妈个火火 發表於 2021-4-12 07:17:00

如何从 dump 文件中提取出 C# 源代码?

<h2 id="一背景">一:背景</h2>
<p>相信有很多朋友在遇到应用程序各种奇葩问题后,拿下来一个dump文件,辛辛苦苦分析了大半天,终于在某一个线程的调用栈上找到了一个可疑的方法,但 windbg 常常是以 <code>汇编</code> 的方式显示方法代码的,可惜的是,现如今的汇编,有多少像我们这些速成系码农还看的懂呢? 😂😂😂</p>
<p>接下来尖锐的问题就来了,如何将这些汇编代码转成 C# 源代码,如果转不成源代码转成 IL代码也好呀,起码我努努力还是能试着看的懂的。。。</p>
<p>本篇我就来分享下如何把 dump 中的方法源码提取出来。</p>
<h2 id="二-从-dump-文件中提取源代码">二: 从 dump 文件中提取源代码</h2>
<h3 id="1-案例演示">1. 案例演示</h3>
<p>为了能够演示方便,我用 .netcore 3.1写了一个简单的demo,代码如下:</p>
<pre><code class="language-C#">
namespace ConsoleApp6
{
    class Program
    {
      static void Main(string[] args)
      {
            Run();
      }

      static void Run()
      {
            Console.WriteLine("hello world!");
            Console.ReadLine();
      }
    }
}

</code></pre>
<p>将程序跑起来后,使用 <code>任务管理器</code>, <code>adplus</code>, <code>procdump</code> 随便哪一个抓取 dump 都可以。</p>
<h3 id="2-使用-lm--savemodule-命令提取">2. 使用 lm + savemodule 命令提取</h3>
<p>如果你的程序足够简单,可以直接用 lm 获取程序中所有的模块,然后使用 savemodule 将模块导出为 <code>exe/dll</code> 物理文件,如下所示:</p>
<ul>
<li>使用 lm 提取出所有模块</li>
</ul>
<pre><code class="language-C#">
0:000&gt; lm
start             end               module name
000002c2`264b0000 000002c2`264b8000   ConsoleApp6_2c2264b0000   (deferred)            
00007ff7`e4a50000 00007ff7`e4a7f000   ConsoleApp6   (deferred)            
00007ffa`a4b50000 00007ffa`a546d000   System_Private_CoreLib   (deferred)            
00007ffa`a5470000 00007ffa`a59df000   coreclr    (deferred)            
00007ffa`df070000 00007ffa`df1b2000   clrjit   (deferred)            
...

</code></pre>
<p>可以隐约的看到,我有一个名为 <code>ConsoleApp6_2c2264b0000</code> 的模块,这就是我要提取的 <code>ConsoleApp6.exe</code>,顺便提一下,那个很碍眼的 <code>ConsoleApp6   (deferred)</code> 是 PE 文件,要问我怎么知道的? 试一下就好啦😁</p>
<ul>
<li>使用 savemodule 提取</li>
</ul>
<p>从上面第一行 start 列中可以看到 ConsoleApp6_2c2264b0000 的开始地址为 <code>000002c2264b0000</code>,接下来用 savemodule 导出到 <code>E:\dump</code>。</p>
<pre><code class="language-C#">
0:000&gt; !savemodule 000002c2`264b0000 E:\dump\ConsoleApp6.exe
3 sections in file
section 0 - VA=2000, VASize=6c4, FileAddr=200, FileSize=800
section 1 - VA=4000, VASize=564, FileAddr=a00, FileSize=600
section 2 - VA=6000, VASize=c, FileAddr=1000, FileSize=200

</code></pre>
<p>然后就可以看到 <code>E:\dump</code> 里面多了一个 ConsoleApp6.exe 🐂,有了这玩意看源码就简单多了,直接用 ILSpy 对其进行反编译即可。</p>
<p><img src="https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/c9745e52062f46dabb8c5552481d6ce7~tplv-k3u1fbpfcp-zoom-1.image" alt="" loading="lazy"></p>
<h3 id="3-使用-dumpdomainmodule--savemodule-提取">3. 使用 dumpdomain/module + savemodule 提取</h3>
<p>实际开发中有可能你的程序非常复杂,使用 lm 直接提取模块是找不到的,最好的办法就是 <code>按图索骥</code> 的方式寻找你要的 module,还记得 <code>CLR Via C#</code> 上说过的 AppDomain,Assembly,Module 之间的关系吗?如果要详细了解,建议翻看一下,这里我大概简述一下, Assembly 一般包含若干个 <code>Module + 资源文件</code>, Assembly 就是一个 dll/exe 文件,程序跑起来后,Assembly是被妥善安置在 AppDomain 中的。</p>
<p>有了上面这个思想,是不是就可以通过这个流程 <code>AppDomain -&gt; Assembly -&gt; Module</code> 找到 module 啦? 接下来看看如何去实现。</p>
<ul>
<li>使用 !dumpdomain 找到 ConsoleApp6 所在的程序域</li>
</ul>
<pre><code class="language-C#">
0:000&gt; !dumpdomain
--------------------------------------
System Domain:      00007ffaa59996f0
LowFrequencyHeap:   00007FFAA5999C58
HighFrequencyHeap:00007FFAA5999CE8
StubHeap:         00007FFAA5999D78
Stage:            OPEN
Name:               None
--------------------------------------
Domain 1:         000002c224b6ca80
LowFrequencyHeap:   00007FFAA5999C58
HighFrequencyHeap:00007FFAA5999CE8
StubHeap:         00007FFAA5999D78
Stage:            OPEN
Name:               clrhost
Assembly:         000002c224bf1c00
ClassLoader:      000002C224B61820
Module
00007ffa45984020    C:\Program Files\dotnet\shared\Microsoft.NETCore.App\3.1.12\System.Private.CoreLib.dll

Assembly:         000002c224bf1980
ClassLoader:      000002C224BE3F80
Module
00007ffa45b5f7d0    E:\net5\ConsoleApp3\ConsoleApp6\bin\Debug\netcoreapp3.1\ConsoleApp6.dll


</code></pre>
<p>尴尬,记得不错的话,在 .NET Framework 中默认会有三个应用程序域。</p>
<ul>
<li>System Domain</li>
<li>Shared Domain</li>
<li>Domain 1</li>
</ul>
<p>咋到 .NET Core 上就丢了一个 <code>Shard Domain</code> 呢 😄😄😄,先不管啦,从图中可以清楚的看到 Domian 1 上有我的dll <code>E:\net5\ConsoleApp3\ConsoleApp6\bin\Debug\netcoreapp3.1\ConsoleApp6.dll</code>,同时还有一个 module 的地址 <code>00007ffa45b5f7d0</code>。</p>
<ul>
<li>使用 !dumpmodule 获取 module 详细信息</li>
</ul>
<pre><code class="language-C#">
0:000&gt; !DumpModule /d 00007ffa45b5f7d0
Name: E:\net5\ConsoleApp3\ConsoleApp6\bin\Debug\netcoreapp3.1\ConsoleApp6.dll
Attributes:            PEFile SupportsUpdateableMethods
Assembly:                000002c224bf1980
BaseAddress:             000002C2264B0000
PEFile:                  000002C224BF2300
ModuleId:                00007FFA45B5FB98
ModuleIndex:             0000000000000001
LoaderHeap:            0000000000000000
TypeDefToMethodTableMap: 00007FFA45B3C8D0
TypeRefToMethodTableMap: 00007FFA45B3C8E8
MethodDefToDescMap:      00007FFA45B3C958
FieldDefToDescMap:       00007FFA45B3C978
MemberRefToDescMap:      0000000000000000
FileReferencesMap:       00007FFA45B3C988
AssemblyReferencesMap:   00007FFA45B3C990
MetaData start address:000002C2264B2078 (1304 bytes)

</code></pre>
<p>从上面的 <code>BaseAddress: 000002C2264B0000</code> 可以看出,module 的start 地址为 000002C2264B0000,是不是和刚才我用 lm 提取出来的地址一致哈,最后用 savemodule 导出一下就可以啦,为了做区分,我取名为 ConsoleApp7.exe, 如下所示:</p>
<pre><code class="language-C#">
0:000&gt; !savemodule 000002C2264B0000 E:\dump\ConsoleApp7.exe
3 sections in file
section 0 - VA=2000, VASize=6c4, FileAddr=200, FileSize=800
section 1 - VA=4000, VASize=564, FileAddr=a00, FileSize=600
section 2 - VA=6000, VASize=c, FileAddr=1000, FileSize=200

</code></pre>
<p><img src="https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/2bf46dd9fbd74bb5bea2cea7a340f86e~tplv-k3u1fbpfcp-zoom-1.image" alt="" loading="lazy"></p>
<p>哈哈,剩下来的就是用 ILSpy 反编译 CosoleApp7 啦。</p>
<p><img src="https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/fdbad634e316437c95e1de8feb0acc98~tplv-k3u1fbpfcp-zoom-1.image" alt="" loading="lazy"></p>
<p><strong>更多高质量干货:参见我的 GitHub: dotnetfly</strong></p>
<img src="https://images.cnblogs.com/cnblogs_com/huangxincheng/345039/o_210929020104最新消息优惠促销公众号关注二维码.jpg" width="700" height="300" alt="图片名称" align="center"><br><br>
来源:https://www.cnblogs.com/huangxincheng/p/14646383.html
頁: [1]
查看完整版本: 如何从 dump 文件中提取出 C# 源代码?