C#将.spl剥离成.emf文件格式

本文转载自 星战紫辉 http://www.cppblog.com/rawdata/archive/2009/02/23/74653.htmlhtml

但C#代码实现为本人原创。https://github.com/SnailDev/SnailDev.EmfParser 欢迎star或forkgit

关键字: 打印 SPL EMF 文件格式github

Windows的假脱机打印会在Windows\System32\spool\PRINERS目录下生成.spl和.shd文件,其中的打印内容存贮在.spl文件中,可是.spl文件格式彷佛未公开,那么如何才能将未知的.spl文件剥离成.emf文件呢?网络

首先,让咱们了解一下Windows打印机制,这是微软的官网的一副打印流程图片:函数

其中ISV是应用软件接口,IHV是硬件接口,左边是XP的打印模型,右边是Vista最新的XPS打印模型,但二者能够互相转换,具备良好的兼容性。不过,这里暂时只关心XP系统的打印过程。线程

网络打印过程图:orm

可是这些图彷佛还不够详细,那么请看下面一副:(摘录于论文:《基于关键字匹配的打印数据截获系统》):htm

 

基本的思路是: 打印过程发生时,GDI模块和打印驱动(由打印机厂商提供)进行基本的数据交换,在假脱机设置环境下,生成打印机命令文件:.spl或.emf文件,做为一个打印池的做业,而后Windows后台打印线程处理打印做业,将数据文件送至打印机打印,打印完删除该打印文件。
好,如今回到正题:.spl文件该如何剥离成.emf呢?看一个例子:
在WinHex中打开一个.spl文件:
blog

参考:  http://www.undocprint.org/formats/winspool/spl 中一些打印结构的定义。
首先,.spl文件都是以0x00010000签名开头,而后一个DWORD 是emf相关区的文件偏移,第3个DWORD是文档描述字符串(UNICODE)的文件偏移,第4个DWORD 描述的是端口说明字符串(UNICODE)。大体结构以下:
接口

文件尾就是这个样子:

当定位到0x50的文件位置,读取2个DWORD数据以后,就是.emf文件开始了。.emf文件格式是公开的,并且很是简单,是一系列EMR_XXX开口结构的紧密排列,一般以EMR_HEADER(0x01)开头,以EMR_EOF(0x0E)结尾。其实咱们根本没有必要去解析.emf文件格式,Windows  SDK有专门显示.emf文件的API,3个函数就搞定:
                      HENHMETAFILE hEMF = GetEnhMetaFile("EMF_DumpOK.emf");
                      PlayEnhMetaFile (dc.m_hDC, hEMF, &rc) ; 
                      DeleteEnhMetaFile (hEMF) ;
而后.spl文件还有一些东西,如今尚未解析出来,可是.emf文件已经剥离出来了,后面的能够先不理它。

代码见本人github仓库 https://github.com/SnailDev/SnailDev.EmfParser