Delphi的DirectShow开发概述
<p>第一部分:背景知识<br> <br>DirectShow是微软公司提供的一套在Windows平台上进行流媒体处理的开发包,与DirectX开发包一起发布。它经过DirectX 6.0中的DirectX Media发展而来,集成了DirectX家族中的其他成员(DirectDraw、DirectSound等),可以说是一位“集大成者”。 </p><p>DirectShow能做些什么? DirectShow为多媒体流的捕捉和回放提供了强有力的支持。运用DirectShow,可以很方便地从支持WDM驱动模型的采集卡上捕获数据,并且进行相应的后期处理乃至存储到文件中。它广泛地支持各种媒体格式,包括Asf、Mpeg、Avi、Dv、Mp3、Wave等等,使得多媒体数据的回放变得轻而易举。另外,DirectShow直接支持DVD的播放,视频的非线性编辑,以及与数字摄像机的数据交换。更值得一提的是,DirectShow提供的是一种开放式的开发环境,每个功能模块都采取COM组件方式,称为Filter,开发者也可以开发自己的功能Filter来扩展DirectShow的应用。按照功能来划分,Filter分为3类:Source Filter, Transform Filter, Rendering Filter。前者负责获取数据,数据源可以是文件、数字摄像机等,然后将数据往下传输;中间者负责数据的格式转换,比如数据流的分离与合成、编码解码等,然后把数据继续往下传输;后者负责数据的去向——给声卡、显卡进行播放或者输出到文件存储。<br> <br>第二部分核心技术<br> <br>DirectShow的开发实际就是Filter的开发,DirectShow自身提供了,下面就是Filter概述。<br> <br>1、DirectShow的 Filter<br>Filter 一般分为下面几种类型。</p>
<p> (1)源过滤器(source filter):源过滤器引入数据到过滤器图表中,数据来源可以是文件、网络、照相机等。不同的源过滤器处理不同类型的数据源。</p>
<p> (2)变换过滤器(transform filter):变换过滤器的工作是获取输入流,处理数据,并生成输出流。变换过滤器对数据的处理包括编解码、格式转换、压缩解压缩等。</p>
<p> (3)提交过滤器(renderer filter):提交过滤器在过滤器图表里处于最后一级,它们接收数据并把数据提交给外设。</p>
<p> (4)分割过滤器(splitter filter):分割过滤器把输入流分割成多个输出。例如,AVI分割过滤器把一个AVI格式的字节流分割成视频流和音频流。</p>
<p> (5)混合过滤器(mux filter):混合过滤器把多个输入组合成一个单独的数据流。例如,AVI混合过滤器把视频流和音频流合成一个AVI格式的字节流。</p>
<p> 过滤器的这些分类并不是绝对的,例如一个ASF读过滤器(ASF Reader filter)既是一个源过滤器又是一个分割过滤器。</p>
<p>2、关于Filter Graph Manager</p>
<p> Filter Graph Manager也是一个com对象,用来控制Filter graph中的所有的filter,主要有以下的功能:</p>
<p> 1) 用来协调filter之间的状态改变,从而使graph 中的所有的filter的状态的改变应该一致。</p>
<p> 2) 建立一个参考时钟。</p>
<p> 3) 将filter 的消息通知返回给应用程序</p>
<p> 4) 提供用来建立 filter graph的方法。</p>
<p> 简单描述,Graph就是各个Filter组成的一个流程图。<br> <br> SourceFilter----|-----SpliterFilter-------------(Video-pin)>-----TransFormFilter--->VideoRender<br> <br> |---------------------(Audio-pin)->----ACMWraperFilter--->DirectSoundFilter<br> <br>程序启动过程,先创建各个filter的com对象,然后使用FilterGraph.Addfilter加入到Graph中,然后把每个Filter按照<br> <br>数据流把OutPin和inpuin连接起来。最好启动FilterGraph.play即可。<br> </p>
<p> Directshow是基于模块化,每个功能模块都采取COM组件方式,称为Filter。Directshow提供了一系列的标准的模块可用于应用开发,开发者也可以开发自己的功能Filter来扩展Directshow的应用。下面我们用一个例子来说明如何采取Filter来播放一个AVI的视频文件。</p>
<p> 1) 首先从一个文件中读取AVI数据,形成字节流。(这个工作由源Filter完成)</p>
<p> 2) 检查AVI数据流的头格式,然后通过AVI分割Filter将视频流和音频流分开。</p>
<p> 3) 解码视频流,根据压缩格式的不同,选取不同的decoder filters 。</p>
<p> 4) 通过Renderer Filter重画视频图像。</p>
<p> 5) 音频流送到声卡进行播放,一般采用缺省的 DirectSound Device Filter。<br> <br> <br> <br>状态改变,Graph中的filter的状态改变应该一致,因此,应用程序并将状态改变的命令直接发给filter,而是将相应的状态改变的命令发送给Filter graph Manager,由manager将命令分发给graph中每一个filter。Seeking也是同样的方式工作,首先由应用程序将seek命令发送到filter graph 管理器,然后由其分发给每个filter。</p>
<p> 参考时钟,graph中的filter都采用的同一个时钟,称为参考时钟(reference clock),参考时钟可以确保所有的数据流同步,视频桢或者音频桢应该被提交的时间称为presentation time.presentation time 是相对于参考时钟来确定的。Filter graph Manager应该选择一个参考时钟,可以选择声卡上的时钟,也可以选择系统时钟。</p>
<p> Graph事件, Graph 管理器采用事件机制将graph中发生的事件通知给应用程序,这个机制类似于windows的消息循环机制。</p>
<p> Graph构建的方法,graph管理器给应用程序提供了将filter添加进graph的方法,连接filter的方法,断开filter连接的方法。</p>
<p> 但是,graph 管理器没有提供如何将数据从一个filter发送到另一个filter的方法,这个工作是由filter在内部通过pin来独立完成的。<br> <br>3、媒体类型</p>
<p> 因为Directshow是基于com组件的,就需要有一种方式来描述filter graph每一个点的数据格式,例如,我们还以播放AVI文件为例,数据以RIFF块的形式进入graph中,然后被分割成视频和音频流,视频流有一系列的压缩的视频桢组成,解压后,视频流由一系列的无压缩的位图组成,音频流也要走同样的步骤。<br> <br>媒体类型是一种很普遍的,可以扩展的用来描述数字媒体格式的方法,当两个filter连接的时候,他们会就采用某一种媒体类型达成一致的协议。媒体类型定义了处于源头的filter将要给下游的filter发送什么样的数据,以及数据的physical layout。如果两个filter不能够支持同一种的媒体类型,那么他们就没法连接起来。</p>
<p> 对于大多数的应用来说,也许你不用考虑媒体类型,但是,有些应用程序中,你会直接应用到媒体类型的。</p>
<p> 媒体类型是通过AM_MEDIA_TYPE结构定义的。<br> <br>Filters通过pin的连接来传递数据,数据流是从一个filter的输出pin流向相连的filter的输入pin。输出pin常用的传递数据的方式是调用输入pin上的IMemInputPin::Receive方法。<br> <br>对于filter来说,可以有好几种方式来分配媒体数据使用的内存块,可以在堆上分配,可以在DirectDraw的表面,也可以采用GDI共享内存,还有其他的一些方法,在Directshow中用来进行内存分配任务的是内存分配器(allocator),也是一个COM对象,暴露了一个IMemAllocator接口。</p>
<p> 当两个pin连接的时候,必须有一个pin提供一个allocator,Directshow定义了一系列函数调用用来确定由哪个pin提供allocator,以及buffer的数量和大小。</p>
<p> 在数据流开始之前,allocator会创建一个内存池(pool of buffer),在开始发送数据流以后,源filter就会将数据填充到内存池中一个空闲的buffer中,然后传递给下面的filter。但是,源filter并不是直接将内存buffer的指针直接传递给下游的filter,而是通过一个media samples的COM对象,这个sample是allocator创建的用来管理内存buffer。Media sample暴露了IMediaSample接口,一个sample包含了下面的内容:</p>
<p> 一个指向没有发送的内存的指针。</p>
<p> 一个时间戳</p>
<p> 一些标志</p>
<p> 媒体类型。</p>
<p> 时间戳表明了presentation time,Renderer filter就是根据这个时间来安排render顺序的。标志是用来标示数据是否中断等等,媒体类型提供了中途改变数据格式的一种方法,不过,一般sample没有媒体类型,表明它们的媒体类型一直没有改变。</p>
<p> 当一个filter正在使用buffer,它就会保持一个sample的引用计数,allocator通过sample的引用计数用来确定是否可以重新使用一个buffer。这样就防止了buffer的使用冲突,当所有的filter都释放了对sample的引用,sample才返回到allocator的内存池,供重新使用<br> <br>基于Delphi的DirectShow开发概述2<br> <br>MajorType:主要类型;例如视频,音频,还是位流<br>subType : 辅助说明类型,例如视频中的YUV12,还是UYVY等等<br>formatType: 格式描述,更为细节的结构体。例如,视频大小,频率,帧率等,<br> 可以使用FORMAT_VIDEOINFO(VIDEOINFOHEADER),FORMAT_WAVEFORMATEX(WAVEFORMATEX)结构体来描述<br>//PAMMediaType<br>当使用AM_MEDIA_TYPE数据结构来描述媒体类型的时候,如果MajorType,subType,formatType都指定了GUID,那么<br>这就是完全媒体类型。<br> <br>***************************************Filter的连接************************************<br> Filter的连接实际上就是Pin的连接。连接方向总是由上一级的Filter(UpStream Filter)的输出Pin指向下一级<br>Filter(DownStream Filter)的输入Pin。<br> <br>1.Filter连接过程<br> Pin也是一种COM接口。实现了IPIN的接口。一般通过调用(下面的函数来连接):<br> IFilterGraph.ConnectDirect,IGraphBuilder.Connect,IGraphBuilder.Render,IGraphBuilder.RenderFile<br> <br> { 下面就是个范例,一般Filter是在停止状态下连接的。<br> <br> //连接 source -> MPEG1Spliter<br> Source.FindPin(StringToOLEStr('Output'), OutPin);<br> MPEG1Splitter.FindPin(StringToOLEStr('Input'), inPin);<br> hr := (FilterGraph1 as IGraphBuilder).Connect(OutPin, InPin);<br> if FAILED(hr) then begin<br> ShowMessage('Failed connect mpg Source -> MPEG1Splitter');<br> exit;<br> end;<br> }<br> <br>2.FilterGraph构建的方法<br> 1)IFilterGraph.AddFilter 该参数提供一个Filter对象,将其加入到FilterGraph中.<br> 2)IFilterGraph.ConnectDirect 该参数提供输出Pin,输入Pin以及媒体类型,进行直接连接<br> 3)IGraphBuilder.AddSourceFilter 该参数提供源文件名,自动将一个SourceFilter加载到FilterGraph中<br> 4)IGraphBuilder.Connect 该参数提供输出Pin,输入Pin以及媒体类型,进行连接,如果失败,自动尝试在中间加入必要的格式转换Filter<br> 5)IGraphBuilder.Render 该参数提供输出Pin,自动间加入必要的Filter完成剩下的部分FilterGraph的构建(直到连到RenderFilter上)<br> 6)IGraphBuilder.Render 该参数提供源文件名,自动间加入必要的Filter完成这个文件的回放<br> <br> {<br> //下面范例,表示该FilterGraph中有6个Filter,他们都是由COM对象创建而来。<br> var<br> Source : IBaseFilter;<br> MPEG1Splitter : IBaseFilter;<br> MpegVcodec : IBaseFilter;<br> AviDec : IBaseFilter;<br> AviDest : IBaseFilter;<br> Writer : IBaseFilter;<br> hr : HRESULT;<br> OutPin, InPin : IPin;<br> begin<br> CoCreateInstance(CLSID_AsyncReader, nil, CLSCTX_INPROC,IID_IBaseFilter, Source); //典型的拉模式<br> CoCreateInstance(CLSID_MPEG1Splitter, nil, CLSCTX_INPROC,IID_IBaseFilter, MPEG1Splitter); //MPEG1格式<br> CoCreateInstance(CLSID_CMpegVideoCodec, nil, CLSCTX_INPROC,IID_IBaseFilter, MpegVcodec); //MPEG编码<br> CoCreateInstance(CLSID_AVIDec, nil, CLSCTX_INPROC,IID_IBaseFilter, AviDec); //AVI解码<br> CoCreateInstance(CLSID_AviDest, nil, CLSCTX_INPROC, IID_IBaseFilter, AviDest); //AVI目标<br> CoCreateInstance(CLSID_FileWriter, nil, CLSCTX_INPROC,IID_IBaseFilter, Writer); //写文件<br> <br> (FilterGraph1 as IFilterGraph).AddFilter(Source, 'Source');<br> (FilterGraph1 as IFilterGraph).AddFilter(MPEG1Splitter, 'MPEG1Splitter');<br> (FilterGraph1 as IFilterGraph).AddFilter(MpegVcodec, 'MpegVcodec');<br> (FilterGraph1 as IFilterGraph).AddFilter(AviDec, 'AviDec');<br> (FilterGraph1 as IFilterGraph).AddFilter(AviDest, 'AviDest');<br> (FilterGraph1 as IFilterGraph).AddFilter(Writer, 'Writer');<br> end;<br> } <br> <br>3. 一般使用GraphEdit可以查看到目前正常安装在系统中的Filter,如果是安装在DirectShow目录下的可以通过指定CLSID<br> 用CoCreateInstance来创建。在其它目录下的,必须通过系统枚举来创建。<br> 系统提供了一个CLSID_SystemDeviceEnum,用CoCreateInstance创建,并获取ICreateDevEnum接口。然后<br> 使用ICreateDevEnum.CreateClassEnumerator为指定的类型目录创建一个枚举器,并获得IEnumMoniker接口。<br> 使用IEnumMoniker.next方法,媒体该目录下所有可用设备标识(Device Moniker),每个设备标识对象上都实现了Imoniker接口<br> 调用Imoniker.bindtoStorage之后就可以访问设备标识属性集。比如得到设备的显示名字。<br> 调用Imoniker.BindToObject可以将设备标识绑定成一个DirecshowFilter,然后调用IFilterGraph.addFilter加入FilterGraph<br> 参加工作。<br> <br> DirectShow通常有两个名字:显示名字例如:@device:cm:{33D9A760-90C8-11D0-BD43-00A0C911CE86}\xvid<br> 友好名字例如:xvid mpeg4 decoder<br> {下面就是调用代码<br> <br> var<br> i, j: integer;<br> AMoniker, MyMoniker: IMoniker;<br> PropBag: IPropertyBag;<br> AVariant: OleVariant;<br> CLSID: TGUID;<br> Found: boolean;<br> begin<br> for i := 0 to SysDevEnum.CountCategories - 1 do<br> cbCategories.Items.Add(SysDevEnum.Categories.FriendlyName); //SysDevEnum:TSysDevEnum;<br> Found := false;<br> j := 0;<br> MyMoniker := Filter.BaseFilter.Moniker;<br> if MyMoniker = nil then exit;<br> MyMoniker.BindToStorage(nil,nil,IPropertyBag, PropBag);<br> if PropBag.Read('CLSID',AVariant,nil) = S_OK then<br> CLSID := StringToGUID(AVariant)<br> else CLSID := GUID_NULL;<br> for i := 0 to SysDevEnum.CountCategories - 1 do<br> begin<br> SysDevEnum.SelectIndexCategory(i);<br> if SysDevEnum.CountFilters > 0 then<br> for j := 0 to SysDevEnum.CountFilters - 1 do<br> begin<br> if IsEqualGUID(CLSID, SysDevEnum.Filters.CLSID) then<br> begin<br> AMoniker := SysDevEnum.GetMoniker(j);<br> Found := AMoniker.IsEqual(MyMoniker) = S_OK;<br> AMoniker := nil;<br> end;<br> if Found then Break;<br> end;<br> if Found then<br> begin<br> cbCategories.ItemIndex := i;<br> cbCategoriesChange(nil);<br> lbFilters.ItemIndex := j;<br> lbFiltersClick(nil);<br> break;<br> end;<br> end;<br> PropBag := nil;<br> MyMoniker := nil;<br> <br> }<br> <br> PAMMediaType = ^TAMMediaType;<br> _AMMediaType = record<br> majortype : TGUID;<br> subtype : TGUID;<br> bFixedSizeSamples : BOOL;<br> bTemporalCompression : BOOL;<br> lSampleSize : ULONG;<br> formattype : TGUID;<br> pUnk : IUnknown;<br> cbFormat : ULONG;<br> pbFormat : Pointer;<br> end;<br> <br>Filter开发基础----基类分析<br> 1)TBCBaseFilter<br> TBCBaseFilter = class(TBCUnknown, IBaseFilter, IAMovieSetup)<br> 是最基本Filter的基类,使用方法:<br> (1)声明一个新类继承自 TBCBaseFilter<br> (2)在新类中定义一个Filter上Pin的实例。(Pin从TBCBasePin继承)<br> (3)实现纯虚函数TBCBaseFilter.GetPin,用于返回Filter上各个Pin的对象指针<br> (4)实现纯虚函数TBCBaseFilter.GetPinCount,用于返回Filter上Pin的数量<br> (5)考虑如何处理从输入Pin进来的Sample数据<br> <br> <br> 2)TBCBasePin<br> TBCBasePin实现了PIn接口,TBCBasePin设计了Pin的整个连接过程。也实现了IQualityControl质量控制接口。<br> 在TBCBasePin上实现了3个成员函数与Filter状态对应。<br> (1) Filter.Stopped <-------------> TBCBasePin.Inactive<br> (2) Filter.Spaused <-------------> TBCBasePin.active<br> (3) Filter.Running <-------------> TBCBasePin.Run<br> 在实际开发Filter时,有可能重写该3个函数,用来初始化和释放必要资源。实现方法:<br> (1)从TBCBasePin派生一个子类<br> (2)实现纯虚函数TBCBasePin.CheckMediaType,进行Pin连接时媒体类型检测<br> (3)实现纯虚函数TBCBasePin.GetMediaType,提供Pin上的首先媒体类型<br> (4)实现Ipin.BeginFlush和IPin.EndFlush两个函数<br> (5)可能需要重写的函数包括。TBCBasePin.Inactive,TBCBasePin.active,TBCBasePin.Run,<br> TBCBasePin.CheckConnect(连接的时候检查,如查询对方Pin上是否支持某个特殊接口),<br> TBCBasePin.BreakConnect(断开连接,并进行必要的资源释放),<br> TBCBasePin.CompleteConnect(完成连接时被调用,可以在这个函数中获得当前连接用的媒体类型等参数),<br> TBCBasePin.EndOfStream(当上流数据全部传送完毕后被调用,如果这是个TransformFilter则将继续往下送,<br> 如是个RenderFilter,则需要向FilterGraph发送一个EC_COMPLETE事件)<br> TBCBasePin.Notify(直接响应质量控制,或者将质量控制消息往上一级Filter发送)<br> <br> 3)TBCBaseInputPin和TBCBaseOutputPin<br> TBCBaseInputPin和TBCBaseOutputPin都是从TBCBasePin派生而来,<br> TBCBaseInputPin实现了ImeminputPin(用于推模式的数据传送)<br> TBCBaseOutputPin主要完成了传送数据所用的Sample管理器(Allocate)的协商,并重写了TBCBasePin.active(用于<br> 实际的Sample内存分配),TBCBasePin.inactvie(用于Sample内存的释放)。<br> <br> TBCBaseInputPin使用方法(派生一个子类,并且至少重写如下函数):<br> (1) TBCBaseInputPin.BeginFlush<br> (1) TBCBaseInputPin.EndFlush<br> (1) TBCBaseInputPin.Receive<br> (1) TBCBaseInputPin.CheckMediaType(一般在输出Pin上实现该函数)<br> (1) TBCBaseInputPin.GetMediaType<br> <br> TBCBaseOutputPin使用方法(派生一个子类,并且至少重写如下函数):<br> (1)重写TBCBasePin.CheckMediaType进行连接时的媒体类型检查<br> (2)实现纯虚函数TBCBaseOutputPin.DecideBufferSize,决定Sample内存的大小<br> (3)重写纯虚函数TBCBasePin.GetMediaType,提供Pin上的首先媒体类型<br> <br> 4)TBCMediaType<br> TBCMediaType用于数据传输的Sample的实现类,TBCMediaType实现了IMediaSample2的接口,TBCMediaType封装了<br> 一个指向一块内存的指针,通过TBCMediaType.GetPointer得到<br> <br> 5)TBCSourceStream = class(TBCBaseOutputPin)<br> 提供了“推”(Push)的能力,实现了一个线程(TBCAMThread),Sample数据就是靠这个线程向下一级Filter发送的。<br> 实现方法:<br> (1)从TBCSourceStream派生一个子类作为Pin<br> (2)实现纯虚函数TBCSourceStream.CheckMediaType,进行Pin连接时媒体类型检测<br> (3)实现纯虚函数TBCSourceStream.GetMediaType,提供Pin上的首先媒体类型<br> (4)实现TBCBaseOutputPin.DecideBufferSize,决定Sample内存大小,在Pin连接时会执行<br> (5)实现TBCSourceStream.FillBuffer,为即将传送出去的Sample填充数据<br> (6)可选地实现TBCSourceStream.OnThreadCreate,<br> TBCSourceStream.OnThreadDestroy,<br> TBCSourceStream.OnThreadStartPlay 等函数,进行适当时机的初始化,资源管理等操作。<br> <br> 6)TBCTransformFilter<br> 实现了媒体类型的转换,主要实现如下函数:<br> (1)TBCTransformFilter.CheckInputType<br> (2)TBCTransformFilter.CheckTransForm<br> (3)TBCTransformFilter.DecideBufferSize<br> (4)TBCTransformFilter.GetMediaType<br> (5)TBCTransformFilter.TransForm<br> <br> 7)TBCTransinPlaceFilter<br> 是一个“就地”处理的转换Filter。<br> <br> 8)TBCVideoTransformFilter<br> 一个视频质量控制的基类。通过输入Pin上的Receive函数接收Sample时,能够根据质量消息决定是否丢帧,这个类<br> 主要是为开发AVI解码Filter而设计的。使用方法基本和TBCTransformFilter相同。<br> <br> 9)TBCBaseRenderer<br> 默认实现使用TBCRenderInutPin类的输入Pin。还实现了IMediaSeeking和IMediaPosition接口。使用方法:<br> (1)实现TBCBaseRenderer.CheckMediaType,用于检查输入Pin连接用的媒体类型<br> (2)实现TBCBaseRenderer.DoRenderSample,处理当前的Sample<br> 如果我们不处理Sample,需要写文件,基类可以选择从TBaseFilter,而此时输入Pin最好选择从TBCRenderInputIn<br> 派生类。<br> <br> 10)TBCBaseVideoRenderer<br> 实现了VideoFilter基类,其中实现了IQualityControl用于视频质量控制,IQualProp用于在Filter属性页显示一些<br> 实时性能参数。使用方法与TBCBaseRenderer相同。<br> <br>基于Delphi的DirectShow开发概述3<br> <br> Delphi设计Directshow其实也是比较简单的,看了前面两个概述,相信你也会明白一些了,问题就是你要有什么杨的需求,然后根据需求来选择合适的Filter基类,从基类(BassFilter)继承下来后,只需要覆盖指定的函数就可以了。<br> <br> 例如我们要设计一个屏幕(Desktop)捕获的的Filter,每秒捕获大概10帧(10副抓屏bitmap),这个明显需要实现Push下推的功能,因此我们可以选择从TBCSourceStream基类派生一个子类,然后实现如下几个函数即可:<br> <br> //GetMediaType函数是下级Filter在和本Filter连接时在下级InpuPin接口上调用的<br> <br> function GetMediaType(iPosition: Integer; out MediaType: PAMMediaType): HResult; override;<br> </p>
<p> //实现虚函数CheckMediaType,实现接受8, 16, 24 or 32 RGB位视频格式<br> //如果媒体格式不能接受,则返回E_INVALIDARG<br> function CheckMediaType(MediaType: PAMMediaType): HResult; override;<br> <br> //在本Filter的OutPutPin接口和下级InputPin接口协商时调用的,主要用来协商每个Sample的大小<br> function DecideBufferSize(Allocator: IMemAllocator;Properties: PAllocatorProperties): HRESULT; override;<br> <br> //设置视频媒体参数,在初始化Filter时调用<br> function SetMediaType(MediaType: PAMMediaType): HRESULT; override;<br> <br> //以上几个函数是在和下级Filter进行接口连接和协商时调用,FillBuffer函数则是由本Filter内置线程按一定时间<br> <br> //间隔调用,这里当然是把抓屏的Bitmap数据填充到Sample中,推给下一级。<br> function FillBuffer(Sample: IMediaSample): HResult; override;<br> </p>
<p> //实现虚函数,质量控制功能<br> function Notify(Filter: IBaseFilter; q: TQuality): HRESULT; override; stdcall;<br> <br> <br> <br>具体代码分析如下:<br> <br> CLSID_PushSourceDesktop: TGUID = '{570757C1-D2D8-42D1-BA0C-24E1BED3F62F}'; //PushFilter注册名<br> <br> //Pin注册类型结构<br> TRegPinTypes = record<br> clsMajorType: PGUID;<br> clsMinorType: PGUID;<br> end;<br> <br> //Setup信息结构<br> sudPinTypes: TRegPinTypes =<br> (<br> //视频流的类型<br> clsMajorType: @MEDIATYPE_Video;<br> //所用可用类型<br> clsMinorType: @MEDIASUBTYPE_NULL<br> );<br> <br> //Filter注册Pin接口信息结构<br> TRegFilterPins = record<br> strName : PWideChar;<br> bRendered : BOOL;<br> bOutput : BOOL;<br> bZero : BOOL;<br> bMany : BOOL;<br> oFilter : PGUID;<br> strConnectsToPin : PWideChar;<br> nMediaTypes : LongWord;<br> lpMediaType : PRegPinTypes;<br> end;<br> <br> //定义实例<br> sudOutputPinDesktop: array of TRegFilterPins =<br> (<br> (<br> strName: 'Output'; // Pin名称<br> bRendered: FALSE; //是否是Render<br> bOutput: TRUE; //是否是输出接口<br> bZero: FALSE; //是否允许为0<br> bMany: FALSE; //是否有更多<br> oFilter: nil; //连接的Filter<br> strConnectsToPin: nil; //连接的Pin<br> nMediaTypes: 1; //支持类型数量<br> lpMediaType: @sudPinTypes // Pin信息<br> )<br> );<br> <br> DefaultFrameLength: TReferenceTime = FPS_10; //由参考时钟确定FPS_10=1000000<br> PushDesktopName: WideString = '_ PushSource Desktop Filter'; //PushFilter友好名<br> <br> //Pin接口类封装,继承TBCSourceStream<---TBCBaseOutputPin<----TBCBasePin(TBCUnknown, IPin, IQualityControl)<br> TBCPushPinDesktop = class(TBCSourceStream)<br> protected <br> FFramesWritten : Integer; //在播放文件的时候跟踪当前位置 <br> FZeroMemory : Boolean; //是否必须清零Buffer <br> FSampleTime : TRefTime; //每个Sample一个时间戳<br> FFrameNumber : Integer; //已经显示了多少帧了<br> FFrameLength : TReferenceTime; //一帧的耗费时间<br> FScreenRect : TRect; //包含需要捕获的视频框<br> FImageHeight, //当前图像高<br> FImageWidth, //当前图像宽 <br> FRepeatTime, //每帧之间重复时间 Time in msec between frames <br> FCurrentBitDepth: Integer; //屏幕色彩位<br> FMediaType : TAMMediaType; //媒体类型 <br> FSharedState : TBCCritSec; //临界区在资源共享中实现线程同步<br> public<br> constructor Create(out hr: HResult; Filter: TBCSource);<br> destructor Destroy; override;<br> //实现虚函数,提供一个精确的媒体类型<br> function GetMediaType(iPosition: Integer; out MediaType: PAMMediaType): HResult; override;<br> //实现虚函数,实现接受8, 16, 24 or 32 RGB位视频格式<br> //如果媒体格式不能接受,则返回E_INVALIDARG<br> function CheckMediaType(MediaType: PAMMediaType): HResult; override;<br> function DecideBufferSize(Allocator: IMemAllocator;Properties: PAllocatorProperties): HRESULT; override;<br> function SetMediaType(MediaType: PAMMediaType): HRESULT; override;<br> function FillBuffer(Sample: IMediaSample): HResult; override;<br> //实现虚函数,质量控制功能<br> function Notify(Filter: IBaseFilter; q: TQuality): HRESULT; override; stdcall;<br> end;<br> <br> //PushFilter的类封装,继承自TBCSource<-----TBCBaseFilter<br> //把桌面抓屏图像作为连续视频流<br> TBCPushSourceDesktop = class(TBCSource)<br> private<br> FPin: TBCPushPinDesktop;<br> public<br> constructor Create(ObjName: string; Unk: IUnKnown; out hr: HRESULT);<br> constructor CreateFromFactory(Factory: TBCClassFactory; const Controller: IUnknown); override;<br> destructor Destroy; override;<br> end;<br> <br>//TBCPushPinDesktop析构函数<br>constructor TBCPushPinDesktop.Create(out hr: HResult; Filter: TBCSource);<br> var<br> DC: HDC;<br>begin<br> inherited Create('_ Push Source Desktop', hr, Filter, 'Out');<br> FFramesWritten := 0;<br> FZeroMemory := False;<br> FFrameNumber := 0;<br> FFrameLength := FPS_5;<br> FSharedState := TBCCritSec.Create;<br> FCurrentBitDepth := 32;<br> <br> //这里关键是显示如何获取DIB图像,使用内存方式,把DIB图像插入到视频流<br> <br> //为了尽可能保持Samle采样,我们就需要从一个文件中读取图像,把它插入到发送下行接口流中<br> <br> //获取需要显示设备context上下文<br> DC := CreateDC('DISPLAY', nil, nil, nil);<br> <br> //获取主桌面窗口的尺寸<br> FScreenRect.Left := 0;<br> FScreenRect.Top := 0;<br> FScreenRect.Right := GetDeviceCaps(DC, HORZRES);<br> FScreenRect.Bottom := GetDeviceCaps(DC, VERTRES);<br> <br> //保持该尺寸,为后面填充Buffer使用<br> FImageWidth := FScreenRect.Right - FScreenRect.Left;<br> FImageHeight := FScreenRect.Bottom - FScreenRect.Top;<br> <br> //释放资源<br> DeleteDC(DC);<br> <br> hr := S_OK;<br>end;<br> <br>destructor TBCPushPinDesktop.Destroy;<br>begin<br>{$IFDEF DEBUG}<br> DbgLog(self, Format('Frames written %d', ));<br>{$ENDIF}<br> inherited;<br>end;<br> </p>
<p>//参考的视频格式,8, 16 (*2), 24 or 32 bits per pixel<br>//参考这些类型,选择更高的质量控制<br>// Therefore, iPosition =<br>// 0 Return a 32bit mediatype<br>// 1 Return a 24bit mediatype<br>// 2 Return 16bit RGB565<br>// 3 Return a 16bit mediatype (rgb555)<br>// 4 Return 8 bit palettised format<br>// >4 Invalid<br>{<br> PVideoInfo = ^TVideoInfo;<br> tagVIDEOINFO = record<br> rcSource: TRect; // 我们实际需要使用的位(在整个窗口中的Sub窗口)<br> rcTarget: TRect; // 该视频音频去哪<br> dwBitRate: DWORD; // 近似位率<br> dwBitErrorRate: DWORD; // 错位率<br> AvgTimePerFrame: TReferenceTime; // 每帧的平均时间(100ns units)<br> bmiHeader: TBitmapInfoHeader; //位图信息头,解码为RGB后可以形成一个Bitmpa图像<br> case Integer of<br> 0: (<br> bmiColors: array of TRGBQuad //调色板<br> );<br> 1: (<br> dwBitMasks: array of DWORD //真彩色掩码<br> );<br> 2: (<br> TrueColorInfo: TTrueColorInfo //两者都有<br> );<br> end;<br> <br> PAMMediaType = ^TAMMediaType;<br> _AMMediaType = record<br> majortype : TGUID;<br> subtype : TGUID;<br> bFixedSizeSamples : BOOL;<br> bTemporalCompression : BOOL;<br> lSampleSize : ULONG;<br> formattype : TGUID;<br> pUnk : IUnknown;<br> cbFormat : ULONG;<br> pbFormat : Pointer;<br> end;<br>} <br>function TBCPushPinDesktop.GetMediaType(iPosition: Integer; out MediaType: PAMMediaType): HResult;<br>var<br> pvi: PVIDEOINFO;<br> i: Integer;<br>begin<br> FFilter.StateLock.Lock;<br> try<br> if (MediaType = nil) then<br> begin<br> Result := E_POINTER; //指针错误<br> Exit;<br> end;<br> <br> if (iPosition < 0) then<br> begin<br> Result := E_INVALIDARG; //无效的位置<br> Exit;<br> end;<br> <br> //是否从类型结束处开始 Have we run off the end of types?<br> if (iPosition > 4) then<br> begin<br> Result := VFW_S_NO_MORE_ITEMS; <br> Exit;<br> end;<br> <br> MediaType.cbFormat := SizeOf(TVideoInfo); //视频类型<br> pvi := CoTaskMemAlloc(MediaType.cbFormat); //为媒体类型结构体分配内存<br> if (pvi = nil) then<br> begin<br> Result := E_OUTOFMEMORY;<br> Exit;<br> end;<br> <br> ZeroMemory(pvi, MediaType.cbFormat);<br> <br> case iPosition of<br> 0:<br> begin<br> //返回32位格式的最高质量图像=RGB888<br> pvi.bmiHeader.biCompression := BI_RGB; //无压缩RGB格式<br> pvi.bmiHeader.biBitCount := 32;<br> end;<br> 1:<br> begin<br> pvi.bmiHeader.biCompression := BI_RGB;<br> pvi.bmiHeader.biBitCount := 24;<br> end;<br> 2:<br> begin<br> //每像素16位=RGB565,把RGB掩码以DWord类型,放入调色板前三个地方<br> for i := 0 to 2 do<br> pvi.TrueColorInfo.dwBitMasks := bits565;<br> <br> pvi.bmiHeader.biCompression := BI_BITFIELDS;<br> pvi.bmiHeader.biBitCount := 16;<br> end;<br> 3:<br> begin<br> //每像素16位=RGB555,把RGB掩码以DWord类型,放入调色板前三个地方<br> for i := 0 to 2 do<br> pvi.TrueColorInfo.dwBitMasks := bits555;<br> <br> pvi.bmiHeader.biCompression := BI_BITFIELDS;<br> pvi.bmiHeader.biBitCount := 16;<br> end;<br> 4:<br> begin<br> //每像素8位,可以不带调色板子<br> pvi.bmiHeader.biCompression := BI_RGB;<br> pvi.bmiHeader.biBitCount := 8;<br> pvi.bmiHeader.biClrUsed := iPALETTE_COLORS;<br> end;<br> end;<br> <br> //任何视频格式都必须调整下面参数<br> pvi.bmiHeader.biSize := SizeOf(TBitmapInfoHeader);<br> pvi.bmiHeader.biWidth := FImageWidth;<br> pvi.bmiHeader.biHeight := FImageHeight;<br> pvi.bmiHeader.biPlanes := 1;<br> pvi.bmiHeader.biSizeImage := GetBitmapSize(@pvi.bmiHeader);<br> pvi.bmiHeader.biClrImportant := 0;<br> <br> //清空源和目标框<br> SetRectEmpty(pvi.rcSource);<br> SetRectEmpty(pvi.rcTarget);<br> <br> //设置Majortype相关参数<br> MediaType.majortype := MEDIATYPE_Video; //主类型为视频格式<br> MediaType.formattype := FORMAT_VideoInfo; //格式类型为视频格式<br> MediaType.bTemporalCompression := False;<br> MediaType.bFixedSizeSamples := True;<br> <br> // 设置Subtype相关参数<br> MediaType.subtype := GetBitmapSubtype(@pvi.bmiHeader);<br> MediaType.pbFormat := pvi;<br> MediaType.lSampleSize := pvi.bmiHeader.biSizeImage;<br> <br> Result := S_OK;<br> <br> finally<br> FFilter.StateLock.UnLock;<br> end;<br>end;<br> <br>//检查我们是否支持该媒体类型<br>function TBCPushPinDesktop.CheckMediaType(MediaType: PAMMediaType): HResult;<br>var<br> pvi: PVIDEOINFO;<br> SubType: TGUID;<br>begin<br> //我们仅仅需要输出该视频<br> if not (IsEqualGUID(MediaType.majortype, MEDIATYPE_Video)) or<br> not (MediaType.bFixedSizeSamples) then<br> begin<br> Result := E_INVALIDARG;<br> Exit;<br> end;<br> <br> //检查我们支持的子类型<br> SubType := MediaType.subtype;<br> if IsEqualGUID(SubType, GUID_NULL) then<br> begin<br> Result := E_INVALIDARG;<br> Exit;<br> end;<br> <br> if not (<br> IsEqualGUID(SubType, MEDIASUBTYPE_RGB8) or<br> IsEqualGUID(SubType, MEDIASUBTYPE_RGB565) or<br> IsEqualGUID(SubType, MEDIASUBTYPE_RGB555) or<br> IsEqualGUID(SubType, MEDIASUBTYPE_RGB24) or<br> IsEqualGUID(SubType, MEDIASUBTYPE_RGB32)<br> ) then<br> begin<br> Result := E_INVALIDARG;<br> Exit;<br> end;<br> <br> pvi := MediaType.pbFormat;<br> <br> if (pvi = nil) then<br> begin<br> Result := E_INVALIDARG;<br> Exit;<br> end;<br> <br> //检查图像尺寸是否改变,那么返回错误,以便重新调整图像大小<br> if (pvi.bmiHeader.biWidth <> FImageWidth) or<br> (abs(pvi.bmiHeader.biHeight) <> FImageHeight) then<br> begin<br> Result := E_INVALIDARG;<br> Exit;<br> end;<br> <br> //不接受负高度,超出屏幕外的不支持<br> if (pvi.bmiHeader.biHeight < 0) then<br> begin<br> Result := E_INVALIDARG;<br> Exit;<br> end;<br> <br> Result := S_OK; //接受该格式<br>end;<br> <br>// DecideBufferSize:在视频格式协商好后,每次都必须调用它,确定需要传输的的内存大小<br>function TBCPushPinDesktop.DecideBufferSize(Allocator: IMemAllocator;Properties: PAllocatorProperties): HRESULT;<br>var<br> pvi: PVIDEOINFOHEADER;<br> Actual: ALLOCATOR_PROPERTIES;<br>begin<br> if (Allocator = nil) or (Properties = nil) then<br> begin<br> Result := E_POINTER;<br> Exit;<br> end;<br> <br> FFilter.StateLock.Lock;<br> try<br> pvi := AMMediaType.pbFormat; //来自TBasePin接口的AMMediaType<br> <br> Properties.cBuffers := 1; //内存块数量<br> Properties.cbBuffer := pvi.bmiHeader.biSizeImage; //内存块大小<br> Assert(Properties.cbBuffer <> 0); //确保该cbBuffer<>0,否则会引发异常<br> <br> //通过allocator分配查询我们需要的Sample内存大小<br> Result := Allocator.SetProperties(Properties^, Actual);<br> if Failed(Result) then Exit;<br> <br> //实际需要的分配的内存和属性中定义的不匹配<br> if (Actual.cbBuffer < Properties.cbBuffer) then<br> begin<br> Result := E_FAIL;<br> Exit;<br> end;<br> <br> //确保我们的实际内存块数量为1<br> Assert(Actual.cBuffers = 1);<br> Result := S_OK;<br> <br> finally<br> FFilter.StateLock.UnLock;<br> end;<br>end;<br> <br>// SetMediaType,在两个Filter之间协商媒体类型时候,调用该函数<br>function TBCPushPinDesktop.SetMediaType(MediaType: PAMMediaType): HRESULT;<br>var<br> pvi: PVIDEOINFOHEADER;<br>begin<br> FFilter.StateLock.Lock;<br> try<br> //通过基类传递设置<br> Result := inherited SetMediaType(MediaType);<br> <br> if Succeeded(Result) then<br> begin<br> pvi := AMMediaType.pbFormat;<br> <br> if (pvi = nil) then<br> begin<br> Result := E_UNEXPECTED;<br> Exit;<br> end;<br> <br> // 8-bit palettized,<br> // RGB565, RGB555,<br> // RGB24,<br> // RGB32<br> if pvi.bmiHeader.biBitCount in then<br> begin<br> //保存当前设定的媒体参数<br> FMediaType := MediaType^;<br> FCurrentBitDepth := pvi.bmiHeader.biBitCount;<br> end else<br> begin<br> //除此之外不支持其它媒体类型<br> Assert(False);<br> Result := E_INVALIDARG;<br> end;<br> end;<br> <br> finally<br> FFilter.StateLock.UnLock;<br> end;<br>end;<br> <br>//FillBuffer是在每次采集视频数据后调用,把数据写入到Stream中,传递给下一个Filter<br>//这个函数中为虚抽象函数,所以必须实现代码完成实际的视频数据填充,以便下传<br>function TBCPushPinDesktop.FillBuffer(Sample: IMediaSample): HResult;<br>var<br> pData: PByte;<br> cbData: Longint;<br> hDib: HBitmap;<br> pvih: PVIDEOINFOHEADER;<br> Start, Stop: REFERENCE_TIME;<br> <br> function min(v1, v2: DWord): DWord;<br> begin<br> if v1 <= v2 then<br> Result := v1<br> else<br> Result := v2;<br> end;<br> <br>begin<br> if (Sample = nil) then<br> begin<br> Result := E_POINTER;<br> Exit;<br> end;<br> <br> FSharedState.Lock;<br> try<br> //获取Sample中视频数据内存指针(PData获取)<br> Sample.GetPointer(pData);<br> cbData := Sample.GetSize;<br> <br> //确认我们将要访问的视频格式,如果不合格将出现异常<br> Assert(IsEqualGUID(AMMediaType.formattype, FORMAT_VideoInfo));<br> <br> pvih := AMMediaType.pbFormat;<br> <br> //复制DIB位图数据到输出Buffer<br> //如果Sample的字节数大于真实图像字节,就限定复制的字节<br> pVih.bmiHeader.biSizeImage := min(pVih.bmiHeader.biSizeImage, cbData);<br> hDib := CopyScreenToBitmap(FScreenRect, pData, @pVih.bmiHeader);<br> <br> if (hDib <> 0) then DeleteObject(hDib);<br> <br> //设置时间戳,可以给帧率回调函数使用<br> //如果这个是用AVI格式写的,那么我们就需要配置AVI Mux Filter 来设定每帧的平均时间<br> //当前时间<br> Start := FFrameNumber * FFrameLength;<br> Stop := Start + FFrameLength;<br> <br> Sample.SetTime(@Start, @Stop);<br> Inc(FFrameNumber);<br> <br> //对于没有压缩的帧,都要设置为True,当作关键帧对待<br> Sample.SetSyncPoint(True);<br> <br> Result := S_OK;<br> <br> finally<br> FSharedState.UnLock;<br> end;<br>end;<br> <br>//返回质量控制,由于这时源头,所以可以收到来自render之间的各个Filter的Notify,<br>//最终反应在Filter(来自哪个),Q质量控制参数,可以通过这两个参数来调整帧率和质量<br>function TBCPushPinDesktop.Notify(Filter: IBaseFilter; q: TQuality): HRESULT;<br>begin<br> Result := E_FAIL;<br>end;<br> </p>
<p>{<br> {$EXTERNALSYM CLSID_CVidCapClassManager} //BaseFilter目录类型<br> //CLSID_LegacyAmFilterCategory: TGUID = (D1:$083863F1;D2:$70DE;D3:$11D0;D4:($BD,$40,$00,$A0,$C9,$11,$CE,$86));<br>}<br> <br>initialization<br> TBCClassFactory.CreateFilter(TBCPushSourceDesktop, PushDesktopName,<br> CLSID_PushSourceDesktop, CLSID_LegacyAmFilterCategory,<br> MERIT_DO_NOT_USE, 1, @sudOutputPinDesktop<br> );<br> <br>end. </p>
<p>//由FillBuffer先填充Sample信息,然后由DecideBufferSize来真实的为视频数据分配内存,供下级Filter使用<br>//加载顺序由下级Filter的InputPin接口调用本OutPutPin接口的GetMediaType,<br>//然后调用OutPutPin接口的SetMediaType设定媒体格式,<br>//调用DecideBufferSize,协商内存大小<br>//启动后,不断调用FillBuffer填充Sample</p>
</div>
<div id="MySignature" role="contentinfo">
好的代码像粥一样,都是用时间熬出来的<br><br>
来源:https://www.cnblogs.com/jijm123/p/14339697.html
頁:
[1]