全平台硬件解码渲染方法与优化实践

  • 时间:
  • 浏览:1
  • 来源:万人红黑大战棋牌_万人红黑大战棋牌官网

最终他们成功统一了macOS与iOS一一一个多多平台的防止流程,在此完后 机会开发者想调用官方提供的接口,首先需要判断iOS版本,机会是iOS11则使用新最好的措施,老版本则需要使用加在参数的最好的措施。 

但用GLX的最好的措施机会比较过时,而Linux平台上经常出現的有些新防止方案可带来明显的硬解性能提升。如现在比较流行的EGL,他们可将其理解为一一一个多多连接渲染接口与窗口系统之间的桥梁。EGL的大多数功能通过集成扩展实现,主要的共享最好的措施为GELImage与GELStream。

最后想介绍些关于Open MAX AL的内容。Open MAX AL在安卓上并未提供EGLStream扩展,而创建OMXAL播放器需要要设置输出参数,对安卓而言输出Native Display对象也好多好多 我ANative Window,其由Surface获取并调用NDK接口,与OMX AL输出的Surface一致,好多好多 完后 的与Surface相关的流程和MediaCodec完正相同。

而macOS与iOS也是借助完后 提到的平台提供的纹理共享接口。

attach最好的措施大致流程如下:每次渲染时生成纹理并attach至上下文,调用更新纹理的最好的措施使得数据保留在纹理上,最后将此纹理Detach。

2、硬解纹理转换一般思路

上图展示的是Texturecache由TexToolbox buffer转到(Texture崩溃)的堆栈,仔细观察没有发现从前的Texturecache法并不一定也是调用TexImageIOSurface,为社 在么在在老平台指在此接口却没有被启用?最终我在iOS5中发现了TextureImageIOSSurface的指在,而iOS11相对于iOS5仅仅是参数的加在与接口的微调,我应该 使用GPU分析工具检查后可发现IOS11与老版本系统的Texturecache最好的措施例如,都不 通过调用一一一个多多从老版本iOS上就指在至今的接口来实现相关功能。

但创建共享上下文的最好的措施对有些安卓开发者而言门槛较高。第二套方案是在流程现在已经 开始时创建一一一个多多无效的纹理,机会Surface Texture可把纹理附加至Surface Texture上,从前只需在第一次渲染时把有些在渲染系统进程创建的离米 纹理附加在即可。

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/83747420

软解OpenGL渲染的数据流为:首先,通过调用TexSublmage将解码后倒入主存上的数据拷贝到显存上用于更新纹理,我应该 的渲染过程也是基于显存上的数据进行。

这就引起了进一步思考:既然可不能不能将二者进行统一,没有完后 老平台上的Texturecache究竟起了哪些作用?

即使iOS与macOS可实现没有数据拷贝的纹理转换,但一一一个多多平台指在两套防止流程,这也会对开发者带来不便。而iPhone54 6公司我应该 公开的一一一个多多被称为IOSurface的新框架为接下来的探索提供了思路,其中包括了从PixelBuffer获取IOSurface的最好的措施。IOSurface用以系统进程间进行GPU数据共享,硬件解码输出至GPU显存并通过IOSurface实现系统进程间的数据共享。VideoToolbox作为一一一个多多服务,必须在APP现在已经 开始解码时才会启动解码系统进程。而Get IOSurface的最好的措施在macOS上早已指在,但在iOS11的SDK中第一次经常出現。除了需要GetIOSurface,他们还需要转成纹理的函数,同样在macOS的OpenGL Framework中他们发现了TextureImageIOSurface。此函数的功能与macOS上的例如,这是都不 因为他们可不能不能将iOS与macOS的防止流程进行整合?

4、 iOS & macOS

3.、D3D11+EGLStream

被使用最多的EGLImage目前作为扩展形式指在,如OpenMarxAL等专门提供了一套可输出到EGLImage的接口,而树莓派的MMAL硬件解码则提供了一套由MMAL输出的Buffer转换为GELImage的最好的措施。EGLImage可与窗口系统无关,同样也可用于没有窗口系统的服务器端。在实际应用中他们会优先考虑使用EGLImage,视频数据经过与EGLImage对应的OpenGL扩展输出为OpenGL纹理从而实现了接口之间的共享。而较新的EGLStream是英伟达经常推崇的最好的措施,目前我所接触到的应用主要有一一一个多多:一一一个多多是OpenMarxAL接口,其可直接作为EGLStream的输入扩展并可输出OpenGL纹理,从前则应用在D3D11的硬件解码上。机会他们使用EGLStream则需要重点核对一一一个多多扩展名:producer与consumer。producer是硬件解码输出的对象,consumer则是输出的OpenGL纹理。除了哪些扩展,他们还可利用有些OpenGL扩展。对于Windows平台而言Windows使用DXVA与D3D11解码,输出结果为D3D纹理;在这里,英伟达提供了一一一个多多可将D3D资源直接转换为OpenGL纹理的接口,但此接口受到GPU驱动的限制,指在一定的使用环境限制;对于Linux平台而言如X11窗口系统,Linux提供了一一一个多多将X11的pixmap转加在GLX也好多好多 我OpenGL纹理的最好的措施,此最好的措施完后 也用于VA-API现在已不被推荐使用。

常规的软解OpenGL渲染流程主要分为两每项:一是在渲染纹理前进行的准备纹理,二是渲染前更新纹理。准备纹理具体是指在第一次渲染第一帧前先创建一一一个多多设置好相应参数的纹理,而后再使用Texlmage2D将GPU上一定大小的显存空间分配给此纹理;进行渲染前首先需绑定此纹理,并借助TexSublmage2D技术将解码数据填充进完后 分配好的纹理存储空间中,也好多好多 我所谓的“纹理上传”。

分派 / LiveVideoStack

以上并都不 最好的措施基本防止了有些相对重要的MediaCodec问提,除此之外他们也会面临APP后台切换至前台时UpdateTexImage()错误的情况表,机会是机会上下文不对一般可通过重新初始化解码器或使用TextureView等最好的措施防止。但机会用户想借助SurfaceView防止此问提,也可通过共享上下文的最好的措施,为SurfaceView提供一一一个多多上下文并在每次渲染前激活。但此最好的措施具有仅适用于买车人创建的上下文的局限性,机会上下文由外部提供,没有他们还可不能不能通过attach最好的措施。

D3D11的硬解输出结果为D3D11纹理,输出格式为NV12。后续在转换纹理时他们有一一一个多多思路:思路一较为常见,这里就不再赘述。思路二是借助EGLStream扩展,在创建一一一个多多共享的D3D11纹理后再从此纹理创建一一一个多多EGLSurface,此Surface可绑定至OpenGL纹理;他们需要做的是将解码出的纹理拷贝至共享的D3D11纹理上,拷贝最好的措施是借助D3D11的Video Processor接口将YUV转加在RGB。尽管此最好的措施下行时延 较高,但有些Chrome开发者仍然并不一定需要尽机会减小其带来的性能损失,也好多好多 我追求完正没有任何数据转换的最佳方案。我应该 在2016年时EGLStream扩展被推出,从而有效改善了性能损失带来的影响。

Android平台中集成了Java、MediaCodec、OMX AL(应用层创建播放器)等可直接调用的接口。除此之外还有并都不 提供了如创建、解码器组件等诸多更底层功能的OMX IL接口,但机会将此接口与OpenGL结合,机会EGLImage所需的扩展是非公开的,我应该 OMX IL暂且一一一个多多NDK系统库而Android7.0完后 的版本不允许访问非NDK系统库,故而他们仅使用MediaCodec与OMX AL。

他们期待将有些问提僵化 ,也好多好多 我实现从解码现在已经 开始到渲染现在已经 开始视频数据经常在显存上进行防止。我猜想,是算是指在并都不 数据共享最好的措施也好多好多 我API间的数据共享从而防止数据在内存与显存之间暂且要的来回拷贝?例如使用D3D则会生成D3D的Texture,机会D3D与OpenGL间指在允许数据共享的接口,没有就可不能不能保证无论数据如可被传输都保留在显存上或需要传输就可直接进行下一流程的防止;机会上述猜想不成立,机会内存与GPU间的数据传输下行时延 和内存与CPU间相比快好多好多 ,可不能不能通过与GPU间的数据拷贝显著提升性能?当然他们也可不能不能针对GPU提供的接口,转换GPU中的数据,例如将OpenGL的纹理从从前的YUV转加在RGB以获得理想的硬解数据流,上述都不 他们在考虑硬解优化时想到的防止方案。

解码后的视频数据需经过纹理加载后才会进行下一步的OpenGL ES渲染操作,其关键在于如可将解码后的数据填充到纹理中。不同的平台对于此问提的防止方案好多好多 我尽相同,这也是他们今天讨论的重点。

Apple的macOS使用VideoToolbox作为解码器且输出对象为CVPixelBufferRef也好多好多 我保指在内存或显存上的图像数据;VideoToolbox有多种输出格式,如YUV420P、NV12、RGB、UYVY422等。刚接触此平台时我注意到了有些平台没有的UYVY422格式,机会老版本系统不提供NV12接口,故UYVY442格式普遍用于老系统;而新系统上提供的NV12防止下行时延 远高于UVYV442。当时我将此发现反馈给FFmpeg社区,我应该 社区在FFmpeg中加在了用以选则VideoToolbox输出结果的接口:机会是支持性能不佳的老系统则使用UYVY442格式,而新系统则使用NV12格式。macOS的纹理准备过程与传统软解例如,而纹理更新过程则略有不同,在其纹理更新中的PixelBuffer完后 会输出并保存一一一个多多IOSurface,关于IOSurface的完正内容我会在后文提到。macOS通过OpenGL Framework中的一一一个多多CGL实现将IOSurface转换为纹理,而输出的结果较为独特,如输出的纹理暂且2D类型好多好多 我一一一个多多矩形纹理。macOS也可通过TextureCache最好的措施实现纹理转换并输出RGB型纹理,但性能较为低下,没了此赘述。

文 / 王斌

以XBMC为例,首先解码系统进程会给渲染系统进程以创建好纹理的信息共同渲染系统进程会反馈信息给解码系统进程。但机会此消息循环机制并未在所有APP上推行,这对设计适用所有APP框架下的播放器来说暂且合理,针对此问提他们有两套防止方案:第一套方案是可不能不能在解码系统进程创建共享上下文并在此上下文下创建一一一个多多可在渲染系统进程被访问的纹理。

MediaCodec指在并都不 输出,其一是ByteBuffer也好多好多 我将结果输出到内存上,当然是不被他们采用的;其二是Surface也好多好多 我将结果输出到显存上,接下来他们需要讨论如可构造Surface。这里有并都不 最好的措施构造Surface,最好的措施一是由Surface View获取Surface并直接输出至View上,但这对他们而言因为无法使用OpenGL,故排除。最好的措施二是Surface Texture,在解码系统进程的现在已经 开始需要配置MediaCodec输出,由纹理构建Surface Texture,而后Surface Texture借助UpdateTexImage法实现渲染系统进程更新纹理。这里需要明确的是Surface Texture纹理的对象是哪些样的?机会Android没有相关文档,他们可假设此纹理是一一一个多多有效纹理,如可创建此纹理?

iOS仅提供TextureCache法,这因为需要生成纹理而仅需在准备纹理阶段创建TextureCache类即可并从Cache中直接获取纹理,此流程与绝大多数需要先生成一一一个多多纹理再进行转换等操作的传统硬解渲染最好的措施有明显不同。

1.2 硬解OpenGL渲染

机会采取数据共享,该如可找到哪些数据共享接口?首先他们应当从平台入手,了解像iOS、Android等不同平台提供了哪些共享接口。如iOS与有些硬解库提供的数据拷贝接口,如英伟达的CUDA提供的转换接口等。Linux中也集成了被称为VA-API的硬解接口,针对GLX环境VA-API提供了并都不 可将硬解输出转换为RGB纹理的最好的措施,开发者可直接调用此接口与其相应功能。

通过上图他们可不能不能发现D3D11+EGLStream的软解流程与常规的OpenGL软解渲染流程有所不同,EGLStream首先需要创建EGLStream对象,而后再创建纹理对象;在纹理准备期间也需要利用此扩展并设置consumer的OpenGL ES纹理,更新、渲染纹理时EGLStream提供了PostD3D11的最好的措施,此最好的措施离米 直接将D3D纹理作为OpenGL ES纹理使用。在后期进行渲染时机会涉及到一一一个多多API——D3D11与OpenGL,调用API时必须共同访问二者,故需要进行Acquire过程用以锁定D3D11资源使得必须OpenGL可访问此资源。在此完后 他们就可借助OpenGL渲染纹理,现在已经 开始渲染后Release也好多好多 我解锁资源。

硬件解码后不恰当地使用OpenGL渲染会因为性能下降,甚至不如软解。本文来自PPTV移动端研发经理王斌在LiveVideoStackCon 2017大会上的分享,并由LiveVideoStack分派而成。分享中王斌完正解析了Windows、Linux、macOS、Android、iOS等多种平台下硬件解码的渲染最好的措施及优化实践。

5、Android硬解渲染及常见问提防止

1)软解OpenGL渲染流程

1.1 常规的OpenGL渲染

事实证明从前是可行的,最终他们可统一整个iPhone54 6系统的解码渲染流程,除了OpenGL接口与OpenGL ES接口的差异之外,其它的流程完正相同。

总结各个平台的情况表没有发现,考虑硬解完后 他们需要思考硬解的输出,机会硬解的输出不像软解的输出是一组到内存指向各平面的指针,他们需要获知硬解输出的对象与格式。现在好多好多 硬解都不 以YUV作为输出格式如NV12等,当然排除个别定制化产品通过参数配置调整输出格式为RGB的情况表,根据经验硬解一般选则YUV作为输出格式。首先是机会RGB的输出实际上是在GPU外部进行的色彩空间转换,会对性能产生一定影响;其次他们也面临无法保证YUV转加在RGB的精确性,矩阵系数是定值则无法适应多样场景的问提。

上图表示GPU(CPU)内存与显存间数据的交换下行时延 ,其中虚线表示数据由显存拷贝到内存的下行时延 ,实线表示数据由内存拷贝到显存的下行时延 。从中他们可不能不能看了,数据由显存拷贝到内存的下行时延 离米 是内存拷贝到显存的1/5,这也是为哪些使用DXVA硬解都不 经常出現不如软解流畅的因为。

他们好,我是来自PPTV的王斌。接下来我将围绕以下几块话题,为他们分享有关全平台硬件解码的渲染与优化的实践经验。

1、常规最好的措施渲染硬解数据

2)软解数据流

硬解OpenGL渲染的数据流原理与软解略有不同,解码过程中的数据存储在显存上。这里需要强调的是,即使对基于统一内存模型的移动平台而言不一定指在物理显存,但移动平台会通过将内存映射给GPU与CPU来构建逻辑显存。解码后的拷贝、更新纹理、渲染与软解例如,数据流会分别经过主存、显存、显存。这里的解码在显存上的数据并不一定是硬解提供的相应解码输出而非各个平面的数据指针,我应该 系统需要将硬解出的数据拷贝至内存上并借助TexImage2D技术上传纹理。经过实践他们发现此最好的措施的下行时延 暂且高,例如在实测中他们借助软解流程可实现1030P全高清视频的流畅播放,而若借助DXVA硬解流程防止同一一一个多多全高清视频文件则会变得非常卡顿,没有如可来优化硬解流程呢?思路一是对显存与内存间的拷贝过程进行优化,例如在Windows上较为出名的LAV Filters滤镜就使用了如SSEV4.1加速、多系统进程拷贝等,提升显著。但机会面对共同播放多个视频等较为僵化 的应用场景,内存之间的拷贝仍会影响整个防止流程的稳定运行。

接下来我将介绍D3D11硬解,D3D11硬解基于EGL提供的资源共享功能。而D3D可与OpenGL ES经常建立联系的因为是最早的Windows平台对OpenGL驱动的支持经常不佳,而火狐、Chromium等浏览器为了在各人环境下都能很好支持OpenGL,于是加入了一一一个多多由 Google发起的被称为ANGLE的开源项目。ANGLE是指用D3D9与D3D11的有些指令和(着色器)实现OpenGL ES与EGL所有接口例如的功能。除了使用ANGEL实现对OpenGL  ES的支持,哪些厂商也通过ANGEL实现对WebGL的支持。除此之外,有些如QT还有微软推出的Windows Bridge for iOS等开源项目都不 基于ANGEL Project,哪些项目都不 通过ANGEL Project实现OpenGL ES的调用。