视频解码器哪个好(手机视频解码器推荐)

随着通信和互联网技术的进步,特别是智能手机的普及以及4G、5G移动通信技术的成熟与发展,视频聊天、视频游戏等多样化的视频娱乐方式层出不穷,普通用户对视频的消费需求也在不断增长。2018年思科CISCO《视觉网络指数》报告预测,到2022年,82%的互联网流量将由视频创造。 除了日常生活中的娱乐交流用途之外,视频也正在更多行业场景中大显身手。比如,以视频技术为核心的安防领域、智能工厂中对工人行为的视…

随着通信和互联网技术的进步,特别是智能手机的普及以及 4G、5G 移动通信技术的成熟与发展,视频聊天、视频游戏等多样化的视频娱乐方式层出不穷,普通用户对视频的消费需求也在不断增长。2018 年思科 CISCO《视觉网络指数》报告预测,到 2022 年,82% 的互联网流量将由视频创造。

除了日常生活中的娱乐交流用途之外,视频也正在更多行业场景中大显身手。比如,以视频技术为核心的安防领域、智能工厂中对工人行为的视频监控与识别、辅助与自动驾驶中通过摄像头记录视频画面实时检测环境、以及近年来越来越多明星也下场参与的视频直播营销,等等。与此同时,随着 AI 领域计算机视觉(CV)技术的蓬勃发展,CV + 视频的技术组合将会在越来越多的应用场景中发挥不可或缺的作用。

手机上用AI实时、流畅解码视频:高通研发出首个神经视频解码器

然而,海量的视频数据对视频的传输、存储和其他处理带来了巨大的挑战。视频压缩、编解码等视频处理技术也就变得至关重要。在观看视频时,用户想要体验更高的画质和流畅度,这些都依托更高效的视频处理技术。多年来,计算机中视频解码的工作多由 CPU 来完成,这种方式易于使用但效率算不上很高。利用 GPU 解码视频是另一种选择。随着短视频等应用的兴起,在手机等移动端借助专用解码单元进行实时视频解码也成为了一种新的发展方向,对于视频直播等实时性视频服务具有重要意义。

与此同时,随着 AI 领域深度神经网络的发展,越来越多的企业探索如何使神经网络赋能自身产品。高通骁龙 SoC 中的 AI 引擎就充分融入了神经网络能力,其中的硬件组件 Hexagon 向量处理器支持 8 位定点加速神经网络运行,软件组件骁龙神经处理(SNP)SDK 支持 CNN、LSTM 与自定义层。

旗舰 SoC 骁龙 888 集成的第六代高通 AI 引擎更是实现了 26 TOPS 的 AI 算力,神经网络处理 SDK 带来一系列改进,增加了对 RNN 模型的支持,助力手机端侧 AI 性能提升至了全新水平。

那么,有没有可能将 AI 引擎蕴含的巨大算力更广泛、更深入地应用于视频领域呢?最近,高通就在这方面做了更多的尝试,利用骁龙 888 内置的 AI 引擎和 CPU 进行视频解码。结果发现:基于神经网络的神经视频解码效果还不错。

高通 AI 研究院的新工作,实现了业界首款在商用智能手机端实时运行、基于软硬件结合的神经视频解码器,在接近 720p HD 分辨率的视频上实现了 30 fps 以上的实时解码。

手机上用AI实时、流畅解码视频:高通研发出首个神经视频解码器

从软 / 硬解码到 AI 神经视频解码

作为一项重要的视频处理技术,视频编解码广泛应用于通信、计算机与广播电视领域,并催生了网络电视、广播电视、数字影院、远程教育和会议电视等一系列实际应用。

就主要作用而言,视频编解码技术是在可用的计算资源内,追求尽可能高的视频重建质量和尽可能高的压缩比,以达到带宽和存储容量的要求。视频编解码器则是一种能够对数字视频进行压缩或者解压缩的程序或者设备。

很长时间以来,基于 CPU 的软件编解码技术(也称软解码)一直主导着市场,如英特尔内置于其 CPU 中的视频编解码引擎以及开源软件 FFmpeg 中的 libavcodec 解码器,虽然易于使用,但会占用 CPU 资源,提升功耗,编解码效率不高,容易出现卡顿、花屏等异常,影响其他应用的正常运行。

因此,利用 GPU 或者专用处理器来对视频进行编解码(也称硬解码)成为另一种选择,如英伟达推出的基于 GPU 的硬件解码器模块 NvCodec,不仅可以实现良好的编码性能,而且使用显卡编码不会占用太多系统资源,也就不会影响应用的使用性能。

但是,日益增长的视频消费需求对未来的视频编解码器提出了更高的要求,应该具备以下功能:

  • 比特率和感知质量指标的直接优化
  • 简化的编解码器开发
  • 内在的大规模并行性
  • 高效执行和更新已部署硬件的能力
  • 可下载的编解码器更新

随着深度神经网络(DNN)技术的显著进步及其在计算机视觉和通信系统领域的广泛应用,基于神经网络的视频编解码器有可能提供所有上述期望的功能。具体来说,这类视频编解码器不仅可以在为其他 AI 应用开发的 AI 硬件加速器上运行,还能实现更高效的熵编码并行化。

在这种潜力的驱动下,过去几年神经网络视频编解码器成为了研究热门,如 2017 年谷歌提出的 Hyperprior 自编码器、18 年上海交通大学等机构提出的端到端深度视频压缩(Deep Video Compression )框架以及 2020 年谷歌研究院感知团队提出的用于端到端优化视频压缩的扩展空间流(Scale-Space Flow)。这类神经视频编解码器展现出了令人瞩目的压缩性能,并缩小了与传统编解码器之间的差距。

手机上用AI实时、流畅解码视频:高通研发出首个神经视频解码器

基于 AI 的压缩具有绝对优势。

但还应看到,将 AI 研究从实验室带到实际应用场景往往并不容易。这也意味着,神经视频编解码器的实际部署面临着很大的挑战。大多数相关研究利用具有浮点计算的壁式驱动的高端 GPU,并且神经网络模型架构往往没有针对快速推理进行优化。因此,对于具有固定计算、功率和温度约束的移动设备而言,在这类神经网络解码器模型上运行实时推理不切实际或不可行。

在骁龙 888 SoC 的商用智能手机上,高通 AI 研究院在基于软硬件结合的神经网络视频解码器方面实现了新的突破。

利用骁龙 888 的 CPU 和 AI 引擎,实现 30+fps 的高清视频解码

凭借在节能 AI 方面的专业知识以及骁龙 888 平台的强大 AI 算力,高通在商用智能手机上实现了实时帧内神经视频编码。高效率视频编码(HEVC)中的帧内编码可以视为高端视频编码(AVC)的扩展,它们利用空间上的取样预测来编码。帧内编码过程与帧间编码共用部分的处理步骤包含转换、量化、熵编码等。为此,高通 AI 研究院在以下几个方面进行了优化:

重新设计网络架构以降低复杂度;

在 AI 推理引擎上量化和加速神经网络;

利用并行熵编码。

基于以上几个方面的优化,高通利用骁龙 888 移动平台上的 CPU 和 AI 引擎,开发出了一种基于软硬件结合的神经视频解码器,以超过 30fps 的速度解码了分辨率 1280×704 的高清视频,并且无需视频解码单元的任何帮助。骁龙 888 集成第六代高通 AI 引擎,作为一整套处理器协作系统,这代 AI 引擎包含了重新设计的 Hexagon 780 处理器,将 AI 全方位赋能极速通信、专业影像、游戏体验等诸多方面。

手机上用AI实时、流畅解码视频:高通研发出首个神经视频解码器

具有高效解码性能的 8 比特模型

解码器架构优化、并行熵解码(PEC)和 AIMET 量化感知训练是高通 AI 研究院实现智能手机端高效神经编码的三个重要步骤。

手机上用AI实时、流畅解码视频:高通研发出首个神经视频解码器

第一步,基于一个 SOTA 帧对压缩网络,通过剪枝通道和优化网络操作实现了解码器架构优化,依靠骁龙 888 内置的 AI 引擎进行加速,降低了计算复杂度。

第二步,创建一种快速并行化熵解码(fast parallel entropy decoding)算法。该算法可以利用数据级和线程级并行化,从而可以实现更高的熵编码吞吐量。在高通的方案中,骁龙 888 的 CPU 用来处理并行熵解码。

第三步,优化后模型的权重和激活量化至 8 比特,然后通过量化感知训练来恢复速率失真带来的损失。这里用到了高通创新中心开源的 AI 模型效率工具包(AI Model Efficiency Toolkit, AIMET),该工具于 2020 年 5 月推出并开源,是一个支持神经网络模型训练的高级量化和压缩技术的库。

通过这三个步骤,高通 AI 研究院构建了一个具有高效解码性能的 8 比特模型(8-bit model)

AI 解码的效果

在 Demo 设置中,高通 AI 研究院选取了分辨率为 1280×704(接近 720p HD)的视频,通过离线运行解码器网络和熵解码生成压缩的比特流。接着,压缩的比特流通过骁龙 888 移动设备(商用智能手机)上运行的并行熵解码和解码器网络来处理,其中并行熵解码在 CPU 上运行,解码器网络在第六代高通 AI 引擎进行加速。

手机上用AI实时、流畅解码视频:高通研发出首个神经视频解码器

最终,高通 AI 研究院得到了一个神经解码算法,在 1280×704 分辨率的视频中实现了每秒 30 帧以上的解码速度。如下为商用智能手机上神经视频解码的动态演示,右上角为视频解码速度(Speed)和同一视频帧内的迭代次数(Loop),右边为运行时平均比特率(Bit Rate)和视频每帧图像中每单位像素的平均码流(Bits per Pixel per Frame, BPF)。

在 Demo 演示中,视频和解码参数被设置为高质量,并选取了一系列具有挑战性和精细纹理的自然场景。在实现 30 帧以上解码速度的同时,丰富的视觉结构和纹理都借助神经解码网络准确地保留了下来,实现了非常好的场景重现。比特率符合全帧内(all-intra)配置和选取的质量,表明这一神经视频解码器能够支持高质量视频流所需的数据吞吐量。

手机上用AI实时、流畅解码视频:高通研发出首个神经视频解码器

由于基于 AI 的编解码器可以生成比特流中没有的视觉细节,因此与传统编解码器相比,相同或更高质量视频的比特率应该会低一些。这也意味着视频编解码器将变成软硬件结合驱动的,任何新的编解码器都可以由 SoC 中的 CPU 和内置 AI 加速器处理,只要它们足够强大。

目前,这一神经视频解码器只支持帧内解码,这意味着每帧视频都是独立解码,不需要像其他视频编解码器那样考虑帧之间的微小变化。据悉,高通还将继续致力于研究移动设备上实时运行的帧间视频解码。

就此项研究的意义而言,虽然在骁龙 888 SoC 上实现 30 fps + 高清视频实时解码依然有提升的空间,但手机端侧 AI 算力和影像能力的释放,能够为手机用户带来更丰富的视频应用以及更清晰流畅的观看体验。比如近期最新发布的骁龙 888 Plus 移动平台,虽然仅仅是在骁龙 888 基础上做出了部分升级,但其 AI 算力已经达到了惊人的 32TOPS,进一步大幅度升级;再加上高通接下来的持续深入研究,可以预见的是,AI 的高清视频实时解码能力将很快进一步提升。

除了手机平台之外,高通也已将 AI 处理视频的各项能力引入了 PC、XR 和汽车等其他应用平台。比如全球首款 5G 扩展现实平台骁龙 XR2 的 AI 性能相较初代 XR 提升了 11 倍,大幅提升了视频处理能力;PC 端的第二代骁龙 8cx 5G 计算平台中,AI 能力加持的 Spectra ISP 支持了 4K HDR 品质的视频拍摄和背景虚化;第 4 代骁龙汽车数字座驾平台,增强了图形图像、计算机视觉和 AI 等功能,可以为驾乘者提供更智能和舒适的视频服务等体验。

因此,从更大的视角来看,利用 AI 算力进行视频处理代表了未来的一个发展方向,也势必会赋能更多应用场景。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

(0)
上一篇 2022年5月11日 下午1:53
下一篇 2022年5月11日 下午1:54

相关推荐

  • 共享充电宝有哪些品牌,2019共享充电宝品牌排行榜

    共享充电宝是指企业提供的充电租赁设备,用户使用移动设备扫描设备屏幕上的二维码交付押金,即可租借一个充电宝,充电宝成功归还后,押金可随时提现并退回账户。 2017年12月13日,共享充电宝入选国家语言资源监测与研究中心发布的“2017年度中国媒体十大新词语” 深圳街电科技有限公司成立于2015年,总部位于广东省深圳市前海深港合作区。 深圳街电科技有限公司提供移动充电解决方案——街电。街电是一种全新的…

    2022年6月7日
    650
  • 创业板上市标准是什么,创业板首发并上市条件说明

    创业板上市条件 创业板上市条件创业板公司首次公开发行的股票申请在深交所上市应当符合下列条件: (一)股票已公开发行; (二)公司股本总额不少于3000万元; (三)公开发行的股份达到公司股份总数的25%以上;公司股本总额超过4亿元的,公开发行股份的比例为10%以上; (四)公司股东人数不少于200人; (五)公司最近三年无重大违法行为,财务会计报告无虚假记载; (六)深交所要求的其他条件。 拟上创…

    2022年6月25日
    830
  • 创业成功经历故事分享,创业成功人士的简短案例

    几个名人创业的励志故事和成功案例: 联想集团创始人柳传志的创业故事 20万,11个人,一间破传达室,当年的柳传志根本不知道为何要成立公司,随大流下海创业。为了发工资,他带领所有员工当过“倒爷”、拉过板车、在中关村摆过地摊,卖过的商品琳琅满目,包括运动服、电子表、旱冰鞋、电冰箱。被认定投机倒把罚款100万,被认定走私罚款300万,40多岁的他,仍旧还没有找到人生的方向。而如今的联想已经成为民族计算机…

    2022年8月8日
    450
  • 发布外链的平台有哪些,外链在线发布教程

    想知道白seo发外链的有效方法,首先就要明确什么是外链,以及外部链接对seo能够起到什么样的作用,其实随着目前互联网的发展趋势,外链虽然说对网站起不到一个至关重要的作用,但是却还是有他本质上的作用,对提高网站的权重,质量,都有一定的帮助,那么到底是通过什么方式来发布网站外链才有效呢? 1、发布外链账号注册 发外链肯定是需要到各个平台上去发的,那么该如何发呢,这是有一点小小的讲究的,当你在一个企业网…

    2022年6月5日
    650
  • iphone怎么备份通讯录,iphone备份数据步骤流程一览

    iPhone数据备可以通过苹果提供的iCloud备份设备上的数据,也可以通过连接到电脑用iTunes帮我们备份数据。 使用iCloud备份数据 1、找到iPhone上的“设置”,点击打开,然后找到“iCloud”。 2、点击打开“iCloud”,下滑,选择“备份”。 3、选择打开“iCloud云备份”。“iCloud云备份”功能开启后,当设备接入电源、锁定且接入Wi-Fi时,将自动备份数据,如照片…

    2022年6月17日
    710
  • 无线传屏器怎么使用,其功能及使用方法介绍

    无线同屏器可以将手机或是平板同屏到电视,现在有专门的一种同屏器,如果你的电视有带HDMI,只要买个同屏器就可以了,比如你的手机是安卓4,2的系统,一般在设置-显示-无线显示,系统有这个无线显示功能再买个同屏器就可以把手机或是平板电脑的内容全部同屏或是把手机里的视频推送到电视或是投影机里,买同屏器的好就是第一没有线,第二是不像线一样受长短影响,一般同屏器距离都会达到5米左右,基本上客厅或是会议室都能…

    2022年7月30日
    900
  • 为什么废品回收会火爆,揭秘废品回收业务火爆原因

    一年一度的“双十一”购物狂欢节刚刚落下帷幕,“12·8”、“双十二”又接踵而至,网购狂潮不断。近日,记者走访城区部分废品回收站了解到,最近废纸壳的收购量比平时明显增多,其中多数是快递包装。据了解,“双11”过后,快递包装在使用一次后,剩下的包装箱、泡沫箱等包装材料,几乎都成了垃圾,这让废品回收站的生意火了一把。 里三层外三层市民拆个包裹真费劲 12月4日,快递员打电话告诉家住薛城区福泉小区的张女士…

    2022年7月30日
    800
  • 养殖什么最赚钱,适合农村的4个养殖项目

    对于生活在农村的朋友们来说,想要依靠养殖项目赚钱是一件非常有优势的事情,那你知道2020年小成本在家养殖可以养什么吗?这4个项目很赚钱! 1、兔子养殖 兔子的繁衍速度比较快,一般养的好的话,基本每月都会孕育出小兔子,养殖利润也非常大,养殖兔子时要做好管理工作,期间注意不要让兔子腹泻,现在市场上有肉兔和獭兔两种,如果兔子肉在当地不是很普遍,就可以考虑养殖獭兔,靠它的皮毛挣钱。 2、泥鳅养殖 泥鳅是一…

    2022年8月9日
    670
  • 手机短信删除了怎么恢复,最简单的恢复短信记录技巧

    手机短信删除了怎么办?删除的短信如何恢复?这已经不是一个新鲜的问题,我们常常为此大费周章,寻找可以利用的有效途径,帮助恢复手机删除短信,这也是小编写本文的目的,这里将用最简单的方法详细解读手机删除短信恢复过程。 iPhone删除的短信如何恢复 软件使用:互盾苹果恢复大师在文件扫描上做到了极致,可有效地针对iPhone设备进行数据备份和恢复,恢复包括联系人、短信、图片以及微信聊天记录iPhone设备…

    2022年6月15日
    690
  • 中国营销大师有哪些,带你了解中国最牛的营销大师

    今年,手机界可以说是炸开了锅,随着购机人群的不断下降,各大厂家可以说为了保住市场,可以说是使劲了九牛二虎之力,甚至不惜“生死看淡,不服就干!” 不敢,有一家厂商倒是过得挺滋润的,那就是8848,“成功并不是高瞻远瞩,而是你本来就站在高处,运筹帷幄,掌控未来,这才是8848,这才是胸怀天下!”相信大家也一定被这句广告词洗脑过! 8848虽然销量不高,可耐不住他卖贵啊!就拿M3尊享版来说,机身内存12…

    2022年6月3日
    840

发表回复

登录后才能评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信