面向人类的视频与面向机器的视频在应用场景、信息处理、编码和信息使用上存在着较大差异。面向机器的视频处理与编码技术研究正成为产业界和学术界热点,标准化需求提上议事日程。
中国电信基于自身业务和积累,针对下一代视频编码技术方向——面向机器视觉以及人机混合视觉的各类视频应用场景展开了研究。将5G、AI、深度学习、特征提取与视频分析等技术与现有视频处理、编码技术相结合。5G时代催生出面向机器的海量应用,如车联网、无人驾驶、工业互联网、智慧与平安城市、可穿戴、视频监控等机器视觉内容,相比日趋饱和的面向人类视频,应用场景更为广泛,面向机器视觉的视频编码将成为5G和后5G时代的主要增量流量来源之一。
在此基础之上,经过认真准备和产业互动,2019年7月8-12日#127 MPEG会议(ISO/IEC JTC1 SC29 WG11会议)上,中国电信视频监控专家张园提出了下一代视频编解码方向——面向机器视觉的压缩编码和面向人机混合视觉的压缩与语义表征的统一。经过多轮讨论和材料补充,达成共识。MPEG主席评价为极具价值、令人振奋。周五全会上,MPEG主席Leonardo正式宣布成立新的AHG VCM(Ad Hoc Group on Video Coding for Machines)机器视觉编码专家组。中国电信张园任召集人,美国Gyrfalcon公司Patrick任联合召集人。
新组获美国Gyrfalcon、奥地利Joanneum、德国Leibniz大学、北大、浙大、中科院计算所、华为、中兴等支持,获得大会主席Leonardo、需求组主席Jorn Ostermann,视频组主席虞露认可,Sony,NEC,软银,本田,三星,LG,InterDigital等表达了参与意愿,并获得中国代表团和国标委支持,MPEG对口组信标委多媒体分委会将向国内成员宣传推广。
VCM专家组的成立有望打破上一代视频编解码标准H.26x系列中国跟随发展局面,在下一代视频编解码标准并跑中聚焦VCM开启超越式创新;为5G与后5G时代网络提供新兴应用和可持续流量来源;支持中国国家AI发展战略;提升中国在MPEG与SC29影响力。中国电信将快速推进VCM标准,基于VCM标准,发展芯片产业,针对场景深挖应用,结合自身研发及业务,助力物联网产业发展。
MPEG作为视频关键核心技术标准,聚集了行业最主流企业和核心人才。40年来,孕育了主流数字媒体标准并推动了数字媒体产品、服务和应用的发展。MPEG催生了近180个标准,包括著名的H.264(AVC)、H.265(HEVC)和H.266(VVC)(制定中,2020年推出)标准。MPEG LA每年收取H.264专利费数亿美元,MPEG标准必要专利具有较高价值,涉及核心编解码的标准必要专利每个价值千万以上。
MPEG职位的获得是中国电信长期参与并被广泛认可的结果,这是中国电信在非传统电信标准化组织MPEG乃至ISO/IEC JTC1中的首次任职,必将促进智能时代产业的跨界融合与中国创新。
关于 Gyrfalcon Technology Inc.
Gyrfalcon Technology Inc.(GTI)是全球领先的高性能AI加速器开发商,采用低功耗封装,低成本和小尺寸芯片。是世界领先的低成本、低能耗、高效能的人工智能(AI)处理器开发商,由硅谷资深创业者和人工智能科学家创立。Gyrfalcon(海东青)是一种以飞行速度迅疾著称的鸟。GTI旨在推广云人工智能应用于当地设备的能力,提供更高的性能和效率,为新设备提供功效最大化的AI定制服务,让人工智能产业化成为可能。2017年,一村资本母公司华西股份(000936)联合华天科技(002185)对GTI完成了首轮领投投资。