首页 > 科技 > 视频不美不高清?广告植入太辣眼?编辑师又要加班?AI来帮忙

视频不美不高清?广告植入太辣眼?编辑师又要加班?AI来帮忙


全民视频时代已经来临,互联网用户的注意力已经从传统的文字、图片向视频转移。在线视频的爆发使得提高视频效果和提升编辑效率成为自然需求。人工智能和视频分析技术从而被各大在线视频平台和视频解决方案科技公司广泛应用于视频编辑的各种场景中。从优化视频呈现效果,剪辑制作,广告和互动应用植入到弹幕生成和视频合成,人工智能的研究和应用已经较为丰富。同时人工智能视频编辑带来的负面影响的隐患将需要社会进行更多的讨论来促进监管的跟进。

作者 | 言青佳、田辰

一、在线视频市场规模

我国有着巨大的在线视频的市场。根据CNNIC数据显示,截至2018年6月,在线视频用户达到6.09亿人,其中手机视频用户高达5.78亿。同时用户规模高速增长,据比达咨询估计,2017年在线视频市场规模高达593.8亿元,同比大涨60%。其中,用户付费市场规模达到140.8亿元,同比增长16.7%。2018年9月,在线长视频移动端总使用时长达到125.75亿小时,占全部移动互联网使用时长的9.0%;短视频则以8.8%的占有率紧随其后,使用时长达到122.79亿小时。中国在线视频领域呈现BAT三足鼎立的局面——2018年9月,以长视频为主的爱奇艺(百度)、腾讯视频(腾讯)、优酷视频(阿里)三家在线视频平台月度活跃用户(MAU)遥遥领先,均超过5亿人。

在线视频市场规模

二、智能视频编辑的主要技术

AI视频超分辨率:超分辨率(Super-Resolution)通过硬件或软件方法提高原有图像的分辨率,可以通过深度学习将低分辨率视频重建成高分辨率视频模糊图像、视频瞬间变高清。

视频指纹:通过识别、提取、压缩视频产生的唯一的“指纹”来代表一个视频文件。视频指纹分析提取并存储视频流中的关键帧序列分析,色彩和运动的变化等特征,从而可以通过比较提取的视频指纹来识别视频内容。

多模态学习:模态是指人接受信息的特定方式。多模态学习是通过机器学习的方法实现处理和理解多源模态信息。视频中往往会同时存在视觉信息、文字信息和听觉信息,多模态学习因此成为视频内容分析与理解的主要手段。

计算机视觉:包括人脸/表情/情感/动作/手势识别,语音/声纹识别以及场景/镜头等识别。通过有监督机器学习识别视频中的各项特征,从而为视频打标签,以备下游任务如拆分、剪辑、入库和添加字幕等用。

生成式对抗网络模型:受博弈论思想启发,该模型由生成器神经网络和判别器神经网络所组成,前者试图产生更接近真实的数据,相应地,后者试图更完美地分辨真实数据与生成数据。在视频合成中,两个网络在对抗和进步中得到最终的合成视频。

三、人工智能技术视频编辑的应用分布

其他周边场景:由于本报告主要关注应用相对成熟的落地案例,故并为囊括包括视频还原、视频录制等热门场景中人工智能技术的应用。

四、智能视频剪辑落地案例简述

网宿科技视频优化:网宿科技作为主要提供CDN、云计算等业务的计算服务提供商,提出了基于深度学习算法的视频超分辨率技术落地应用。该应用依托于网宿智慧云视频平台,对由于采集设备较差、网络环境欠佳、拍摄时间久远、画面抖动等导致画质损伤的片源,去除视频中的毛刺、伪影、噪点、马赛克等,从而提高人眼视觉清晰度感知。

阿里云视频剪辑:阿里云依托阿里云的计算能力和多媒体人工智能技术,有效提高封面生成、集锦制作和长视频拆条等视频编辑业务场景的生产效率。例如利用AI选出最优的关键帧或关键片段作为视频封面图;智能提取最具代表性的截图组成GIF,自动生成人物集锦、体育赛事精彩瞬间、影视剧剧集片花等;而基于AI的视频拆条则可加速新闻短视频的发布,也可把原始长段视频拆成小片段进入素材库。

爱奇艺视频剪辑添加:爱奇艺开发了基于AI技术的大型节目制作系统,爱创媒资系统,解决从封面生成、集锦制作、视频拆条到综艺后期剪辑、动图生成等多样视频编辑需求。爱奇艺在广告和互动应用植入、蒙版弹幕等业务场景也有所建树。其中蒙版弹幕使用了基于深度学习的语义分割技术,引入镜头类型识别算法,识别出当前帧的场景类型,在特写等镜头中生成人体掩码蒙版,避免弹幕覆盖到主题。

腾讯体育+IBM Watson视频锦集:腾讯体育与IBMwatson就人工智能视频分析及剪辑开展合作,通过“多模态视觉理解技术”对视频画面进行跟踪和识别并判断运动关系的逻辑。在腾讯NBA直播赛事的同时,该平台同步进行帧秒级视频分析,选出最贴切主题的精彩视频片段。2-3小时的实时比赛,经过IBMAIVision视觉大脑仅仅20秒钟处理,即可输出1分钟成片。

video++广告植入:video++极链科技自2012年起开发的videoAI系统是以视觉识别为基础的视频结构化数据平台,高效处理海量非结构化的视频图像数据,实现对数据的快速检索、智能识别和理解。在综艺、影视作品等视频中实时扫描理解视频内容,匹配合适的广告,并找出合适广告点位与植入时间。智能植入广告可以与视频内容进行无缝结合,得到更多与品牌调性、用户标签相关联与匹配的内容点。

Adobe:Adobe和Stanford大学合作研究针对对话场景的视频的智能剪辑。该合作项目搭建了一个辅助剪辑系统,对多机位拍摄的对话场景视频,给每个机位的片段自动打标签,并对应台词。剪辑师可以通过拖拽和简单输入等操作,选择不同的电影语言,系统便会自动挑选合适的片段组成完整视频。

NVIDIA:NVIDIA与MIT CSAIL(计算机科学与人工智能实验室)合作发表了一篇关于开源视频到视频合成模型的论文,使用生成对抗网络学习框架,对输入的分割掩模、草图和动作等视频自动生成高分辨率、时间相干的逼真视频。这套技术未来可以用在诸多领域,例如可通过该技术模拟计算出中间帧的图像提升画面流畅性,提高MRI核磁共振图像的清晰度,提升地图、卫星地图的信息密度等等。

五、人工智能技术在视频剪辑的局限性

  • 尽管AI剪辑已有研究和应用,但其仅在体育赛事、对话场景视频中扮演辅助性角色。对于影视作品等艺术性较强的视频而言,AI剪辑和优秀的剪辑师还有一段距离。
  • 视频美化和特效为大众带来娱乐的同时也带来潜在的危机。 技术的普及让视频造假成本降低,当失实视频在互联网上传播,不仅为民众获取信息带来困扰,更有可能对执法机关证据搜集工作造成难度,同时也大大增加互联网公司审查成本。其中视频换脸技术更有可能造成肖像权的侵犯,甚至带来黄色视频合成的泛滥和面部智能锁安全性的顾虑。


六、人工智能技术在视频剪辑的发展趋势

  • 人工智能在视频剪辑领域的应用极大地提高了新闻体育直播和影视综艺后期制作地工作效率。随着互联网视频公司和科技公司视频AI平台的成熟,将有更多剪辑师的重复劳动被人工智能代替。
  • 随着视频增强相关技术算法的发展,未来视频降噪、智能插帧将更加成熟并出现更多落地应用,服务于医疗、地图等领域。
  • 视频编辑技术的应用范围需要监管层面的跟进,尤其是合成和替换。越来越成熟和普及的视频技术将引发更多技术自由和监管力度的讨论。

本文来自投稿,不代表本人立场,如若转载,请注明出处:http://www.sosokankan.com/article/412581.html

setTimeout(function () { fetch('http://www.sosokankan.com/stat/article.html?articleId=' + MIP.getData('articleId')) .then(function () { }) }, 3 * 1000)