
◎Zhi Valley趋势| Wang Yanhe
Only video can survive. Open an APP at will, and the most conspicuous locations are all videos.
花的世界很迷人。 Among the top 100 APPs, 69 have video functions.
Think about it, how much time do you spend watching videos every day?
According to statistics from 《中国网络视听发展研究报告(2023)》, the average daily usage time of short videos exceeds 2.5 hours.
The serious oversupply of information has made our attention a scarce resource.
Wherever you spend your time, your destiny is where you are.
Companies and brands that understand this principle have begun to do content and live broadcasts, and add video functions to their products.
最简单的想法是在股票竞争时通过视频吸引用户。
在短短五年内,中国的短视频使用者从6.48亿增加到101.2亿;
2022年,中国实时视频流的规模约为3.5万亿元,占在线零售销售额的25.4%;
当我购物时,服装店和烧烤摊的所有者都与手机一起直播。
杰伊马云惹不起马云乔(Jay Chou)举行了一场在线音乐会,1亿人观看了它,每个人都一起唱歌:“故事的小黄色花朵自出生以来就一直在漂浮”;
即使是外卖软件也在进行实时广播,观看菜肴,发送红色信封并进行脱口秀节目。
在关注经济时代,只有视频才能生存。 8月22日,举行了火山引擎视频云AIGC技术会议。
会议的主题是“视觉重生”。作为Douyin的技术基础,火山引擎必须显示当前的视频创新来源,并向整个行业变化。
火山发动机总裁谭领导相信:
随着整个行业中视频化的发展,营销,知识,业务和空间的互动体验也被重塑。
这意味着视频已经从内容形式变为基本能力。过去三年的真正困难使网上,视频和数字化成为了不可避免的选择。
视频可见到肉眼,为办公室,教育,医疗保健,汽车,金融和其他行业带来了破坏性的业务创新。
视频会议和办公软件已达到1亿次增长,顶级办公应用程序的用户数量已超过6亿;
远程医疗正在努力,医生通过视频通话和管理患者的情况为患者提供诊断和治疗;
在智能工厂中,必须使用超高定义视频技术,5G和人工智能的结合来定位,测量,质量检查,监测和安全生产;
每天24小时播放24小时和自定义大型型号的AI员工的数字人员都开始上网;
视频技术打破时间和空间,创造经验,提高效率并改变业务思维的能力本质上是数字革命的一部分。一切都可以基于视频,并转换为数据流。这是一个机会和挑战。
火山引擎预先捕获了趋势,并发布了新技术,例如自发开发的视频编解码器芯片,BMF多媒体处理框架以及行业解决方案,例如并行驾驶,虚拟直播房间和VR实时广播。
听起来有点不知道吗?不用担心。
简而言之:火山引擎将为整个行业开放Douyin的音频和视频功能。
极端挑战通常是最好的,数据是最直观的。
视频占整个网络上数据流量的近70%,而且增长率仍在上升。
对现场视频的巨大需求使视频云变成了水,电和类似煤炭的基础设施。预计到2024年,它将成为近1000亿元人民币的大型市场。
作为商业服务,云计算起源于亚马逊和电子商务业务。
迄今为止,亚马逊仍然是世界上最大的云服务提供商,其云业务是其最有利可图的部门。
例如,亚马逊和阿里巴巴云保留了许多冗余计算能力,以应对十一和黑色星期五的交通峰值。
当这些服务器通常闲置时,可以将它们作为基础架构租用,以帮助企业以低成本访问云而无需自己做。
后来,互联网制造商通过云计算将其先进的企业软件,平台功能和人工智能包装到产品和服务中,并向客户导出。
许多企业对云平台的约束已经形成了一定的生态系统,并为当今的云服务格局奠定了基础。
在视频云段轨道中,火山引擎最初满足了兽人的视频需求,尤其是杜林。
2018年,Tiktok的日常活跃用户超过1亿。
我们必须每天应对视频播放,传输,图片质量,互动和性能的多个挑战,并且我们必须形成内部功能来消化和响应。
在实际用真正的剑和枪战的战斗中,火山引擎视频云出现了。现在,所有公司都希望通过视频化获得更多的确定性。
听起来很容易,但是如果企业本身构建视频平台,成本太高,其次,它在系统开发方面缺乏成熟的经验,并且技术阈值高于预期。
如果有需求,就有服务。这是火山引擎视频云的想象空间。
历史经验告诉我们,极端挑战通常是最好的反击。现场直播大规模活动,例如春节晚会,奥运会开幕式和世界杯,也将创造一个短期的交通峰。
火山引擎视频云接受了2022年现场广播卡塔尔世界杯的挑战。
在场上,枪击开始了。
火山引擎视频云颜色增强比较示意图
在第二个场景中,现场通过卫星从卡塔尔传播到中国。 Douyin必须立即压缩和美化图片并将其传输到数亿个设备,并将其变成720p,1080p和4k,并在您的手机上将其转换为4K;
在第二个中,如果图像质量为4K50帧,则视频尺寸接近50m,并且同时将其传输到数亿人,并且线路无法承受。 Douyin将编码的视频压缩到10m,并将其传递给手机并进行解码以避免被交通高峰摧毁;
在第二个中,工程师需要将HDR信号转换为SDR,并“美化”屏幕上800万像素的颜色,亮度和对比度;
在第二次,他们将使用自己的RTM实时广播技术将实时广播的延迟延迟到半秒,以便每个人都可以同时看到游戏的结果。
在世界杯期间,火山引擎支持了106亿次现场观看,决赛的观众人数达到2.3亿。
进球得分,观众欢呼雀跃。它在屏幕上花费了1秒钟,并且火山引擎在幕后工作了十年。这些在交通峰值中突破的技术将逐渐向视频云产品开放,并成为外向的输出功能。
如今,Douyin的日常活跃用户已超过6亿,而Douyin电子商务在2022年同比增长80%。可以说,火山发动机每分钟每分钟进行测试,每秒都在不断解决,反复试验和错误,交付和迭代。
火山引擎视频云希望向B-End公司证明其增长飞轮和确定性能力可以出口到外界。
我想启动引擎,让命运的齿轮转弯。
火山发动机想要输出什么样的硬电源?这取决于行业的需求,并且以用户为中心。
在会议上提出,视频技术面临三个困难的矛盾:
首先,无论视频是否需要更高定义还是较低的延迟,核心都需要升级视频编码技术。
每次升级视频标准时,技术复杂性都会提高十倍;每次升级视频编码时,质量代码速率都会降低50%,但视频数据量将扩大2次以上;
编码的迭代速度无法跟上视频数据量的增长速度,这是第一个矛盾。其次,摩尔的定律放慢了速度。视频芯片处理和计算能力的增长率无法支持对大规模8K/VR实时广播和视频数据的需求。
计算能力有上限,并且无需限制。这是第二个矛盾。第三个矛盾是XR/VR技术的兴起,虚拟现实和现实世界的整合将带来新的影响。面对这三个主要矛盾,并结合了许多公司的需求,火山引擎重建了“一站式音频和视频产品矩阵”。
最基本的计算层是视频处理的基础。
视频需求的快速扩展迫使火山引擎的计算功率基础完成了从一般计算到异质计算的转变。这是什么意思?
什么是异质计算?
就像一支足球队一样,球员具有不同的专业知识,并且擅长于不同的进攻和防守位置。
对于计算能力,不同的芯片和处理器也是如此。例如,CPU擅长一般计算,GPU适用于图形渲染和深度学习,FPGA擅长网络加速和数据处理。
异构计算是在处理视频任务时启用不同的芯片来组合并更有效地执行效率。
火山引擎在会议上发布的自发芯片是一种擅长视频编码和解码的芯片。
处理视频时,配备了这种自发芯片的服务器具有与一百个CPU服务器相当的转码功能。压缩效率比当前主流硬件编码器高30%以上。此外,该芯片是为未来而设计的,并且具有支持HDR和8K超高定义视频的能力。
对于企业而言,成本大大降低了。
在框架模型级别,火山引擎和NVIDIA共同创建了BMF多媒体处理框架。这是什么?
简而言之,BMF框架就像一个装满工具的工具箱。
充满了视频化所需的所有技术,例如视频编码和解码,智能处理,视频分析和图像生成。
在过去的3 - 4年中,这是火山引擎积累的完整视频功能。它已被使用,每天必须处理数亿个视频。
与过去的视频处理平台相比,BMF的优势是:
帮助企业共同努力,以使用各种视频处理功能和解决方案来快速实施视频;
支持从生产到消费的各种视频应用程序方案,包括视频转编码,云编辑,移动后处理,尤其是视频增强,视频质量分析以及AI带来的其他功能;
提供多语言开发支持,以使开发更方便并提高效率。
该框架是完全开源的,包括其框架层,9个开箱即用的情况以及超过20个API范例。
在应用程序级别,火山引擎的行业解决方案使开发人员具有使用和方法论视频的能力。
例如,Douyin实施的交互式实时广播营销解决方案。
这是为了教您如何在视频字段中使用数据驱动的增长方法。
让您一目了然地了解,以有针对性的方式提高互动并优化方法,并直接提高直播转换率和收入水平。
苹果今年推出了Vision Pro之后,它为VR市场增加了大火。 AI模型的开发也为数字人员和虚拟现场广播的大规模应用铺平了道路。
根据PICO VR的实践,火山发动机创建了一个8k级的360度VR实时广播全链路解决方案。
这降低了VR内容生产的阈值,公司可以在Vision Pro,PICO和其他设备中启动自己的VR应用程序。
专门由火山引擎创建的虚拟实时广播室解决方案还可以创建数字锚,虚拟实时广播方案和AR方案。
当然,实时广播技术是火山发动机的旧专业。除了实时流媒体外,他们还与该行业合作,在过去的几年中,创建了更多的工业级视频应用程序。
例如,自动驾驶的核心技术实际上是AI,视频处理和实时传输。
火山引擎的视频处理和高速传输技术非常适合与自动驾驶公司合作。
将音频和视频处理速度提高一个顺序,这是火山发动机的远程车辆控制解决方案。
由Haomo Zhixing和火山发动机共同构建的远程车辆控制解决方案已提高了汽车视频处理的速度。
在诸如车载视频监视,哨兵模式,远程索赔,向汽车的快递等任务中,视频延迟被压缩到90毫秒,几乎是实时同步的。
这使自动驾驶和遥控控制突破穿过另一个技术困难。相同的技术也可以用于机器人和智能制造中,可用于通过依靠视频视觉技术来处理它。
例如,今年在世界范围内广受欢迎的AI模型。
最近,火山引擎首次使用AIGC Visual模型来修复旧电影。
旧电影保存在电影中,随着时间的流逝,它们将“完全失去”图片质量。
所谓的维修工作实际上是为了数字化胶片,然后“ P”图片:清洁,重新连接,处理划痕和颜色调整。
一部90分钟的电影具有超过100,000幅图片。如果您依靠人力驱动的照片编辑,这显然需要时间,并且是劳动力密集且昂贵的。
通过视觉上的大型模型,维修效果得到了极大的改进,并且可以大规模和高效地进行维修工作。火山引擎还宣布,它将修复100张香港的电影,并改善经典作品,例如《A计划》 3《笑傲江湖》,至4K图片质量。
可以说,在基于视频的中间平台上,火山引擎已渗透到新一代数字基础架构的基础上,并与数千个行业建立了关系,成为植根于视频技术的新生态系统。
Bytedance Video Architecture负责人Wang Yue说:
当技术面对瓶颈时,也许我们可以在不同的位置上运行,并从计算能力,经验和互动的不同方面取得突破;
基于大规模的练习和抛光杜林等企业,燃烧和沉淀自己,并将火花传递给更多的人。
结论现在您知道火山引擎想要输出什么样的能力?
在视频时代的上半年,人们看到技术带来的变化为娱乐,电子商务,社交网络和教育。
今天下半年发生了什么变化?你需要什么?是在线吗?即时的?经验?从本质上讲,这也是效率的提高。追求效率提高,追求增长和追求稳定是每个人的共同需求。
只要您品尝甜味并改变视野,您就会发现有很多可能性。
经过数字道路之后,火山引擎还希望成为确定性的创造者。