火山引擎:构建面向异构算力的边缘计算云平台

边缘计算社区      2022-02-16     767

关键词:

导读

1月6日,“火山引擎产品技术大讲堂” 2022 年首期直播在线开讲,围绕"算力"主题,探讨多样化的算力应用与实践。


边缘计算产品负责人沈建发分享了火山引擎边缘计算如何解决万物互联时代异构算力行业发展及业务演进面临的挑战,揭秘边缘计算统一纳管异构算力,沉淀的平台能力和典型的场景应用。

  1. 万物互联的智能时代

  2. 构建新一代边缘计算云平台

  3. 字节跳动场景应用

  4. 未来展望


01

万物互联的智能时代

技术发展,从信息孤岛到万物互联

在正式进入异构算力的主题前,我们来回顾一下从信息化到智能化的发展进程。早期业务形态主要解决单点问题,主机/单机计算呈现信息孤岛的状态。随着 PC 端、移动端技术的发展,从人人互联,到人类既生产数据又消费数据,再慢慢到设备与设备之间的信息互联,万物互联的时代已然到来。

在万物互联时代,需要计算的数据越来越多,需求在不断的变化,异构计算能够充分发挥 CPU/GPU 在通用计算上的灵活性,及时响应数据处理需求,搭配上 FPGA/ASIC 等特殊能力,可充分发挥协处理器的效能,根据特定需求合理地分配计算资源,支持不同计算单元和场景。

业务发展,从内容触达演进为体验触达

从业务发展的角度来看,早期更关注内容本身,到后面直接参与互动的交互性,再到现在身临其境的沉浸式体验,用户对内容的形态诉求也在不断演变。

举个例子,字节跳动在产品上也在不断变化和推陈出新,从今日头条、抖音,再到现在涉及到家装设计的住小帮,还有专注 VR 核心体验的 Pico。应用也从早期的图文、点播,到实时音视频、直播还有 AR/VR 等。应用形态越来越丰富,用户对体验的需求也越来越高。视频内容的互动延迟需求从秒级进入到毫秒级,对交互性、沉浸式的体验也提出更高要求。

现阶段随着视频直播、实时音视频业务的全域覆盖,算力的需求也逐渐多样化。从 CPU 到 CPU+GPU,再到不同算力的异构单元,海量洪峰对网络的冲击,需要将大量的网络流量卸载到硬件上做 Offload,来降低 CPU 消耗,提高处理性能。加上 AR/VR、3D 等视觉应用越来越多,就近渲染、网络、算力的需求逐步显现,算力多样化开始成为互联网时代的新需求。如何统一纳管异构算力,构建新一代的边缘计算云平台,是边缘计算团队亟待解决的问题之一。


02

构建新一代边缘计算云平台

火山引擎边缘计算:用户和云中心之间的所有算力层

提到边缘计算云平台,首先跟大家分享一下我们对边缘计算的定义:我们把从用户到云中心之间所有的算力层都定义为边缘计算。

  • 首先,“现场边缘”主要位于用户现场或用户自己的机房。理论上主要覆盖 1~5ms 时延范围。我们可以将中心训练好的模型算法和能力下沉到用户的现场侧,满足超低延时的计算和网络能力。对应支撑异构算力的硬件设备有 x86/ARM、智能网卡、GPU、FPGA 等,应用场景主要是 AIoT、边缘时序数据等实时性业务

  • 其次,“近场边缘”,主要位于全国二三四线城市或城区节点,理论上主要覆盖 5~20ms 时延范围。对应支撑异构算力的硬件设备有:x86/ARM、智能网卡、GPU 等。常见的业务场景有:CDN、视频直播、实时音视频、视频监控和图像处理等。

  • 最后,“云边缘”,位于区域中心城市、提供多线及 BGP 汇聚节点,理论上主要覆盖 20-40ms 时延范围,可以跟中心云实现高效连接,为“现场边缘和近场边缘”提供汇聚能力,实现如:合并回源、并发处理等能力。对应支撑异构算力的硬件设备有:x86/ARM、智能网卡、GPU 等。常见的业务场景有:CDN 合并回源,视频直播的 L2 层转发、离线渲染业务、数据并发处理业务等。

基于以上我们构建了新一代边缘计算云平台。

新一代边缘计算云平台

通过采用云原生架构,火山引擎边缘计算构建了新一代边缘计算云平台。边缘计算云平台整体采用一横 N 纵的结构,一横是指基于边缘计算基础设施打造的云原生边缘平台,N 纵指具象化的服务能力,如边缘虚机、边缘容器、边缘网络、边缘函数和边缘渲染等。

  • 首先,在基础设施层,根据边缘算力的分布层级优选全国各省市丰富的边缘资源和运营商网络,并按地理位置部署优质的单线、多线和 BGP 的节点,结合多种架构的硬件设备,如:x86、ARM 服务器、智能网卡、GPU、Tofino( P4) 等算力和网络资源,打造面向异构算力的边缘基础设施底座

  • 其次,在平台层,基于边缘基础设施底座,火山引擎边缘计算自研了云原生边缘平台,以面向边缘云原生的操作系统为核心,提供边缘自治管理、核心系统组件管理以及大规模部署的镜像服务能力。

  • 第三,在资源服务层,边缘计算团队将云原生边缘平台模块化,通过自研网络组件提供多种功能,由此形成边缘计算资源服务层,可以按需提供不同的边缘能力,如:虚机、容器、网络、函数、渲染等一系列服务

  • 最后,边缘计算云平台配合云边管理数据管理模式,实现业务的全域智能调度、实时数据大屏,满足内容分发、视频直播、实时音视频、云游戏等多个场景应用。

目前新一代边缘计算云平台已在字节跳动支持多个场景的业务应用。

03

字节跳动场景应用

实时音视频

首先,在实时音视频场景中。

随着视频会议、在线教育等场景的普及,端到端之间实时互动的要求要越来越高。实时音视频可以借助边缘节点实现业务的就近接入,保证节点间低时延互联互通,提供高速稳定的实时音视频通信优质链路。

  • 边缘算力的弹性扩容能力能保障业务量突增时,视频会议中长会话的通信质量。

  • 边缘计算 GPU 实例还可以满足实时音视频中的渲染需求。

  • 高性能负载均衡可以支持实时音视频在边缘节点内高效东西转发,打通东西向流量。

  • 另外,多线、IPv4/ IPv6 双栈等也为实时音视频提供完整的能力保障,满足多人连麦、多人视频会议的低时延需求。


边缘渲染

第二,在边缘渲染场景中。

在边缘渲染场景中,如常见的直播特效、家装应用涉及的 3D 特效和 VR 看房等,在内容制作环节往往有大量的工程数据需要处理。边缘计算可以基于设计师所在地理位置就近提供服务,缩短工程数据传输距离,有效降低网络时延,提高业务渲染的实时性。

  • 对于一个 1G 项目工程文件,生成 100帧,每帧 300MB 图片的场景。中心上传下载需要 760 秒,边缘只需要 79 秒。边缘传输效率是中心的 9.62 倍。

  • 同时,通过全域节点的边缘算力资源和智能调度,能满足关键渲染任务的灵活切片,实现多节点并行渲染,提升渲染效率,加速内容创作的渲染周期以及快速发布工程作业。


云游戏

第三,在云游戏场景中。

云游戏场景中,用户对时延更加敏感。区别于端游、页游、手游和主机游戏,云游戏的游戏资源、运行、渲染都需要在云端完成,相当于用户在云端玩游戏。

云游戏业务依托全域覆盖的边缘异构算力,基于用户地理位置的亲和性,通过边缘智能就近调度,实现游戏指令毫秒级交互。同时,结合高密度的 ARM 集群、GPU 算力、弹性扩缩容、资源隔离等功能,支持多个云游戏实例并发运行,为终端用户提供无设备限制、稳定、高品质、超低时延的游戏体验。

VR 场景

第四,在 VR 场景中。

VR 主要是通过 720 度的 3D 全景视频为用户提供更加沉浸式的体验。为了降低 VR 的视觉晕动症影响,需要为用户提供超高清、超低时延的 VR 视频服务,也就意味着更高的带宽需求和更快的服务响应。

在实际场景中,人眼可视角度是有限的,即我们会重点关注当前可视画面的清晰度,周边区域及非可视区域画质对用户体验其实影响不大。通过边缘计算部署 VR 的媒体优化服务,可实时获取用户观看 VR 视频的头盔方向角度,从而计算用户的可视角度值,并以此智能选择传输和渲染的实时画面,最终实现用户可视画面高清传输,周边画面压缩传输,充分利用有限带宽,实现更加高清的 8K/12K VR 画面,保证用户获取优质的沉浸式体验。

安卓原生云

第五,在安卓原生云场景中。

  • 云手机可以分布部署在边缘云的各个节点中,通过智能调度,能有效提升用户互动体验,目前主要场景有云手游、云办公、云侧广告、IM 机器人等。

  • ARM 架构可以集成高性能显卡,并提供高效的图形图像转编码处理能力,结合智能调度和分布式边缘计算节点实现用户高效访问和极致使用体验

  • 同时,ARM 指令级兼容原生安卓云,通过智能调度满足用户就近接入需求,池化资源,降低用户使用门槛, 除此之外还支持批量创建、修改、删除,降低运营/运维门槛。


边缘实时渲染效果对比

最后,我们来看看手机端渲染和边缘端渲染的效果对比以及二者的区别。

(左边为手机端渲染,右边为边缘云渲染)

当前很多渲染业务都是直接在用户现场通过硬件终端来实现的,比如常见的基于用户手机的渲染。随着业务的发展,渲染的工程和种类对算力的需求越来越高。另外,用户终端的手机算力层级不同,常见的中低端手机很难满足相应的渲染算力需求,而用户对画质和特效的要求只增不减,因此我们对比了基于 GAN 算法的漫画风全图特效。

可以看到,在手机渲染和边缘云渲染的效果图中,边缘云渲染的细节还原度和色阶平滑度比手机渲染要更平滑自然,二者存在视觉可见的明显差距。

(左边为主播拍摄视角,右边为观众播放视角)

另外,引入云渲染后的网络时延想必也是大家关注的问题之一。对此,我们通过 RTC 将本地采集的视频数据传输至边缘计算节点进行渲染后返回,并在终端屏幕推送。右图可以看到,得益于5G+边缘计算节点的低时延特性,最终测试的端到端时延在100-150ms左右。对于直播场景而言,这个时延是可以接受的,对于网络直播的用户来说,影响不明显,但却可以通过边缘实时渲染的方式帮助应用实现更多有趣、沉浸式、创新性的玩法模式和更多的特效工程效果。


04

未来展望

目前,基于新一代边缘计算云平台的首款产品“边缘计算节点”已正式发布,并在 CDN、视频直播、实时音视频、云游戏、AR/VR 等多个场景落地。未来,我们也计划在智慧城市、工业互联网、智慧交通和影视行业探索更多的应用场景,希望携手各界合作伙伴一起,开放探讨边缘计算的更多可能性。让我们一起边创未来。

👇 戳我,查看更多产品信息!

助力极致体验,火山引擎边缘计算最佳实践

...的体验变得至关重要。近期,在“面向体验的视频云火山引擎增长沙龙”中,火山引擎边缘计算产品负责人沈建发分享了新一代创新算力解决方案,揭秘火山引擎边缘计算助力企业进一步提高用户体验& 查看详情

火山引擎成为全球边缘计算大会深圳站合作伙伴

关于火山引擎火山引擎是字节跳动旗下的云服务平台,将字节跳动快速发展过程中积累的增长方法、技术能力和工具开放给外部企业,提供云基础、视频与内容分发、大数据、人工智能、开发与运维等服务,帮助企业... 查看详情

算力网络—算力与异构计算

...算能力(ComputingPower),是一种智能的指标。人类的算力引擎是大脑,而数字世界的算力引擎就是各种芯片(e.g.CPU、 查看详情

openyurtv1.2新版本深度解读:聚焦边云网络优化

...端一体化”能力,能够快速实现海量边缘计算业务和异构算力的高效交付、运维及管理。在v1.2版本中,OpenYurt遵循社区提出的“节点池治理”理念,新增组件Pool-Coordinaot 查看详情

面向视频原生,火山引擎发布视频云与边缘云软硬一体的新云解决方案

12月2日,火山引擎在上海举办云产品发布会。除了推出计算、存储和网络的产品外,火山引擎也发布了视频云与边缘云软硬一体的新云解决方案,即云边端一体化边缘云基础设施,为用户体验而生的视频云服务... 查看详情

openyurtv1.2新版本深度解读:聚焦边云网络优化

...端一体化”能力,能够快速实现海量边缘计算业务和异构算力的高效交付、运维及管理。在v1.2版本中,OpenYurt遵循社区提出的“节点池治理”理念,新增组件Pool-Coordinaotr,提出了一套针对云边场景的资源、网络、... 查看详情

openyurt在龙源cnstack云边协同项目的应用

...资源,统一编排和调度工作负载,帮助客户高效构建高性能、高可用、高可靠和安全合规的现代化应用,提升企业数字化转型的整体效能。CNStack致力于帮助企业IT架构重组升维&#x 查看详情

openyurt在龙源cnstack云边协同项目的应用

...资源,统一编排和调度工作负载,帮助客户高效构建高性能、高可用、高可靠和安全合规的现代化应用,提升企业数字化转型的整体效能。CNStack致力于帮助企业IT架构重组升维&#x 查看详情

异构计算的网,铺成智能时代的路

...一个更加可靠的答案,那就是:“我全都要。”异构计算:不仅仅是多面手“我全都要”并非一种贪心,而是一种趋势。数字化建设的根源在数据,也在智 查看详情

算力网络算力网络的技术创新——算力基础设施关键技术

...文章目录算力网络的技术创新——算力基础设施关键技术构建灵活敏捷的算力底座云原生无服务器计算异构计算/多样性算力算力原生算力卸载存算一体打造更加泛在的算力分布边缘计算超边缘计算端计算       算力网络的发... 查看详情

从“一云多芯”支持,看多元算力的全栈云方案

摘要:华为云Stack如何在不同CPU架构下,构建信创云平台多元算力的全栈解决方案?本文将为你具体阐释。本文分享自华为云社区《从“一云多芯”支持,看多元算力的全栈云方案》,作者:徐安华为云Stac... 查看详情

超异构融合:边缘计算腾飞的契机

...限公司CEO黄朝波黄总来分享,黄总发表了主题为《超异构融合:边缘计算腾飞的契机》精彩演讲。分享嘉宾:矩向科技 黄朝波整理编辑:东北大学 郑童出品:边缘计算社区黄朝波:今天,很荣幸到这... 查看详情

算力网络—算力中心

目录文章目录目录算力中心算力中心的算力区域划分算力中心的部署位置划分公有云算力中心的特征边缘云算力中心的特征算力中心随着5G、AI、IoT、BigData、EdgeComputing等新兴技术逐渐融入人类社会,可以预见在不久的将来人类会... 查看详情

kubernetes资源拓扑感知调度优化(代码片段)

...态隔离,挖掘技术增量价值,平台承载了腾讯内部的CPU和异构算力服务,是腾讯内部大规模离线作业、资源统一调度平台。背景问题源起近年来,随着腾讯内部自研上云项目的不断发展,越来越多的业务开始使用云原生方式托管... 查看详情

火山引擎端云一体化服务:打造面向体验的视频云

12月2日,在「新云·共未来」云产品发布会上,火山引擎点播基础技术负责人马茜进行了主题为《火山引擎视频点播:端云一体化服务打造极致播放体验》的演讲。她以视频点播为例,分享了火山引擎视频云团队... 查看详情

火山引擎边缘渲染,驱动游戏体验升级

...”为主题的2023中国移动互联网行业峰会在南京举办,火山引擎介绍了基于边缘云的渲染新应用,持续驱动游戏体验升级,加速赋能泛数字化场景升级。火山引擎边缘云高级产品总监沈建发表示:“「激发创造࿰... 查看详情

云厂商之战,战至“边缘”

...  编辑丨伊页随着ChatGPT的爆火,人工智能产业对于算力的需求,迎来了空前的爆发。当前,以传统计算集群为主的算力解决方案,已然不能满足企业发展需要。一场关乎国内外云大厂的算力革命,正在被加速... 查看详情

算力网络—算力

...算能力(ComputingPower),是一种智能的指标。人类的算力引擎是大脑,而数字世界的算力引擎就是各种芯片(e.g.CPU、GPU、FPGA、ASIC)。在这些芯片上之上结合各种算法的运行,继而实现了一种人工的智能。从ENIAC诞生起,数字算... 查看详情