云游戏超1亿小时稳定运行的背后,元境保障体系的最佳实践 | {$randkws}热点解读 以下为保障体系大图

来源:不好意思网 | 栏目:综合 | 2026-06-15 03:49:36

云游戏超1亿小时稳定管理的背后,元境保障体系的最佳实践

亮相时间:2022-02-22 13:32:04来源:逗游作者:逗游网

和平精英云游戏官方版和平精英云游戏官方版大型云游戏男生精选游戏和平精英云游戏
  • 游戏类别:枪战射击
  • 游戏大小:33.52M
  • 游戏语言:简体中文
  • 游戏版次:v4.9.2.3970405
访问查看 游戏专题

节假日一直是游戏行业的旺季,在“就地过年”的倡导下,春节期间的流量持续高涨,大多数游戏发行商相当重视这个时间窗口,众多游戏升级了新春版次,盼望着为玩家带来一场节日盛宴。2022年的春节,是中国云游戏产业走向规模化迎来的第一个春节。相比上一年,云游戏整体流量上升了很大一个台阶,这对行业价值重大,针对阿里巴巴云游戏/元境的技术及运维团队来讲,也将历程一个前所未有的考验。

2021年云游戏从点对点云化完整进入到大规模云移植阶段,技术的进一步成熟使得玩家感受大幅提升,云游戏在跨端、精品化025一加手机资讯信息革新等方面形成的价值日益突显,大批游戏品牌方在云游戏上加大投入力度。元境基于全渠道、全终端、企业级办事保障的特色,以及低延迟、云边合作弹性调度、弱网对抗等技术长处,达成了众多中大型客户的兴办,其中不乏头部、现象级的游戏品牌方和渠道。截至2021年底,元境累计办事的云游戏时长已革新1亿小时。

数字增长的另外,也对云游戏的管理效率、运维保障提出更高的请求和更完整的考验

考验一:云化适配与部署的效率和吞吐能力

春节期间,为提升使用者的活跃度及付费率,与元境兴办的多家游戏品牌方对其云游戏版次开展了升级,增多全新的人物、场景、成年人的友情:伤感文字促销等信息,升级的包体较大;而游戏渠道类客户则会批量启动和升级云游戏,启动数量多、时间集中。大包体升级、大批量云化、集中性部署,这些需求针对云游戏技术办事商而言考验很大。不只需要具备弹性扩容的基础设施,还要拥有更为智能化的技术计划。考验着办事商的云化适配与部署效率和并发吞吐能力。

考验二:高流量、红毯造型折叠屏繁琐场景的调度能力

春节期游戏流量高峰加之云游戏规模化上量,双重因素作用下,元境面临的核心课题是:如何在突发的流量高峰、繁琐的使用场景下,在极短的时间内把云游戏实例有效的调度给玩家,从而下降玩家排队时间、保障玩家流畅的游戏感受和稳定的管理生态。

揭秘元境“从云基座到业务层”的一体化保障体系

面对春节期间游戏品牌方、渠道、玩家等多人物的需要,元境技术和运维团队基于大规模高并发的企业级办事经验、专项7x24h实时监控、自动化操控系统等能力,清晨最适合读的一句话:爱自己是终身浪漫做到从云基座到业务层的一体化保障,出色地达成了百余家客户的云游戏稳定管理,保障了云游戏玩家流畅、稳定的感受。以下为保障体系大图。

自研云边合作弹性调度,确保以最近的节点高效办事玩家

要把云游戏的基础能力用好,需要投入一些新的开发岗位,过去的云端计算,其管理生态与基础条件相对规范化。而云游戏身为一个新的云端很重的计算任务,需要更低的延迟和更稳定的资料交互,这就需要将算力高效的使用起来,将基础设施的长处更好的发挥出来。

云游戏最轻松被提出来的考验是延迟高,在全部链路中浮动最大的是联网延迟,在这方面首要留意云主机离这个玩家多远、边缘部署多广泛,能不能找到离玩家足够近的节点。

元境基于阿里云在全国范围内可覆盖的数千个边缘节点,做到31个省管理商全覆盖,联网延迟可低于5ms。与此另外,元境在上一年相当重大的一个投入就是把边缘云和公共云真正的合作调度起来,把边缘节点的算力、存储等资源和云计算资源统一治理起来,形成“逻辑集中,物理分散”的高效合作。

正由于元境在云边合作上的投入,本年春节期间才得以在流量突增、运维岗位量增多和生态繁琐度变高的状况下,做到了更高的管理效率,保障了玩家的低延迟、流畅的云游戏感受。

针对游戏行业的特性提供专属的保障计划

春节期间,元境扶持了多家客户的大包体升级。通常状况下,云游戏版次升级会将其全量包体开展升级,但当升级包体较大且使用者数量较多时,受限于机房及带宽的容量和弹性,常规计划很难扶持。元境基于充足的机房、带宽及自研的升级计划,合作客户以增量的方式达成大包体的高效升级,在线上高流量的状况下,版次升级时长下降了80%,保障了游戏升级的及时性和可靠性。

针对渠道类客户,保障渠道上数百款游戏的云化适配、渠道云游戏批量启动的时效性相当重大。元境经由自动适配能力加之春节期间值班保障,分钟级响应客户升级适配诉求,全力保障云化适配的产量,提升云化适配的效率。

兴办云游戏场景下的AIOps智能运维大脑,保障客户业务的稳定管理

元境基于阿里巴巴主流AIOps理念,兴办云游戏场景下的智能运维大脑,从察觉故障,到根因确认,再到具体的修复动作,做到云游戏的自动化运维流程。

传统的运维岗位大多在事中和事后开展处理,运维岗位需要耗费众多的人力及物力,在传统方式下无法满足高品质的云游戏感受和大规模办事的诉求。所以元境运维大脑引入AI算力,经由软设备故障预测、测试的方式,来科学推动稳定性的岗位,分别在游戏管理生态表现衰退前和触发故障前开展提前处理。

诊断是一个根因确认的过程,相当强调领域知识,在元境办事的过程中,与阿里云IaaS团队共同确认各类软设备故障及修复计划,结合归因确认方法论,沉淀出一整套的根因确认计划。最后修复动作的挑选依赖充分的决策,即使在全自动化的方式下,由于各客户的业务场景各异,游戏管理生态的各异,也需要针对各异的触发源具备各异的修复策略,经由智能化决策能够有效地提升故障修复的时效性和有效性。

春节期间智能运维大脑日决策数千次,自动化疗愈率达到96%,极大的提升了云游戏基座的稳定性,在春节期间大规模扩量的状况下,为客户带来稳定的管理和玩家流畅的感受。

保障团队与管理方式:复用阿里双11的保障体系与渠道

为保障客户的云游戏在春节期间稳定管理,元境的技术及运维团队早在两个月前便着手制定作战打算。考虑到假期的各类作用因素,元境在智能化运维大脑的基础上,结合了阿里双11的保障经验,复用阿里双11的保障体系和操控系统渠道。前期从业务规划、容量筹备、隐患盘点、应急预案、表现完善、封网推动、可靠加固、值班合作等方面开展全方位的筹备岗位,把保障岗位在事前扎实筹备;保障期间开展多次故障场景与业务场景突袭演练,测试技术渠道的运维稳定性,以及人员的应急响应速度和品质;结合移动化的渠道工具,做到了掌间运维,高效合作。

与传统游戏的运维、管理都在品牌方这一侧各异,云游戏的运维和管理普通由办事商来达成,这就对云游戏的技术办事商提出了相当高的请求。

随着游戏产业信息精品化、管理全端化的需求日渐强烈,将会有更多游戏企业布局云游戏,云游戏产业将会迎来新一轮的增长。元境身为面向云游戏时代的研运一体化办事渠道,将会持续地在技术上、运维能力上做更多投入,不断提升自动化、智能化的运维水平,更好地扶持广阔的云游戏全球,为中国云游戏产业进入规模化时代提供有力的支撑。

上一篇:《绝地求生》新地图不按排名匹配 老地图无法自行选择

下一篇:《一起来扫雷》增强版登陆Steam 限时九折优惠

相关文章