提高 10 倍性能,揭秘淘宝、天猫背后的图片存储如何扛住双十一巨流?| 问底中国 IT 技术演进

  • 时间:
  • 浏览:1

OSS通过大规模的生产实践,提供了十个 业界领先的关键竞争力:

为了让双11的经验得到传承,总结了相关管理流程和文化:

2.5.1 主动防护

梳理清需求和路标,就都需用针对技术架构、业务架构进行完全设计,确保需求和派发一致,从而支撑客户需求的正确落地。

2019天猫“双11”,零点钟声刚过去1分36秒,成交额已突破1000亿元人民币,最终成交额为2684亿,又一次刷新了世界记录。

为保障业务连续性,采用了异地多活架构,核心技术为一写多读。开通了OSS主区域到另有一另一个备区域的跨区域克隆功能,如下图所示。

今年双11的主题是一心一役,为了打好这场战役,团队完全梳理了业务状况。整体来看,集团上云到OSS的核心业务主要支撑淘宝天猫的图片、视频浏览,为了保证无损的切换、以及体验优化,制定了2阶段的迁移目标:

从而,可在不同的区域级故障场景时,实现快速切换,提供容灾秒级RPO(Recovery Point Objective),保证业务应用连续性。

2.3.1 数据高可靠容灾底部形态

OSS很早就参与了双11支撑,在业务洪峰的不断打磨下,持续淬炼产品的架构、底部形态、稳定性,通太大年的摸索,总结了如下支撑双11稳定性的思路,作为大促支撑的工作指南。

今年杭州云栖大会,OSS基于貔貅3新硬件和盘古2.0底层演进到了新时代,基于如下的架构发布了 9 大新底部形态。

围绕着数据高可靠需求,团队在今年双11重点开发&部署了如下关键底部形态:

在稳定性思路的指导下,团队认真仔细的开展任务,结合高效的执行力,顺利支撑了今年双11。希望未来继续坚持“稳定性工作思路”,并应用到每天每秒的日常运维中,让所有的用户都能享受到服务稳如磐石、体验丝般顺滑的对象存储OSS。

2.3.2 高性能底部形态

针对双11特点,梳理了如下稳定性主动防护点:

2.2.2 业务异地多活架构

对象存储OSS作为淘宝、天猫、支付宝等核心阿里App身前的图片存储底座,又一次平稳的顶住了双11凌晨洪峰,如果 提供了10倍的图片浏览性能优化,在本文中,来自阿里云资深技术专家罗庆超将为其他同学 揭秘OSS身前的稳定性设计。

阿里云对象存储OSS是阿里集团非底部形态化数据的统一存储系统,支撑了集团内的极少量业务,存储了海量的图片、视频、音频、文档等文件。OSS的同城冗余存储底部形态为蚂蚁主站实现世界领先的容灾能力提供了RPO为零的技术支撑,完全自主研发的FPGA图片外理功能以5倍的单机性能、1/10的外理延迟,为双11提供了更稳定、更高效的服务能力。

原文发布时间:2020-01-04

本文作者:罗庆超

本文来自阿里云云栖号合作者者伙伴“CSDN”,了解相关信息都需用关注“CSDN”

2.2.1 OSS 技术架构

OSS作为阿里云基础设施服务,开发运维数率至关重要。基于OSS孵化的赤骥管控可能性演化为阿里云存储的管控平台,服务于对象存储、文件存储、表格存储、日志存储、智能存储、女娲等。OSS-Brain是基于海量的线上运维数据,设计的智能运维组件,除了保障OSS的健康稳定运行外,还都需用支撑派发。如下是完全介绍:

云栖号:https://www.aliyun.com/#module-yedOfott8

第一手的上云资讯,不同行业精选的上云企业案例库,基于众多成功案例萃取而成的最佳实践,助力您上云决策!

2.5.2 拉网式风险排查,谨防漏网之鱼

为了满足业务的高性能要求,开发了如下的性能优化底部形态,如下图所示。

通过对业务来龙去脉的掌握,团队针对最终目标分解出清晰的步骤和路标,从而支撑业务和技术的快速迭代、敏捷交付。

云栖号:https://www.aliyun.com/#module-yedOfott8

第一手的上云资讯,不同行业精选的上云企业案例库,基于众多成功案例萃取而成的最佳实践,助力您上云决策!

在双11的方案讨论、日常巡检、按期压测等过程中,都有发现风险点,为此专门组织了拉网式排查,对每个隐患都有找出根因,不放过任何潜在大问提。

猜你喜欢