来源| Tech星球
文| 习睿
在过去,“计算”一词对于大多数人而言太过专业。一行行代码看上去很冰冷,似乎无法与日常生活产生交集。而现在,算力开始成为一个时代的基础设施。
今年“双11”,消费者可以顺畅地在天猫淘宝中刷视频、看直播购物,甚至在仅有 85 克重量的AR眼镜中聊天、办公。前端越来越小,却可以承载越来越多的内容。
这背后,离不开各大云服务厂商对技术的不断迭代。而回溯历史,阿里巴巴是国内首个布局云计算的科技企业。
十几年间,从“去 IOE”到虚拟化架构的全面升级,从初涉容器到全面容器化,从支撑“双11”到疫情期间创下扩容纪录,阿里云原生体系不断演化,形成了庞大的“计算”家族。
一定程度上,从阿里云的发展历程就能看到云计算行业的发展历史。
早期从xen到kvm的虚拟化架构演进,再到云厂商自研芯片和CIPU云基础设施处理器,由软件到硬件,云计算行业正驶向下一个新阶段。
在2022年的云栖大会上,阿里云自研CPU芯片倚天710、下一代云计算体系架构CIPU等核心技术惊艳亮相,同时,正在构建起云计算行业发展的第二条技术增长曲线。
站在这一时间点,下个十年,云计算将会开创怎样的星辰大海,成为新的命题。
2009-2015年:艰难的“去IOE”
“云计算”这一概念在上个世纪便被提出,直到2006年,亚马逊 AWS 发布了 S3 和 EC2 后,才正式拉开了云计算的大幕。云计算开始进入萌芽阶段。
当时,云计算在国内并不被互联网界看好,属于“技术无人区”。只有阿里“一意孤行”,成为国内最早布局云计算的企业。
实际上,阿里对云计算的率先探索也是被业务“追赶”。IBM的小型机、Oracle的数据库、EMC的集中式存储设备,是当时互联网企业IT系统的“三大件”(统称为“IOE”)。
曾经,包括阿里在内的互联网企业都极度依赖IOE。但当时阿里零售业务对计算的需求成指数级增长,以IOE为基础的IT设施将会拖累业务的发展。
阿里开启了轰轰烈烈的“去IOE”进程。2009年2月,阿里云飞天团队在北京一间简陋的办公室里,写下飞天操作系统的第一行代码,这是阿里巴巴探索算力的起点,也拉开了中国自研云计算操作系统的序幕。
但技术革命比想象中艰难,所有人都在摸石头过河。阿里云团队所承受的质疑也比以往更猛烈。在飞天系统尚未稳定时,阿里云团队更多的是沉默。
最终,在2013年,阿里集团最后一台IBM小型机在支付宝下线,正式宣告“去IOE”战役的终结。也就是在这一年,外界对于阿里云的各种不看好的声音才逐渐消失。
阿里云的“去IOE”也带动了一批公司从传统IT架构向互联网架构转型,并逐渐从互联网拓展到其他领域。2015年,国家铁路部官方售票网站12306 首次将车票查询业务部署在阿里云,为春运高峰分流了 75% 的流量。
从遭受质疑到被跟随,阿里云迎来了属于自己的高光时刻。而从行业看,这也意味着大家对于云计算这一概念的接受。“去IOE”不是简单的对IT系统软、硬件更新,而是用新的技术架构替代传统的IT技术和架构,是底层逻辑的迭代。
此后,阿里云一步步从无到有,自主研发分布式存储系统、飞天5K计算平台等硬核技术不断问世。业务驱动着阿里云成立,而阿里云最终引领着行业变革。
2015-2022年:“由软入硬”,云计算纵深发展
在互联网巨头都开始布局云计算后,云市场里各种产品服务、解决方案层出不穷,呈现“百花齐放”的发展态势。云计算开始落地并渗透在各行各业。
百花齐放的另一面是“跑马圈地”。自2015年起,阿里、腾讯等国内巨头纷纷加速扩张。但这一阶段依然属于云计算行业初期,不同云厂商之间的产品存在一定的同质化现象。云厂商们需要再次回归技术,生产具有更具差异化的产品。
而此时,软硬件协同架构设计的新理念已经在云计算领域流行,云厂商们开始重新审视芯片,硬件和软件的协同创新。体量大的云厂商服务器部署规模达到百万级别,意味着可以定制任何硬件,而要想收获软硬融合的技术红利,重要的前提是可以自定义芯片,自主研发硬件。
过去,云计算是由规模驱动软件技术的发展。现在云计算则进入了一个全新的阶段。去“IOE”之后沿用下来的算力体系正在迎来新一轮的变革,新型硬件和芯片的研发,成为云厂商们的重点。
2018年,百度率先发布昆仑1芯片,这宣告着互联网大厂“造芯”之路的开始。同年,腾讯领投了AI芯片初创公司燧原科技3.4亿元的Pre-A轮融资。其后几年,腾讯依旧以投资形式布局芯片领域,直到近两年,腾讯开始自研芯片。
和腾讯不同的是,阿里从一开始就以自研的方式跨进芯片领域。同样是2018年,在云栖大会上,阿里巴巴宣布成立“平头哥半导体有限公司”,正式进军芯片行业。
“平头哥”是蜜獾的别称,被称为“世界上最无所畏惧的动物”。而平头哥半导体承载着阿里构建“端云一体”的服务生态愿景。
2019年9月15日,阿里巴巴第一颗芯片含光800问世。
而从“一行代码没写”到“正式亮相”,平头哥只用了一年多时间。这个速度甚至快于英特尔、英伟达等芯片大厂。
这款芯片问世后,便有了实际的落地场景。阿里云的城市大脑在过去实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms。而使用含光800仅需4颗,延时可以降至150ms,大大提升了城市交通管理效率。
2021年,阿里巴巴发布首款通用CPU芯片倚天710。这是阿里第一颗为云而生的CPU芯片,如今也已经被部署应用到阿里云数据中心。就在今年的云栖大会上,阿里云宣布自研CPU倚天710已大规模应用。这意味着,阿里云的商业化进程又往前迈了一步。
此外,阿里云也是目前全球为数不多实现盈利的云计算企业之一。技术不再只是阿里的关键词之一,而是阿里的底色。技术与业务的关系也从“技术服务业务”变为“技术就是业务”。13年间,阿里云国际市场份额不断提升,国内排名常年保持第一。
下一个十年:云计算走向何方?
“为了无法计算的价值”,这是今年云栖大会的Slogan。而这句Slogan首次提出时间是在2015年的云栖大会上。
阿里云智能总裁张建锋也曾表示,“我们看到云计算进入了一个新的发展阶段,我们越来越接近于下一个时代,需要定义一个全新的技术体系。所以,今年我们最重要的策略是 B2B,就是 Back to Basic,回到云计算的本质。”
伯克利大学分别在 2009 年和 2019 年发表了一篇影响整个行业的论文。其中,在2019年那篇论文中,伯克利大学预测 Serverless 是云计算下一个十年的发展方向。
Serverless,可以理解为由开发者实现的服务端逻辑运行在无状态的计算容器中,它由事件触发,完全被第三方管理。Serverless架构可以帮助使用用户减少部署、提高扩展性,并减轻代码后面的基础设施的维护负担。
2017年,在国内,阿里云、腾讯云等云厂商就已经开始布局Serverless 。目前,阿里云已经拥有超过20款 Serverless 产品,包括函数计算、Serverless 应用引擎 SAE等。2020 年天猫双 11,阿里云实现了国内首例 Serverless 在核心业务场景下的大规模落地,扛住了全球最大规模的流量洪峰,创造了 Serverless 落地应用的里程碑。
在今年的云栖大会上,Serverless被放在了更高的高度。张建锋表示,Serverless化正成为全新的软件研发范式之一,阿里云将坚定推进核心产品全面Serverless 化。
除Serverles之外,低代码、AI大模型开源等趋势也开始显现,这些都深刻改变软件研发范式。而云计算也重构了整个IT硬件体系,数据中心、芯片、服务器等产业链都在发生深刻变化。
最近两年,层出不穷的新技术,如自动驾驶、元宇宙、合成生物学等,都将促使云计算的发展来到新的转折点。这些新兴领域,都对算力提出了更高的要求。这对于云计算厂商来说,需要有更具前瞻性的技术布局。
未来十年,云计算走向哪还没有答案。但可以确定的是,现在再次来到了需要技术变革的时刻。