随着国内外形式的变化,“自主可控”成为国内上云的新追求,“自研”也成为To B服务商的一个新型考核标准。
作为国内市场份额排名第二的云服务商,成立6年的腾讯云也在此时决定推出第一款“自研”服务器星星海。从整个云计算市场来看,腾讯云此时推出自研服务器并不算早,因为无论是阿里云、华为云、百度云此前都推出过以“自研”为标签的服务器产品。
腾讯云为什么在这个时间推出自研服务器,这是否证明自研服务器市场还存在空缺?
腾讯服务器供应链总经理刘裕勋发布自研服务器星星海
从对腾讯服务器供应链总经理刘裕勋的采访中,钛媒体发现,腾讯云的星星海服务器走的其实还是差异化路线。功能上来看,阿里自研服务器神龙主打的是高性能计算场景,而华为云与百度云的则以AI切入。刘裕勋向钛媒体表示,星星海服务器提出了“为云而生”的概念,该服务器基于AMDA最新ROME平台定制,专门为公有云设计,企业用户可以以更低功耗、更低成本使用个性化的云计算资源。
满足公有云用户的“个性化”需求
刘裕勋看来,腾讯自研的星星海服务器其实是公有云需求以及产业互联网理念两相结合下的产物。
以往来看,为了追求更大的市场,满足各个行业对服务器的普适性需求,传统厂商做出的服务器会是各种功能堆砌出来产品,因此他们做不到对企业客户个性化需求的满足。而随着上云进程的推进以及产业互联网下沉,各个行业客户对服务器需求的个性化越来越凸显出来。
星星海服务器亮相腾讯全球数字生态大会上海站
星星海服务器的目的正是在这一条件下,满足不同行业客户对服务器的多样化需求,于是,腾讯云开始考虑对传统服务器“动刀”。
据了解,传统服务器为了将功能做到大而全,在用料上会显得比较“重”,而星星海的一大特点是在传统服务器的基础上做了精简。
“相比传统服务器,星星海用料精简超过20%。”刘裕勋介绍。他表示,这个精简体现在两个方面,一方面是重量的减轻,腾讯云在星星海服务器中采用了先进的日虹散热技术,换掉了传统服务器中较重的散热片,散热性能提高50%,这也同步促进了服务器能耗的下降。
另一方面,精减还体现在星星服务器去掉了那些公有云场景用不到的功能。“传统服务器很多功能不是为云(公有云)而做的。”刘裕勋举例,传统服务器为了达到高容灾的需求,会安装本地硬盘保证数据不丢失。但在实际操作过程中,即使是一块普通硬盘,每天产生的数据都会达到T级别,数据恢复起来往往需要几天甚至一周,这并不能满足互联网敏捷业务的需求。
为此星星海精简掉了传统服务器中的“本地硬盘”,采用无盘服务器架构,通过高效云盘CBS的分布式存储能力代替传统服务器中的本地硬盘。这不仅可以降低数据丢失率,同时也避免了本地硬盘遭遇故障后,数据恢复时效较长的问题。
星星海服务器介绍中,游戏是其主打场景
产业互联网下的软硬件协同理念
除了针对公有云场景,星星海服务器也贯穿了软硬件协同的理念。刘裕勋说,星星海中的自研技术实际上起到的是一个承上启下的作用,这里的“下”指的是AMD生产出的行业通用服务器,“上”指的是腾讯需要在服务器中构建的的计算、数据库、存储等多种产品。
钛媒体了解到,AMD ROME平台下对外发布的这一代服务器,单核CPU均为32核和64核,而腾讯深度定制的这款星星海服务器的CPU是市面上没有的48核。这是腾讯云兼顾服务器整体的内存及软件开销所做的决定。
公开资料显示,阿里云的自研神龙服务器是96核,华为云推出的自研AI服务器最高核数为32。为什么腾讯云的这款星星海一定要是48核,腾讯团队发现,只有在48核的情况下,服务器主频、核数以及性能可以达到最佳频率,如果换一个更高CPU服务器能耗就会上去,跟数据中心的贴合就会有一点问题。
刘裕勋做了个比较形象的比喻:“比如一张桌子能够坐10个人,如果这10个都是200斤的大胖子其实非常拥挤的,这个大胖子就相当于服务器中的高功耗、多核数的一个CPU。当这个胖子坐在那里的时候不会感觉到什么,但在实际运作过程当中,上菜也困难、夹菜也困难等一系列运营问题就会发生。”
打破了传统硬件按部就班的设计流程,因此软硬件协同对硬件如何创新也提出了更高的要求,需要硬件设计者用全新的视角考虑问题。“星星海不是一个KPI工程,所有功能都要现网实测,上面的软件和下面的硬件如果性能不达标,就需要精确判断到底是软件问题,还是硬件问题,各个产品团队要进行充分的沟通。”
经过一系列的软硬融合,星星海服务器可以支持NVME存储、HDD存储、高效能计算等多种应用,也可以应对未来3-5年的服务器产品演进。预计今年年底星星海的部署量会达到5000台左右,除夕夜的QQ或微信抢红包场景可能就会运行在星星海服务器上。(本文首发钛媒体,作者/秦聪慧)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App