云栖君导读:在5月16日的飞天技术汇新品直播中,特别邀请了业界知名大咖狒哥以及阿里云虚拟化资深专家旭卿作为现场直播的嘉宾。本次直播主要从产品背景到“X-Dragon架构”,从硬件设备到软件应用来深度的剖析“X-Dragon架构”为弹性计算裸金属服务器提供的极致计算能力。

  直播视频地址:

  产品背景

  这几年越来越多的大客户把自己的业务搬到云上来,一方面是因为云可以在成本、效率、性能方面提供更多的优势。但在客户把业务往云上搬的过程中,可以看到客户对物理机产品的一个诉求,尤其是当客户的业务运营在线下物理机上时。在把业务搬上云的过程中,会遇到一些困难,遇到困难后有一些云计算公司可能就会推出一些物理机托管的服务,而这种服务很难满足客户的需求。所以我们考虑生产一个既兼具物理机的性能同时又能提供虚拟机体验的一款产品,基本是沿着这条思路做下来的。

  揭开神龙的神秘面纱

  阿里云加内存要重启吗_阿里云增加容量_阿里云服务器增加内存

  神龙(X-Dragon)又名弹性裸金属服务器,X-Dragon服务器是真正的从云计算的角度去设计的一款服务器,随着近几年云计算的热潮的到来,发现通用的CPU不能很好的满足客户的需求,所以我们就开始自己定制CPU。刚开始定制的时候大家可能真正关心的是核数、频率、size的大小等,但真正的分析业务后发现只有这些是不够的。举个例子就知道我们是在做什么工作了,比如在云计算数据中心里面虚拟机的热迁移是个非常重要的部分,它可以在马上要发生故障的时候把上面的虚拟机无感的迁移到其他的物理机上。但在迁移的过程中CPU和CPU之间可能存在着差异,在这种情况下怎么能够更好的去支持热迁移,我们会在CPU里面加入一些特定的部分,来解决掉这方面的问题,这些东西可能就是阿里巴巴所特有的。

  我们又增加了6149这个型号,6149是16核的,并且是高主频的,所以高主频它的频率要比一般的CPU频率要高一些。为什么我们要做这个,其实当更多的企业级客户或者说大客户上来的时候,他们的一些应用对CPU单核性能的这种极致的追求是非常强的,所以我们最终决定在这一代加入比如说高主频的这样一个东西。

  对于自研主板主要是因为从2014年开始随着客户不断上云,我们发现在使用一些业界的X86的主板没办法更好的满足需求,所以主板我们是完完全全的自研,这个主板的所有IP属于阿里巴巴完全自主设计。

  X-Dragon MOC卡实例

  阿里云增加容量_阿里云加内存要重启吗_阿里云服务器增加内存

  CPU和主板并不是神龙最特殊的地方,但MOC卡就是神龙的灵魂所在了,这个就是神龙技术架构的核心。这个卡就是完完全全由阿里巴巴自主设计,然后找硬件帮我们代工。它也有比较丰富的对外接口,它远远不是一个芯片,它上边有计算资源、有存储资源还有网络资源。从虚拟化的角度定义了一个这样的设备,这台设备就像虚拟机一样方便灵活,所以从它里边的一些组件一些部件能够和软件深入的融合在一起,把这样一台机器变成和虚拟机一样的用户体验。

  X-Dragon架构的优势

  它是可以分钟级的去创建100%物理机性能和功能的云服务器,所谓分钟级创建就是说,我们知道传统的物理服务器在交付的时候时间可能非常的长,所以大家喜欢云计算,用虚拟机的技术在几分钟之内就可以交付。我们要求X-Dragon具备100%的虚拟机的体验,比如说虚拟机的一切特性像资源弹性、自动化运维、无缝上云等。因为是物理机所以具有硬件隔离和极致安全。它是阿里巴巴自研的软硬件体系,是可信可控的。

  X-Dragon架构自研硬件体系

  阿里云增加容量_阿里云加内存要重启吗_阿里云服务器增加内存

  这几年云计算发展起来之后,自研可信可控是最基本的要求,所以整个的神龙的软硬件体系都是完全通过自研模式去实现的。第一个是神龙芯片,神龙芯片是整个设备的一个核心,因为通过它可以让这台设备完完全全具有虚拟机的特性,包括虚拟机的接口。神龙MOC卡在神龙的整个架构里具有比较重要的作用,它有比较丰富的接口、管理的接口、对外数据的接口可以帮助我们实现弹性裸金属服务器具备的这些功能。

  X-Dragon MOC卡架构详解

  阿里云增加容量_阿里云服务器增加内存_阿里云加内存要重启吗

  上图可以清晰的描绘出X-Dragon MOC整个的架构详解。上边是弹性裸金属的一个实例,它里边有CPU、内存,并且CPU、内存都是物理的,物理的优势就是物理机具备的特性它都具备。但下边是VirtlO-NIC、VirtlO-Blk,之所以这么做是希望云上的所有镜像、云上的所有系统、虚拟机和物理机之间完全兼容。除了这些功能外,还要一些外部设备,外部设备就是键盘、鼠标、显示器也是通过芯片、通过设备的形势模拟出来。这样就可以实现和虚拟机一样的对外接口,使得运营的操作系统不需要做任何的修改,在虚拟机上拿过来在X-Dragon MOC卡上直接用。下面这部分是卡的中心结构,整个X-Dragon Hypervisor完完全全运行在这张卡上面。它是支持云盘、支持VPC网络、支持存储/网络设备热插拔、支持32块弹性物理网卡同时对X86、ARM、Power等CPU是兼容的。

  X-Dragon 自研软件体系

  阿里云加内存要重启吗_阿里云增加容量_阿里云服务器增加内存

  在软件体系里硬件也扮演着重要的作用,所有的软件和硬件做到了整体的深度融合。所谓深度融合就是比如说X-Dragon芯片可能向上需要提供Virtio 网络驱动的接口、Virtio 存储驱动的接口、交互IO层驱动的接口,能让上边的实例具备虚拟机一样的体验。向下要和X-Dragon Hypervisor系统软件融合在一起,云盘要提供更佳极致的性能。

  X-Dragon架构支持第三方虚拟化

  阿里云加内存要重启吗_阿里云服务器增加内存_阿里云增加容量

  这是X-Dragon Hypervisor 的一个系统软件,可以从三个部分来讲:

  基于X-Dragon架构的阿里云弹性裸金属产品家族

  阿里云加内存要重启吗_阿里云服务器增加内存_阿里云增加容量

  这是一个基于X-Dragon架构的阿里云弹性裸金属产品的性能表。目前,基于神龙架构的弹性裸金属服务器已正式商业化售卖,支持8核、16核、32核、96核等多个CPU规格,并支持3.7 GHz~4.1 GHz的超高主频实例。

  AWS测试款对比

  阿里云服务器增加内存_阿里云加内存要重启吗_阿里云增加容量

  现场同档规格实例的性能测试中,基于神龙架构的阿里云弹性裸金属实例ebmhfg5.2xlarge(8vCPU) 在10000位圆周率计算Superπ中跑出了1分26秒的成绩,比AWS基于Nitro架构计算型实例c5.2xlarge(8vCPU)快了15%。

  总结

  今天终于能在这里把神龙的技术架构做一个详细的介绍,在未来神龙这样一个技术架构会变成弹性计算核心的硬件发展体系,在这样一个体系里边未来的1.0、2.0、3.0其实能够提供更佳极致的产品级的体验。所以沿着这条道路走下去会不断的推出神龙的技术架构,不仅仅是今天这样的一个弹性物理机,未来还会有很多基于神龙架构的产品。

最后修改:2024 年 07 月 25 日
如果觉得我的文章对你有用,请随意赞赏