首页 > 基础设施 > 在青云北京3区测试SDN 2.0是怎样的体验?
 
在青云北京3区测试SDN 2.0是怎样的体验?
 
摘要:对大规模虚拟网络的性能担忧由来已久,在青云北京3区上线前夕,企事录对青云SDN 2.0进行了测试和评估,并在青云音乐会上以软件定义与硬件优化为主题,阐释新时代软硬件如何相辅相成……
作者:企事录    来源:-    2016-01-07
关键词:青云    SDN 2.0    数据中心    云计算    
 

2016年新春伊始,青云宣布北京3区数据中心正式上线,伴随3区上线的是青云最新一代SDN/NFV 2.0虚拟网络系统。北京3区的正式商业,标志着青云在虚拟网络技术上跨入了新的阶段。

在2015年最后一个月,企事录受青云邀约,在青云北京3区数据中心正式上线前,对青云新一代虚拟化网络技术SDN 2.0进行了基于性能的分析测试,得出了一套完整的性能指标,结合2015年企事录在虚拟化网络技术的一些思考,完成了一份虚拟化网络如何解决性能的研究分析报告。

也正是这份报告中,青云SDN2.0较其他虚拟网络在性能上的巨大提升,企事录在2016年1月6日的青云北京3区发布仪式上对此次测试的结果进行了完整的解读。

感谢青云的小伙伴对企事录测试报告的认可,生生从青云CEO黄允松(Richard)和CTO甘泉(Reno)的演讲中挤出了20分钟的时间,让企事录在会上分享在虚拟化网络的“软件定义”背景下,软件与硬件如何结合,来获得高性能虚拟网络环境的讲演。

作为青云的核心,“著名相声艺术家”Richard讲解了他对于云的“梦想”, 特别是他提到的“农民工故障”说法让很多人都想到了“挖断光纤”事件和“停电”事件,这种不可抗拒力逐渐成为数据中心故障的最大敌人。此前ITIC 2014年的报告也显示:造成企业数据中心故障、甚至停机的最大因素是人为错误,软件或硬件导致的故障反而排到了靠后的位置。
黄老板的解决思路也很简单,却很有效,那就是将青云分散在全国各地的多个云数据中心互联起来,且尽可能地降低中断的几率,多路互联,建设“多路环形骨干网”。

Richard讲解青云正在建设的“多路环形骨干网”,以北京数据中心为起点,通过在中国东海岸和西部地区各部署两条骨干网路线,中途覆盖各数据中心,最终与广州数据中心实现“多路环形”互联。

作为CTO,甘泉和Richard的工作自然是无缝衔接,Richard负责“做梦”,而他负责实现梦想

甘泉介绍了青云这半年以来作出的一些功能,包括Hadoop集群,LB(Load Balance,负载均衡)集群,以及最重要的青云SDN/NFV 2.0。对于SDN 2.0,这个全新的分布式虚拟化网络系统,甘泉并没有提到太多的技术指标,只是强调了在单个VPC(Virtual Private Cloud,虚拟私有云)中即使六万台虚机满配,虚机之间的性能也会保持不变,这是超大规模部署的需求,也是SDN/NFV 2.0和1.0一个非常重要的不同,有了SDN 2.0,我们就可以逐步脱离硬件设备的控制,那么距离我们的梦想会更进一步。

IT168网站图文直播了发布会&音乐会的全过程

2015年,企事录持续研究了在“软件定义”背景下,软件与硬件如何协同工作,以发挥更好的整体性能的工作……不可否认的是,发展这么多年的传统硬件设备确实有它存在的意义,基于硬件的特点使得其性能非常高,但之所以被替代,最大的原因在于其不够灵活,尤其是上规模以后,管理的复杂度以指数上升。

企事录联合创始人李献代表企事录在会上分享了提前使用青云北京3区数据中心进行的测试报告

虚拟网络的引入可以很灵活地使用和管理网络。但是虚拟网络同样存在问题,比如性能问题,管理问题,甚至两方面都有问题。当然,这里不得不模仿一句亚洲气质舞王尼古拉斯·赵四的话,如下图:

比如从物理网络的VLAN到虚拟网络的VXLAN,通过加一个软件层解决了规模的问题(从4096到1600万),但是又引入另外一个问题,加层会消耗系统资源,且性能会消减。其实,无论是物理网络还是虚拟网络,最终的缺点都会直接影响系统性能,进而又制约网络规模的扩大。

大规模常用分布式来分散集中式的高性能需求,分布式网络架构已趋主流。但目前大多数分布式网络都是Data Plane使用分布式,但Control Plane逻辑上仍属于集中式,仍然不能从本质上解决单点问题,例如SDN控制器就是一个集中式的控制器。

青云SDN 2.0则巧妙地将Control Plane也利用分布式技术分散到各个物理主机,每个Controller只管理本地资源,但却存储网络中所有的目录地址,构建一个网状网络,任意虚机可点对点通信,达到降低延迟的目的,且在数据中心规模扩大后不降低网络性能。

青云SDN 2.0通过分布式Controller架构形成的网状网络,虚机之间通信延迟极低,且稳定

在解决控制平面(Control Plane)的管理与性能问题之后,还需要解决虚拟网络中数据平面(Data Plane)占用计算资源过大的问题。比如目前部署虚拟网络主流采用VXLAN技术,其封包、解包用CPU来实现的话,将很大的损耗CPU等系统资源。

VXLAN用通用x86处理来进行封包、解包处理,其CPU资源占用会高达50%左右,这显然是不能接受的

青云通过支持VXLAN Offload功能的网卡来降低系统资源耗费的问题。

关闭/开启VXLAN卸载,CPU资源占用对比。开启VXLAN卸载可降低一倍的CPU的资源开销

据企事录了解,青云SDN 2.0将使用Mellanox公司推出的ConnectX系列网卡。同时,据企事录统计,目前各大网卡厂商均有支持VXLAN Offload的网卡,且所有厂商都提供标准化接口,无需改动代码即可启用这一功能。

博通、Intel、Mellanox以及Qlogic等网卡厂商都支持VXLAN卸载。尽管是不同厂商的产品,但业内已经有标准的VXLAN Offload接口,使用这一功能并不会增加代码层面的工作量

将VXLAN的计算卸载到网卡之后,整个网络子系统的带宽有明显提升,几乎可接近物理网卡。

企事录在青云上进行带宽测试后获得的结果。物理机总带宽可达到25Gbps。同一物理机上虚拟机的点对点带宽为8.27Gbps,几乎达到了万兆网卡的实测带宽

经过对控制平面和数据平面的双重优化之后,青云的性能大幅提升,比如企事录依托青云对虚拟环境中常见的虚机迁移时间进行了测试。

虚机迁移测试,在确保IP不变的前提下(保持用户业务的持续性),不管是系统中断时间还是网络中断时间,都能控制在1分钟以内,目前几乎没有其他方案能够做到这个水平

另一个模拟真实应用环境的测试则是ESRP邮件数量测试。ESRP测试考量的是整个系统(包括计算、存储和网络等子系统)的综合性能水平,对计算、网络延迟和带宽,以及存储容量与性能都有较高要求。

青云ESRP测试结果,随着Exchange Server数量的增加,所能支持的邮箱数量也水平扩展

根据微软官网公布的ESRP测试成绩,企事录挑选了部分测试数据用作参考,如上图所示,得益于青云的SDN 2.0和分布式存储技术,在ESRP测试,使用更少的计算资源,也能够获得很好的成绩。

经过对青云SDN2.0的系统测试分析,再加上企事录之前的研究,我们认为,在大规模环境下,尤其是类似公有云的多租户环境下,要在灵活管理的基础上,最大限度提升性能,单纯用软件或者硬件并不能从本质上解决问题,而是需要软硬两方面相辅相成。例如,在青云环境下,通过分布式控制软件来解决规模和管理问题,以及性能方面的延迟问题,利用网卡的VXLAN Offload来提升网络带宽。不止网络,在存储方面,如另一篇文章分析的那样,其利用PMC公司的16端口HBA卡来尽可能发挥磁盘的性能。最终实现提升系统综合性能的目的。

作为会红(相比网红)企事录的创始人狒哥(张广彬)这一年来频繁出现在台上,自然由他来做串场最合适,随后的音乐会也让现场观众身心都得到了升华,而我们陷入了更深的思索。

作为一个云计算厂商,组织一场交响乐音乐会,和我们一样有“经验”的朋友都认为音乐会只是个“噱头”,尤其是在新年之际,音乐会肯定要承载青云的战略目标。整个活动下来,后2/3的时间还真是一场精彩的交响乐音乐会,但是相信现场、包括看了视频直播的朋友都不会小看音乐会了,因为交响乐,形象的展示了青云数据中的分布式处理,小提琴、中提琴、大提琴、低音提琴、管乐、打击乐是为用户提供不同风格云计算服务的服务器它们共同演奏着青云分布式网络管理的统一乐谱,并由掌控全局的总指挥统一调度。

这不就是青云在音乐会前所反复强调的整体可靠性、分布式、虚拟化、独立计算的印证吗?

企事录历时近一个月对青云SDN 2.0评测的详细报告将于下周一期发布,欢迎关注企事录公众号接受最新评测信息。

热门标签
谷歌Google服务器定制数据中心互联网闪存云计算开源硬件全闪存阵列NVMe3D VNAND开源SoftlayerNutanixVCE公有云AzureAWS中国亚马逊软件定义IBM软件定义存储存储软件英特尔超融合系统软件定义网络OpenFlow控制平面数据平面微软Amazon定制服务器华为网络交换机物联网能耗CPUIntelARMPOWERXeon广达ODM戴尔硬件重构SSD定制SSDFusion-ioOracle定制CPUFacebookOCP腾讯百度阿里巴巴模块化数据中心天蝎项目OPC定制整机柜酷盘百度网盘数据中心成本高密度服务器超云冷存储IaaSPaaS数据中心网络SDN对象存储CephSwiftOpenStackHadoop大数据高密度存储服务器超融合一体机青云计算存储型一体机架构虚拟化虚拟网络测试部署实施x86四路服务器联想System x关键应用网络性能应用性能私有云三星950PRO企业级市场NSX思科迪普IMM2管理金手指磁盘希捷收购Rally迈拓昆腾网络虚拟化日立西部数据WDSnowball雪球O2O模块化清洁能源SDN 2.0供电E5 v4处理器PCIe SSDGreenLiant存储浪潮评测性能XSKY4路服务器关键业务E7 v3NFV转发性能网盘云存储数据安全家用NAS移动硬盘京东宿迁笔记本电脑程序员ThinkPad海淘Spark超融合 FusionCube英特尔 至强 E7至强E7戴尔R930至强E5超融合FusionCubeFusion Storage内存ECC工作站M.2 SSD整机柜戴尔R830 Server SAN SDSServer SAN 软件定义U.2 NVMe SSDODCC超融合技术 张北 数据中心全闪存 阵列 SSD京东云数据库MySQL百万TPMDTF服务器集群开源云联盟512e、vSphere 6.5和SSDPowerEdge FX2戴尔PowerEdge FX2混合云联合实验室快数据FusionCube 9000DELL PowerEdge FX2FusionCube 6000FX2vSphere办公室研发T30NVMe SSDServer SAN 超融合SkylakePurley至强 Mesh 可扩展 SkylakeSC7020VDIHorizon View14GXeon SPR740xd品高云