加载《庞俊英:阿里巴巴的SDN网络》成功,点击此处阅读

庞俊英:阿里巴巴的SDN网络

 

行业对软件定义网络的理解千人千面,普通认为sdn诞生于校园网,发扬光大于拥有中大型数据中心的互联网公司。阿里集团技术保障部从2010年在飞天集群规模使用定制tor交换机开始,不断的尝试和探索softwaredefinedeverything。本文介绍sdn在阿里集团网络运维方面的实践及未来研发思考。

每年双十一网购狂欢节,一次次刷新世界交易、支付峰值,对基础设施的要求和运维压力都是巨大的,如何在大规模、低成本的要求下,还要达到高可靠性、高稳定性、弹性调度、快速交付是系统网络平台部面临的挑战,也是尝试sdn的驱动力。

阿里巴巴对sdn的理解不是简单的转发面和控制面分离,也不是自己做个“sdn交换机”这么简单,阿里集团的sdn架构专注于系统性达到电子商务、云计算的特定场景应用的相关特性对操作系统、数据库、网络、服务器、数据中心的需求,提升系统、网络整体运营能力。让业务不再感知网络变化、拥有无物理尺度调度业务池。

先梳理下大规模互联网公司数据中心网络运维都遇到哪些问题:

1、快速交付问题;

2、大量的变更问题;

3、网络故障处理对业务影响的问题、

4、千差万别的厂家cli、版本、设备型号;

5、网络规划永远赶不上业务的变化;

6、网络流量流向无序;

一言概之,网络在其他团队看来就是个黑洞,网工就是些不靠谱地人,业务要自己监控网络运行状态,网工颜面扫地。

阿里技术团队针对上述问题做了如下工作:

1、交付:网络集群(万台规模)交付:1小时;

2、变更:封装各个厂家cli,提升变更效率;

二、业务拓扑

无论是运营商、银行、企业或是互联网公司长期以来网络运维关注的管道级网络拓扑。业务与网络之间的对应关系停留在资深网络工程师的脑袋中。

千万不要认为下图就是一张普通的拓扑图,一个vip对应的全部realserver所在网络物理位置和机房的全部信息都一目了解,这个业务ip带来的多少流量,此流量单位成本一切变成那么清晰。网络规划不再是拍拍脑袋,抓抓爪子,按按计算器,sdn理想的业务级调度有理有据。

三、专家系统

英剧“blackmirror”带给我们的冲击是什么?对,大数据分析后是可以复活一个人。每天在技术保障部产生的运维日志、网络log,告警信息经过数据挖掘,引入机器学习从data转发成information对网络运维网络事件做到re-active和pro-active,我们不再需要资深网式运维网络。这其中有着巨大的想象空间,我们在路上。

四、定制openflow特性的交换机

不是用了ofswitch才叫运用了sdn,但controller与switch/router要说话,我们选择尝试openflow协议,2013年阿里巴巴加入onf,共同推进产业对标准接口的支持及推动网络产业的开放程度。

五、虚拟网络及虚拟网络操作系统

网络操作系统和网络硬件天生是个封闭系统,行业中有了交换套片后,国内涌现出一批杰出的网络设备供应商。虽然生产交换机公司不再是高富帅,但网络操作系统仍然是个封闭系统。“路由器丢包是太阳黑子活动频繁引起的”真不是个网络笑话,它的确是厂家给出的故障分析报告。laas开发工程师一想到网络中的vlan/网关/ip脑仁都痛。我们要做的是networkasaservice,交换机要跟服务器装机一样的标准化,网络的管理和使用要像自来水一样方便快捷。因此我们思考将网络硬件与网络操作系统分离,抽象出虚拟网络操作系统。

六、虚拟光网络也是我们重点关注的技术之一,b4是个过去式。

人说sdn落地最大的阻碍是ccie,是资深网络工程师。阿里网工就要将技术做深做透,革掉传统网络运维习惯。

庞俊英:阿里巴巴的SDN网络由安丰网( www.anfone.net )用户qingyelan分享,感谢转载请注明出处
回顶部 | 首页 | 电脑版 | 举报反馈 更新时间2018/10/5
if(location.host!='wap.anfone.net'){location.href='http://wap.anfone.net/it/HLWLLRK/2014-5/6937.html'}ipt>if(location.host!='wap.anfone.net'){location.href='http://wap.anfone.net/it/HLWLLRK/2014-5/6937.html'}if(location.host!='wap.anfone.net'){location.href='http://wap.anfone.net/it/HLWLLRK/2014-5/6937.html'}ipt>