1、h t t p:/ww w.j s j k x.c o mD O I:1 0.1 1 8 9 6/j s j k x.2 2 0 3 0 0 1 8 4到稿日期:2 0 2 2-0 3-2 1 返修日期:2 0 2 2-0 9-1 4基金项目:国家重大科技专项:自主可控高性能路由器及关键技术(2 0 1 8 Y F B 1 8 0 0 6 0 0)T h i sw o r k w a ss u p p o r t e db yt h e N a t i o n a lS c i e n c ea n d T e c h n o l o g y M a j o rP r o j e c to f
2、t h e M i n i s t r yo fS c i e n c ea n d T e c h n o l o g yo fC h i n a(2 0 1 8 Y F B 1 8 0 0 6 0 0):A u t o n o m o u sa n dC o n t r o l l a b l eH i g hP e r f o r m a n c eR o u t e ra n dK e yT e c h n o l o g y.通信作者:夏正友(z h e n g y o u_x i a n u a a.e d u.c n)一种拥塞避免的S D N单链路故障恢复模型陈自强夏正友南京航空
3、航天大学计算机科学与技术学院/人工智能学院 南京2 1 0 0 0 0(1 0 4 1 5 3 8 9 3 9q q.c o m)摘 要 软件定义网络(S o f t w a r eD e f i n e dN e t w o r k,S D N)作为一种新型网络架构,通过分离数据平面与控制平面来简化网络管理逻辑,是下一代网络的研究热点。但是,由于频繁的链路故障等因素,S D N网络的可靠性成为公认的业界难题。当前已有的S D N链路故障恢复模型存在恢复时延过长、消耗过多流表项、忽视故障恢复后链路拥塞的问题。为了解决这些问题,提出了一种基于段路由(S e g m e n tR o u t i
4、n g,S R)的单链路故障恢复模型(L o o pF r e eA l t e r n a t e s-C o n g e s t i o nAw a r e,L F A-C A)。该模型包含了两个启发式算法B P F和B P U,分别用于在网络初始化时计算无环的备份路径,和在运行过程中更新拥塞避免的备份路径,实现了针对单链路故障的快速恢复和故障恢复后的拥塞避免。大量仿真实验证明了L F A-C A相比当前的S D N单链路故障恢复模型消耗了更少的转发规则,且具有更好的故障后负载均衡能力。关键词:软件定义网络;段路由;单链路故障;备份路径;负载均衡中图法分类号 T P 3 1 1 F a i
5、 l u r eR e c o v e r yM o d e l f o rS i n g l eL i n kw i t hC o n g e s t i o n-A v o i d a n c e i nS D NCHE NZ i q i a n ga n dX I AZ h e n g y o uC o l l e g eo fC o m p u t e rS c i e n c ea n dT e c h n o l o g y/C o l l e g eo fA r t i f i c i a l I n t e l l i g e n c e,N a n j i n gU n i
6、v e r s i t yo fA e r o n a u t i c sa n dA s t r o n a u t i c s,N a n j i n g2 1 0 0 0 0,C h i n a A b s t r a c t A san e wn e t w o r ka r c h i t e c t u r e,t h es o f t w a r ed e f i n e dn e t w o r k(S D N)s i m p l i f i e s t h en e t w o r km a n a g e m e n t l o g i cb ys e p a-r a t
7、i n gd a t ap l a n ea n dc o n t r o lp l a n e,w h i c hi so n eo f t h ep o p u l a rr e s e a r c hs u b j e c t so fn e x t-g e n e r a t i o nn e t w o r k.H o w e v e r,d u et of r e q u e n t l i n kf a i l u r e sa n do t h e r f a c t o r s,i t i sd i f f i c u l t t og u a r a n t e e t h
8、 e r e l i a b i l i t yo fS D N,w h i c h i s ap r o b l e mw e l l r e c o g n i z e d i n t h ei n d u s t r y.T h ee x i s t i n gS D Nl i n kf a i l u r er e c o v e r ym o d e l so f t e nh a v e t h ep r o b l e m so f l o n gr e c o v e r yd e l a y,r e q u i r i n gt o om a n y f l o we n t
9、 r i e sa n d i g n o r i n g l i n kc o n g e s t i o na f t e r r e c o v e r yf r o mf a i l u r e.T os o l v e t h e s ep r o b l e m s,t h i sp a p e rp r o p o s e sas i n g l e-l i n kf a i l u r er e c o v e r ym o d e l(L F A-C A)b a s e do ns e g m e n t r o u t i n g(S R).T h em o d e l e
10、 m p l o y st h et w oh e u r i s t i ca l g o r i t h m so fB P Fa n dB P Ut oc a l c u l a t ea l o o p-f r e eb a c k u pp a t hd u r i n gn e t w o r k i n i t i a l i z a t i o na n du p d a t e t h ec o n g e s t i o na v o i d i n gb a c k u pp a t hd u r i n go p e r a t i o n,r e s p e c t
11、i v e l y,s oa s t oa c h i e v ef a s tr e c o v e r yf r o ms i n g l e-l i n kf a i l u r ea n dc o n g e s t i o na v o i d a n c ea f t e rf a i l u r e.I nt h i sp a p e r,m a s s i v es i m u l a t i o ne x p e r i m e n t sa r ec a r r i e do u t t oe v a l u a t e t h ep e r f o r m a n c e
12、o fo u rm o d e l,a n dt h er e s u l t sp r o v e t h a t c o m p a r e dw i t hs o m eo f t h ee x i s t i n gS D Ns i n g l e-l i n kf a i l u r er e c o v e r ym o d e l s,L F A-C Ac o n s u m e sl e s sf o r w a r d i n gr u l e sa n dh a sb e t t e rl o a db a l a n c i n ga b i l i t ya f t e
13、 r f a i l u r e.K e y w o r d s S o f t w a r e-d e f i n e dn e t w o r k,S e g m e n t r o u t i n g,S i n g l e l i n kf a i l u r e,B a c k u pp a t h,L o a db a l a n c i n g 1 引言随着实时多媒体应用和关键性业务规模的爆炸式增长,服务的可靠性已成为当前网络部署和管理领域的研究热点。S D N近几年被广泛应用在运营商网络和工业网等多种现实网络中1,它将控制平面与数据平面分离,通过软件编程定义和控制网络。然而网络
14、中频繁发生链路和节点故障,即使发生的时间很短,也会对许多延迟敏感的应用程序,如V o I P、视频会议等,造成非常大的影响2-3。如何充分利用S D N网络架构的特性以及数控分离带来的集中控制能力和高速数据转发能力,实现对故障的快速恢复和故障后的资源合理调度,成为值得探索的方向。当遇到故障,除了一些特殊的场景会将流量丢弃4外,一般的解决方案是将流量重新路由到计算出的备份路径,使得数据包能够绕过故障转发至目的地。默认基于O p e n F l o w5的S D N故障恢复方案包括以下步骤:1)故障从交换机报告到控制器;2)控制器计算出备份路径;3)下发备份路径并更新所涉及交换机的流表。这是一个漫
15、长的恢复过程,因为大量恢复时间消耗在路径计算和设备之间的信息交互上。为了减少故障恢复的时间消耗,实现快速的本地恢复,提前计算好备份路径的快速重路由(F a s tR e r o u t e,F R R)机制6是一种可行方案。现有的F R R方案大多可以做到5 0 m s内的快速故障恢复,一些基于段路由的F R R技术也在现实网络环境下投入使用,如T I-L F A(T o p o l o g y I n d e p e n d e n t L o o p-F r e e A l t e r-n a t e)7。然而,无论是在传统I P网络中还是在S D N中,对一个F R R技术的评判标准往往
16、是故障保护覆盖范围、故障恢复时间,乃至转发规则数量,几乎没有考虑到故障后的资源合理调配。在高流量负载下,流量沿着I G P最短路径转发会导致频繁的链路拥塞,此类非故障引起的拥塞可通过部署流量工程(T r a f f i cE n g i n e e r i n g,T E)、流量调度8-1 0等负载均衡方案有效地解决。同样,当网络上一些关键单元突发故障,大量的流量被重路由,不合理的流量调配也会导致频繁的链路拥塞,这被称为故障后拥塞。现有的F R R方案基本可以有效降低网络连通性损失的影响,但几乎没有方案考虑到故障后拥塞的问题。本文提出了一种S D N中基于段路由的具有避免故障后拥塞能力的快速重路由模型(L F A-C A),主要贡献如下:(1)基于L F A技术,默认使用与收敛后路径一致的备份路径,提供快速的故障恢复能力;(2)利用段路由技术引导受影响的数据包在备份路径上的转发,减少转发规则,降低资源消耗;(3)提出了一个启发式方案,可根据网络状况动态自适应地选择避免故障后拥塞的备份路径,实现故障后的负载均衡。2 国内外相关工作段 路 由(S R)1 1由I n t e r n e t