DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开
DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开

谷歌用SDN/OpenFlow使WAN链路利用率100%

谷歌WAN链路利用率100%背后技术

作为软件定义网络和OpenFlow早期支持者,谷歌在近日举行的开放网络峰会 (Open Networking Summit)上分享了他们如何使用这种技术通过10G网络链接分布在全球各地的12个数据中心。网界网主编John Dix采访了谷歌首席工程师Amin Vahdat来了解更多信息。

谷歌首席工程师Amin Vahdat

为什么你们会选择OpenFlow?你们试图解决什么问题呢?

我们对我们的广域网进行了大量投资,而且我们想要更有效地运行广域网。这里的效率也意味着提高可用性和容错能力,提高效率的最大的好处是能够更好地利用我们现有的线路。这个行业的最好水平就是线路实现30%-40%的利用率,而我们能够以接近100%的利用率来运行我们的广域线路,通过周密的流量工程和优先次序工作。换句话说,当出现故障时,我们可以通过没有严格传输时间限制的弹性流量来保护高优先级流量。我们还可以使用非最短路径转发来路由绕过故障链路,也是通过全球范围的网络拓扑和动态地改变通信特征。

标准网络协议试图根据本地通信来理解全球网络情况。换句话说,每个人将他们对本地网络状态的观点广播给其他人。这意味着如果你想要使用标准协议来影响任何全球政策,根本不可能。没有什么中央控制计划可供你使用。而OpenFlow为我们提供了一个逻辑中央控制计划,对整个网络架构拥有全球视野,并且可以根据全球网络状态来进行计算和确定。

100%的利用率简直令人难以置信,你们会担心灾难的发生吗?

是的,因为我们可以区分流量。换句话说,我们可以很仔细地确保,当发生灾难时,受到影响的是相对不太重要的流量。

对网络的控制完全从路由硬件删除,并转移到服务器吗?

你用了一个很有趣的词:完全。我们会有一些控制留在主设备上,但是为了更简单化,我们会将其完全清除。我们将网络控制从单个交换机中的嵌入处理器 (这些嵌入处理器通常比较旧)转移到服务器(可能是最新版本,例如多核处理器)。所以提高十倍性能是很容易的事情,十倍以上的性能提升也不是难事。

我知道你们为了这个网络制造了自己的设备?

我们制造了自己的网络设备,因为当我们在两年前开始这个项目时,市面上并没有支持OpenFlow的设备。

你取代了现有的设备吗?

当时,我们建立的是一个新网络,所以我们没有移除任何设备,只是随着时间的推移,我们意识到现在有必要更换设备了。

你们会继续使用自己制造的设备还是选择其他公司推出的OpenFlow工具?

我们的立场是这样的:如果市面上出现的交换机产品能够提供我们需要的功能,我们会很乐意选择这样的产品。

交换机和服务器存在很明显的差异吗

除了接口外,交换机和服务器之间存在很明显的差异吗?

这是个很好的问题。我认为从指令集和灵活性角度来看,这两者存在相当大的差别,不过,这两者的相似性越来越多。其中,我认为交换领域能够受益的事情就是可编程性的增加。另外,更多的灵活性能够让你使用数据包中不同的bit来进行不同的工作。目前,有很多初创公司正在这个方向探索。

我知道软件定义网络/OpenFlow的另一个关键好处就是能够发展很多“如果”的方案,让你能够在真正实现之前对网络进行微调。

没错。我们拥有的主要优势之一就是一个很好的仿真和模拟环境,在这个环境中,与真实环境完全相同的控制软件将在同时控制真实交换设备和模拟交换设备的服务器上运行。并且,我们可以模仿很多故障情况,来加快我们的测试工作。

你们会真的注入假的流量?

是的,我们注入了一些假流量。显然,我们不一定能够模拟完整的流量规模。如果你从数据中心可能拥有的总体流量的角度来看,可能会比整个WAN流量还要大,我们的WAN流量很大,LAN流量更多。

你们接入这个新网络,而同时没有移除旧网络。从总数据中心内负载的角度来看,你们估计这种新的网络会占多少比例?

在我们逐渐转移到新网络的两年多的时间内,可以说,绝大部分流量现在已经在新网络中了。

在你们部署时,OpenFlow完全符合你们的要求,还是你们需要进行很多临时调整?

我们需要进行很多临时调整。OpenFlow标准化了接口,我认为这对于整个行业都是很重要的。OpenFlow和软件定义网络能够让我们分隔硬件和软件的发展路径。换句话说,你可以获取满足你需要的硬件,然后将其与满足需求的软件相分隔以用于特定部署。硬件和软件历来都紧紧地绑定在一起。

所以从OpenFlow标准化的角度来看,硬件可以与各种软件控制器进行互操作是非常非常重要的事情。从我们的角度来看,因为我们自己制造了硬件,所以并不是那么重要。但是我们必须进行适当调整,当然,随着OpenFlow标准的演化,我们也需要灵活应变。

你们受到什么阻碍吗?

我认为Urs H?lzle(技术基础设施高级副总裁兼谷歌研究员)说得很好,他说OpenFlow部署工作实际上比他预期的更顺利,没有太多停机时间。从 OpenFlow的角度来看,我们遇到的主要问题是第一个版本不能完全让你以简单的方式来利用现代交换机中的全部硬件功能。这并不是说这不可能,而是说不容易。所以我们需要做一些工作来绕过这些问题。但目前从OpenFlow标准角度来看,这个问题已经得到了很大的提高。

OpenFlow完全部署还需要多久时间?

我认为还需要几年时间,我们想要传达的信息是OpenFlow非常实用,能够在各种设置中提供实实在在的好处。

鉴于OpenFlow有这么多好处,你认为会有很多服务供应商转移到OpenFlow吗?

我们当然希望如此。我们从大型服务供应商那里听到的说法是,他们认为OpenFlow很难扩展和赚钱。我们已经向大家展示了OpenFlow如何让你的网络变得更加更加有效。

谷歌网络接下来的计划是什么

你们已经花了几年时间在这上面,你们接下来的计划是什么?

整个行业才刚刚起步。我认为从现在开始的五年时间内,我们将会取得一些成就。我们现在可以比以前更迅速地添加新功能,例如,我们最开始为管理流量加 入了优化算法,而现在我们可以部署整个系列的新的更高级的优化技术。但在技术层面,我们需要加强控制回路。目前,测量、反应和重新编程的时间是软件定义网 络面临的主要挑战,因为很多这些软件和硬件组件并不是为了一个严格控制回路而设计的。所以我们需要解决这个问题。

你们的网络是从单个NOC来控制的吗?

没有,为了容错目的,网络控制进行了复制和分布。从社区的角度以及我们自己的角度来看,在软件定义网络样板中提供合适的软件架构,复制的分布式控制是根本要素。在未来几年内,以可重复的方式进行网络控制是一个非常重要的挑战。

那么,还有什么我们没有问道而你认为重要的事情?

我想说的重点是互联网已经非常成功,如果没有充分的分散控制和操作,互联网无法取得今天的成功,为了发展到下一个新水平,互联网需要逻辑中央控制。换句话说,逻辑中央控制将从根本上提高互联网的效率。

未经允许不得转载:DOIT » 谷歌用SDN/OpenFlow使WAN链路利用率100%