您的位置: 首页 >互联网 >

ShareBackup可以将数据保存在快车道上

2019-06-12 16:46:18 编辑: 来源:
导读 任何一个曾经诅咒过计算机网络的人都会因为它慢慢爬行而感到高兴,他们会欣赏莱斯大学科学家提供的补救措施。赖斯计算机科学家Eugene Ng及

任何一个曾经诅咒过计算机网络的人都会因为它慢慢爬行而感到高兴,他们会欣赏莱斯大学科学家提供的补救措施。

赖斯计算机科学家Eugene Ng及其团队表示,当故障不可避免地发生时,他们的解决方案将使数据保持在快速通道上。

Ng推出了ShareBackup,这种策略允许数据中心的共享备份交换机在软件或硬件交换机 故障后的几分之一秒内接收网络流量。

他将于本周在匈牙利布达佩斯召开的SIGCOMM 2018年会议上发表关于这项工作的同行评审文章。该论文在线并可供下载。

Ng表示,这个想法将解决数据专业人士,科学家以及依赖网络日复一日地提供结果的所有人之间的共同烦恼。

“数据网络由服务器和网络交换机组成,”计算机科学与电气和计算机工程教授Ng说。“交换机将数据包移动到他们需要去的地方。但事情就会失败,特别是在拥有数千块硬件的大型数据中心。”

对故障开关的通常响应是将数据流分流到另一条线路。“一般来说,网络有多条连接服务器的路径,就像高速公路上有一个关闭一样,我们会绕过它。这是一种传统的,自然的方法很有意义:你绕过失败的路线到达你需要去的地方。“

但有时候其他道路拥挤,一切都变慢了。“数据中心不是互联网;它们不是人们浏览网站,”Ng说。“它们是支持数据密集型应用程序,如数据挖掘或机器学习。而且很多这些应用程序都有严格的性能截止日期,因此盲目地重新路由流量可能是数据中心的错误做法。”

Ng实验室的策略不是在整个网络中安装冗余交换机的昂贵选择,而是将快速交换机和软件置于战略位置,以便在一微秒内从故障交换机中获取流量。解决该问题后,该团队的软件可以使备份交换机可用于处理其他故障。

交换机足够快 - 故障恢复时间为0.73毫秒,包括来自硬件和控制系统的延迟 - 大多数用户永远不会知道系统的一部分发生故障。

“现实情况是,在任何给定时间内发生故障的设备的比例非常小,而且大多数故障都可以通过重启设备来解决,”Ng说。“有时候软件搞砸了,一个简单的电源循环就会把它带回来。这些故障可能也不会持久。

“这些是我们试图利用的特征,”他说。“正因为如此,我们可以通过很少的设备来备份大量设备。”

Ng表示,ShareBackup可以节省数据中心的时间和金钱,不仅可以保持全部带宽,还可以帮助分析问题,包括通常导致网络故障的错误配置。

“我们的部分工作是帮助数据中心找出网络出了什么问题,”他说。“激活备份后,您可以将故障设备从生产网络中取出并进行测试,以确定导致问题的组件。

“现在,如果我们拿出两个设备,无法弄清哪个设备坏了,两个都需要更换,”他说。“很可能只有一个设备出现问题。我们的软件可以半自动方式诊断这些设备,如果其中一个部件是好的,它可以恢复。”


免责声明:本文由用户上传,如有侵权请联系删除!

精彩推荐

图文推荐

点击排行

2016-2022 All Rights Reserved.平安财经网.复制必究 联系QQ280 715 8082   备案号:闽ICP备19027007号-6

本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。