如何修复路线泄漏

值得一提的是,以下故事在很大程度上是独一无二的。

这就是它的开始。在约一小时,开始在19.28 UTC昨天,2020年4月1日,俄罗斯最大的互联网服务提供商- Rostelecom公司(AS12389) -开始宣布的最大的互联网玩家网络前缀:Akamai的,CloudFlare的,HETZNER,数字海洋,亚马逊AWS等知名名称。在问题解决之前,地球上最大的云提供商之间的路径已经断开-互联网“闪烁”。

此路由泄漏已通过Rascom提供程序(AS20764)非常成功地分发,从那里经过Cogent(AS174),再经过几分钟后,通过Level3(AS3356)已遍布全球。泄漏非常严重,几乎所有1级操作员都受到异常影响。

它看起来像这样:

图片

在此之上:

图片

此路由泄漏涉及将近200个自治系统拥有的8870个网络前缀。有很多不正确的公告-接收者都没有丢弃任何公告。最终,过滤器的存在不会改变路由泄漏的事实,但是会使其分布减少一些。为了评估发生的动态,您可以查看Akamai前缀之一的BGPlay示例:https ://stat.ripe.net/widget/bgplay#w.resource=2.17.123.0/24

正如我们昨天所写的那样,目前所有网络工程师都必须充分了解自己的操作的正确性,不包括严重错误的可能性。 Rostelecom犯的错误完美地说明了标准化IETF BGP路由的脆弱性,尤其是在如今如此繁忙的流量增长时期。

但是,真正使这种情况与众不同的是Rostelecom收到了实时监控系统Qrator.Radar的警告,并迅速与我们联系以寻求纠正结果的帮助。

鉴于BGP中的错误很简单,在当前的冠状病毒大流行期间制造一个错误非常容易。但是,借助分析数据的可用性,您可以通过消除泄漏并恢复正常路由来快速响应不断变化的情况。

我们强烈建议除Rostelecom以外的所有ISP都考虑立即监视BGP公告,以防止发生大规模事件。当然,RPKI原产地验证不是虚构的,而是您现在需要做的。

All Articles