这篇文章指出,CDN 在把用户请求导向哪台副本服务器时,实际上掌握着一个很少被看见却极具影响力的控制点:它会改变时延、韧性与主权边界,而最新研究表明,全球 CDN 里最主流的流量引导方式依然是基于 DNS 的重定向。
这篇文章讨论了一个平时很少被用户直接看见、却深刻影响互联网运行效果的控制点:当一个网站内容托管在 CDN 上时,究竟由哪一台副本服务器来响应请求?
这个决定会改变页面打开速度,会影响流量是在本地完成交付还是跨境绕行,也会影响网络在故障与中断中的韧性。
作者在 NINeS’26 发表的研究里,提出了一套从外部推断这种决策机制的方法。这个机制被称为副本选择(replica selection),而它正在成为互联网里一个安静却重要的控制点。
要点速览
- CDN 如何进行流量引导,会直接影响时延、韧性与数字主权。
- 最新研究显示,基于 DNS 的引导仍然是 CDN 中最常见的副本选择策略。
- 很多 CDN 并不只依赖单一机制,而是会组合使用多种 steering 方法。
- 这项研究给出了一套开源方法,可用于识别 CDN 的流量引导策略,并让围绕互联网基础设施问责的讨论建立在更可验证的事实之上。
为什么理解 CDN 的流量决策很重要
CDN 运行的是大规模分布式系统。它会把内容副本放到全球各地的服务器上。当你打开一个网站时,CDN 需要决定由哪一台副本服务器来响应你的请求。这个过程听起来像是例行的工程调度,实际影响却非常真实。
副本选择会影响时延、韧性,甚至会影响主权问题,尤其当本地用户的请求被引导到其他国家的基础设施上时更是如此。问题在于,这些 steering 决策通常只存在于 CDN 内部,对用户、监管者,甚至很多网络运营者而言都缺乏可见性。
这种不透明性之所以更值得关注,是因为 DNS 生态本身也在持续集中化。对于依赖 DNS 进行引导的 CDN 来说,解析器的位置会被当作用户位置的代理信号。可集中式公共解析器往往会为大范围地区的用户提供服务,因此它对“用户真实在哪里”的刻画并不精确。这样一来,第三方 DNS 解析器的地理位置与策略选择,也会影响流量最终流向哪里。
于是,真正塑造用户体验的力量,往往来自 CDN 内部逻辑与集中化 DNS 基础设施的叠加结果。
我们能从外部推断 CDN 如何引导流量吗
作者给出的答案是可以,而且可以通过测量实现。
他们使用 RIPE Atlas 探针作为客户端观测点,让同一份 CDN 托管内容通过不同地理范围的 DNS 解析器完成解析,从附近解析器一直覆盖到更远距离的解析器。接着,他们测量被分配到的服务器所对应的时延变化。
图 1:不同的 steering 方法会留下不同的时延指纹。
这套方法的逻辑很直观:不同的副本选择机制,会在时延分布上留下不同形状的“指纹”。
- 基于 DNS 的引导:当解析器覆盖范围发生变化时,时延分布会出现更明显的分离,因为不同解析器位置可能把请求导向不同副本。
- IP anycast:时延分布整体上更稳定,因为同一个 anycast IP 会通过路由系统自然落到附近实例,解析器变化对结果影响较小。
- 区域性 anycast:它的行为介于两者之间。在同一区域内,它更像 IP anycast;跨区域观察时,它又更接近基于 DNS 的引导。
作者先拿若干知名 CDN 做方法验证。结果成功识别出:Akamai 更接近基于 DNS 的 steering,Cloudflare 更接近 anycast,Edgio 更接近区域性 anycast。
17 家 CDN 里,有 12 家主要使用基于 DNS 的重定向
少数头部 CDN 的副本选择方式,业界已经有一定了解。可对于很多在区域市场里很重要的 CDN,外界掌握的信息依然很有限。
作者把这套方法应用到了 17 家不同的 CDN 上。这些 CDN 为 19 个国家的前 1000 大网站提供服务,覆盖了约 66% 的全球互联网用户。样本里既有 hyperscaler,也有 Azion、Medianova、NGENIX 这类在区域市场非常重要的提供商。
研究得到的中心结论很清楚:基于 DNS 的 steering 依然占主导。
在这组数据里,17 家 CDN 里有 12 家使用了基于 DNS 的重定向。按实际交付字节数计算,基于 DNS 的系统在大多数地区也处于主导地位。这个发现很重要,因为它意味着:解析器层的集中化,正在实质影响流量去向、故障传播方式,以及本地网络还能保留多少控制权。
表 1:按国家和区域统计的流量引导方式占比
下表给出了每个国家与区域中,不同 steering 方法在网页内容总交付字节数中的占比。
| Location | Users (%) | DNS-based (%) | Anycast (%) | Regional Anycast (%) | Mixed (%) |
|---|---|---|---|---|---|
| Europe | 60 | 27.6 | 41.4 | 2.6 | 28.4 |
| France | 1.1 | 27.5 | 38.5 | 3.9 | 30.2 |
| Germany | 1.5 | 30.8 | 42.2 | 1.6 | 25.4 |
| Russia | 2.3 | 9.9 | 63.1 | 0.6 | 26.4 |
| Spain | 0.8 | 44.5 | 27.4 | 3.1 | 25.0 |
| Turkey | 1.3 | 26.7 | 46.0 | 3.3 | 24.0 |
| United Kingdom | 1.2 | 28.0 | 33.8 | 3.0 | 35.3 |
| North America | 89.3 | 34.7 | 32.3 | 3.8 | 29.1 |
| US | 5.5 | 34.7 | 32.3 | 3.8 | 29.1 |
| South America | 60 | 35.5 | 33.1 | 1.4 | 30.0 |
| Argentina | 0.8 | 34.2 | 33.7 | 1.1 | 31.0 |
| Brazil | 3.3 | 35.7 | 33.1 | 1.8 | 29.5 |
| Asia | 70.1 | 26.3 | 43.8 | 1.8 | 28.1 |
| China | 18.8 | 48.1 | 30.0 | 1.3 | 20.6 |
| India | 15.5 | 28.1 | 40.1 | 0.8 | 31.1 |
| Indonesia | 3.9 | 13.6 | 53.5 | 2.7 | 30.2 |
| United Arab Emirates | 0.2 | 20.5 | 40.0 | 1.8 | 37.7 |
| Oceania | 75 | 40.1 | 27.1 | 1.8 | 30.6 |
| Australia | 0.4 | 40.1 | 27.1 | 1.8 | 30.6 |
| Africa | 50.1 | 56.7 | 26.1 | 0.9 | 16.4 |
| Algeria | 0.7 | 22.1 | 51.0 | 1.7 | 25.1 |
| Egypt | 1.0 | 16.9 | 55.4 | 0.3 | 27.4 |
| Ghana | 0.3 | 82.0 | 9.6 | 0.4 | 8.0 |
| Nigeria | 2.9 | 36.5 | 37.3 | 2.5 | 23.7 |
| South Africa | 0.6 | 14.3 | 52.9 | 0.9 | 31.9 |
| World Total | 66 | 40.9 | 33.6 | 1.7 | 23.9 |
从交付字节看,全球范围内 DNS steering 的占比最高。这说明体量更大的流量,往往更依赖基于 DNS 的副本选择。
作者也发现,提供商并不总是依赖单一 steering 策略。Google 就呈现出相当接近“DNS-based 与 anycast 各占一半”的特征。像 Google 和 YouTube 这类第一方服务,更常表现出 DNS steering 的特征;而一些托管在 Google 基础设施上的第三方内容,则更像 anycast steering。
这意味着,即使在同一家提供商内部,不同服务也可能采用不同引导方式,而作者提出的方法可以在没有内部权限的情况下,把这些差异区分出来。
为什么“哪种 steering 方式占主导”这件事重要
因为副本选择影响的从来不只是性能。
它还会带来三类更深层的问题:
- 韧性:当重路由能力越来越多地集中在少数解析器和不透明的 CDN 策略上时,网络在故障场景下的容错能力会呈现什么形态?
- 主权:当区域性流量或政府相关流量被引导到海外时,司法管辖和自主性会面临什么后果?
- 控制权:全球 anycast 在运维上很简洁,但它会把更多控制权交给 BGP;而混合使用 DNS 与 anycast 的系统,则会让整体决策链条更加难以看清。
作者认为,这套方法的价值在于:它把原本隐藏在 CDN 内部的副本选择过程,转化成了可以从外部测量和分类的对象。这样一来,围绕互联网基础设施问责、数字主权、基础设施集中化的讨论,就能够建立在更具体的证据上。
如果我们真的希望就问责、数字主权和互联网基础设施集中化展开有效讨论,第一步就是获得足够的可见性,去理解流量 steering 实际上是如何工作的。
更多方法细节和完整结果,可直接阅读作者论文: Who Is Steering Internet Traffic? Understanding Opacity in CDN Replica Selection(论文)
Rashna Kumar 是美国西北大学计算机科学系 AquaLab 研究组的博士生。文中也注明了合作者包括 Northwestern University 的 Fabián E. Bustamante 与 Netflix 的 Marcel Flores。
作者最后也提醒,文中观点代表作者本人,并不自动代表 Internet Society 的立场。