是谁在为互联网流量掌舵：理解 CDN 副本选择中的不透明性

这篇文章指出，CDN 在把用户请求导向哪台副本服务器时，实际上掌握着一个很少被看见却极具影响力的控制点：它会改变时延、韧性与主权边界，而最新研究表明，全球 CDN 里最主流的流量引导方式依然是基于 DNS 的重定向。

作者：Rashna Kumar
原文发布时间：2026-04-14
查看原文

这篇文章讨论了一个平时很少被用户直接看见、却深刻影响互联网运行效果的控制点：当一个网站内容托管在 CDN 上时，究竟由哪一台副本服务器来响应请求？

这个决定会改变页面打开速度，会影响流量是在本地完成交付还是跨境绕行，也会影响网络在故障与中断中的韧性。

作者在 NINeS’26 发表的研究里，提出了一套从外部推断这种决策机制的方法。这个机制被称为副本选择（replica selection），而它正在成为互联网里一个安静却重要的控制点。

要点速览

CDN 如何进行流量引导，会直接影响时延、韧性与数字主权。
最新研究显示，基于 DNS 的引导仍然是 CDN 中最常见的副本选择策略。
很多 CDN 并不只依赖单一机制，而是会组合使用多种 steering 方法。
这项研究给出了一套开源方法，可用于识别 CDN 的流量引导策略，并让围绕互联网基础设施问责的讨论建立在更可验证的事实之上。

为什么理解 CDN 的流量决策很重要

CDN 运行的是大规模分布式系统。它会把内容副本放到全球各地的服务器上。当你打开一个网站时，CDN 需要决定由哪一台副本服务器来响应你的请求。这个过程听起来像是例行的工程调度，实际影响却非常真实。

副本选择会影响时延、韧性，甚至会影响主权问题，尤其当本地用户的请求被引导到其他国家的基础设施上时更是如此。问题在于，这些 steering 决策通常只存在于 CDN 内部，对用户、监管者，甚至很多网络运营者而言都缺乏可见性。

这种不透明性之所以更值得关注，是因为 DNS 生态本身也在持续集中化。对于依赖 DNS 进行引导的 CDN 来说，解析器的位置会被当作用户位置的代理信号。可集中式公共解析器往往会为大范围地区的用户提供服务，因此它对“用户真实在哪里”的刻画并不精确。这样一来，第三方 DNS 解析器的地理位置与策略选择，也会影响流量最终流向哪里。

于是，真正塑造用户体验的力量，往往来自 CDN 内部逻辑与集中化 DNS 基础设施的叠加结果。

我们能从外部推断 CDN 如何引导流量吗

作者给出的答案是可以，而且可以通过测量实现。

他们使用 RIPE Atlas 探针作为客户端观测点，让同一份 CDN 托管内容通过不同地理范围的 DNS 解析器完成解析，从附近解析器一直覆盖到更远距离的解析器。接着，他们测量被分配到的服务器所对应的时延变化。

图 1：不同的 steering 方法会留下不同的时延指纹。

这套方法的逻辑很直观：不同的副本选择机制，会在时延分布上留下不同形状的“指纹”。

基于 DNS 的引导：当解析器覆盖范围发生变化时，时延分布会出现更明显的分离，因为不同解析器位置可能把请求导向不同副本。
IP anycast：时延分布整体上更稳定，因为同一个 anycast IP 会通过路由系统自然落到附近实例，解析器变化对结果影响较小。
区域性 anycast：它的行为介于两者之间。在同一区域内，它更像 IP anycast；跨区域观察时，它又更接近基于 DNS 的引导。

作者先拿若干知名 CDN 做方法验证。结果成功识别出：Akamai 更接近基于 DNS 的 steering，Cloudflare 更接近 anycast，Edgio 更接近区域性 anycast。

17 家 CDN 里，有 12 家主要使用基于 DNS 的重定向

少数头部 CDN 的副本选择方式，业界已经有一定了解。可对于很多在区域市场里很重要的 CDN，外界掌握的信息依然很有限。

作者把这套方法应用到了 17 家不同的 CDN 上。这些 CDN 为 19 个国家的前 1000 大网站提供服务，覆盖了约 66% 的全球互联网用户。样本里既有 hyperscaler，也有 Azion、Medianova、NGENIX 这类在区域市场非常重要的提供商。

研究得到的中心结论很清楚：基于 DNS 的 steering 依然占主导。

在这组数据里，17 家 CDN 里有 12 家使用了基于 DNS 的重定向。按实际交付字节数计算，基于 DNS 的系统在大多数地区也处于主导地位。这个发现很重要，因为它意味着：解析器层的集中化，正在实质影响流量去向、故障传播方式，以及本地网络还能保留多少控制权。

表 1：按国家和区域统计的流量引导方式占比

下表给出了每个国家与区域中，不同 steering 方法在网页内容总交付字节数中的占比。

Location	Users (%)	DNS-based (%)	Anycast (%)	Regional Anycast (%)	Mixed (%)
Europe	60	27.6	41.4	2.6	28.4
France	1.1	27.5	38.5	3.9	30.2
Germany	1.5	30.8	42.2	1.6	25.4
Russia	2.3	9.9	63.1	0.6	26.4
Spain	0.8	44.5	27.4	3.1	25.0
Turkey	1.3	26.7	46.0	3.3	24.0
United Kingdom	1.2	28.0	33.8	3.0	35.3
North America	89.3	34.7	32.3	3.8	29.1
US	5.5	34.7	32.3	3.8	29.1
South America	60	35.5	33.1	1.4	30.0
Argentina	0.8	34.2	33.7	1.1	31.0
Brazil	3.3	35.7	33.1	1.8	29.5
Asia	70.1	26.3	43.8	1.8	28.1
China	18.8	48.1	30.0	1.3	20.6
India	15.5	28.1	40.1	0.8	31.1
Indonesia	3.9	13.6	53.5	2.7	30.2
United Arab Emirates	0.2	20.5	40.0	1.8	37.7
Oceania	75	40.1	27.1	1.8	30.6
Australia	0.4	40.1	27.1	1.8	30.6
Africa	50.1	56.7	26.1	0.9	16.4
Algeria	0.7	22.1	51.0	1.7	25.1
Egypt	1.0	16.9	55.4	0.3	27.4
Ghana	0.3	82.0	9.6	0.4	8.0
Nigeria	2.9	36.5	37.3	2.5	23.7
South Africa	0.6	14.3	52.9	0.9	31.9
World Total	66	40.9	33.6	1.7	23.9

从交付字节看，全球范围内 DNS steering 的占比最高。这说明体量更大的流量，往往更依赖基于 DNS 的副本选择。

作者也发现，提供商并不总是依赖单一 steering 策略。Google 就呈现出相当接近“DNS-based 与 anycast 各占一半”的特征。像 Google 和 YouTube 这类第一方服务，更常表现出 DNS steering 的特征；而一些托管在 Google 基础设施上的第三方内容，则更像 anycast steering。

这意味着，即使在同一家提供商内部，不同服务也可能采用不同引导方式，而作者提出的方法可以在没有内部权限的情况下，把这些差异区分出来。

为什么“哪种 steering 方式占主导”这件事重要

因为副本选择影响的从来不只是性能。

它还会带来三类更深层的问题：

韧性：当重路由能力越来越多地集中在少数解析器和不透明的 CDN 策略上时，网络在故障场景下的容错能力会呈现什么形态？
主权：当区域性流量或政府相关流量被引导到海外时，司法管辖和自主性会面临什么后果？
控制权：全球 anycast 在运维上很简洁，但它会把更多控制权交给 BGP；而混合使用 DNS 与 anycast 的系统，则会让整体决策链条更加难以看清。

作者认为，这套方法的价值在于：它把原本隐藏在 CDN 内部的副本选择过程，转化成了可以从外部测量和分类的对象。这样一来，围绕互联网基础设施问责、数字主权、基础设施集中化的讨论，就能够建立在更具体的证据上。

如果我们真的希望就问责、数字主权和互联网基础设施集中化展开有效讨论，第一步就是获得足够的可见性，去理解流量 steering 实际上是如何工作的。

更多方法细节和完整结果，可直接阅读作者论文： Who Is Steering Internet Traffic? Understanding Opacity in CDN Replica Selection（论文）

Rashna Kumar 是美国西北大学计算机科学系 AquaLab 研究组的博士生。文中也注明了合作者包括 Northwestern University 的 Fabián E. Bustamante 与 Netflix 的 Marcel Flores。

作者最后也提醒，文中观点代表作者本人，并不自动代表 Internet Society 的立场。