互联网的真实状态,越来越难用“在线”或“离线”两个词概括。部分网络依然能访问核心互联网的一部分,却彼此无法互通。为描述这种新现实,研究者提出了一个以“50% 双向可达”为核心的新定义,并用 Taitao 算法去识别互联网核心与外围半岛。
要点
- 衡量互联网连通性,需要一个能够容纳越来越多“部分可达”网络的新定义。
- 研究者提出了一个新标准:只有当一个网络能够被其余活跃互联网中至少 50% 的部分到达时,它才属于“互联网核心”。
- 同一研究团队还开发了 Taitao 算法,用来识别哪些网络位于核心之内,哪些落在核心之外。
几十年来,我们一直把互联网理解成一个开关:要么连着,要么断了。你能给地球另一端的朋友发邮件,说明你“在线”;某个政府在抗议期间切断光纤,你就“离线”。
如今,地缘政治影响力的争夺与大型企业之间的博弈,正在把数字世界推向更复杂的状态,这种二元视角已经越来越难解释现实。在我们最近的论文《Understanding Partial Reachability in the Internet Core》里,我和同事提出:我们需要重新定义“The Internet”究竟是什么。
互联网更像一种共识,而不是一个整块、统一、不可分割的实体。如今,这种共识正在出现裂缝。
互联的身份危机
传统定义里,互联网是一个“网络的网络”,原则上每个人都可以和其他人通信。可一旦某个国家制裁另一个国家,并要求本国所有 ISP 与对方 ISP 断开对等互联,局面就会改变。两个大型 ISP 也可能因为商业条款谈不拢而停止交换流量。
这时,网络依然在运行,用户依然能访问互联网的一部分内容,但它已经失去了“完全接入全球互联网”的状态。它停留在一种介于两者之间的灰色地带:部分可达性。
为了给这种不确定状态一个可测量的定义,我们提出了一个更明确的技术表述:互联网核心,是由超过 50% 活跃公共 IP 地址构成的强连通分量;这些地址之间能够实现双向路由。
谁属于这个“核心”,谁处在外围?我们给出的判据是 50% 规则。
50% 规则:一条新的数字边界
按照这个定义,互联网核心是最大的那一组网络,其中每个成员都能被其余活跃互联网中至少 50% 的部分到达。这个 50% 阈值会把问题收敛成一个答案:互联网核心只能有一个。即使存在两组彼此冲突的 50% 定义,它们也必须发生重叠。各方可以据此拿出自己的测量证据,指出重叠在哪里,也指出分歧在哪里。
这个定义把“谁有权定义互联网”交还给互联网自身的观测事实。美国、中国、负责分配 IP 地址的区域互联网注册机构,都无法单独规定互联网的边界。互联网真正存在的地方,是多数人依然能相互相遇的那一部分。
这个定义只依赖对互联网自身的观测,不依赖某个外部权威。这样的中立性,让它有机会帮助新闻工作者、政策制定者和研究者更清楚地讨论:一个网络究竟处在互联网之内,还是已经滑出了互联网。
政策制定者会考虑制裁,网络运营者也必须评估这些决策对互联网的影响。新闻报道里经常出现“splinternet”这个词,用来描述互联网分裂成各国孤岛的风险。我们的定义把这种讨论落回到一个可以测量的事实上:任何人都可以测量自己能够到达什么,再与他人的结果比较,由此识别一个被多数网络可达的互联网核心,并进一步判断这个核心的状态。这样一来,政策行为就有了可追责的结果:只要某些动作真的把对等互联打碎,并让互联网失去一个 50% 可达的核心,它们就已经破坏了互联网。
给未来画图
这个定义还覆盖了另一种状态:两方都能到达互联网核心,却无法直接到达彼此。这正是部分可达性的典型形态。对普通用户来说,这种体验尤其令人困惑,因为他们会发现:有些网站能打开,有些网站始终打不开。
我们定义了一个名为 Taitao 的算法,用来识别这些“半岛网络”,并展示出一个重要事实:当下的部分可达性,出现频率已经和网络中断一样高。理解部分可达性,已经成为一个新的研究课题,也是一项新的商业挑战,因为整个互联网都需要面对它。
图 1:半岛网络持续时间的折线图显示,多数半岛状态持续很短,但也有一些会延续数天甚至数月。
只要我们把互联网定义为一个“相互可达的核心”,我们就真正拥有了衡量互联网健康状况这一维度的工具。
我们可以看到哪些地方正在出现可达性裂缝,也可以据此帮助政策制定者理解自己的选择会带来什么后果,并帮助行业识别哪些投资最能提升网络韧性。
Guillermo Baltra 是一位来自智利的网络研究者,长期研究互联网的内在结构与运行本质。
文中观点仅代表作者本人,不代表 Internet Society 的立场。