2023-11-17

10 月 31 每日,杭州云栖会议在阿里云网络技术分论坛,阿里云网络产品线负责人朱顺民生产《Leadership:简单易用的智能云网络-阿里云网络不断演变的主题演讲,全面解释阿里云飞天洛神云网络(以下简称洛神网络)提升商品思维和能力。
为了使网络更加方便,,围绕稳定、安全、能源、响应弹、深度可观测和综合自我服务等 6 大架构模式理念,洛神网络带来了新的产品和服务能力升级:
以下是演讲全篇(约 7000 多字)
感谢您参加云栖大会阿里云网络技术分论坛,我很高兴在一年一度的云栖大会上与您见面,并向您汇报云网产品能力的构建思路和水平升级。
洛神网络从 2017 从一年开始,我们就提出了一个想法,让网络更方便;大家都知道做网络,可以让网络更方便,这意味着你可以做得更顺利。但是,近年来,随着网络产品和服务的逐步完善,不断创新事实上,商品对象和概念越来越多b;不知不觉网络慢慢复杂化,复杂性是所有问题的本质。所以,现在我们提出这个主题,打造简单易用的智能云网络,并通过洛神网络本身的演变过程与大家讨论这一概念。所以,现在我们提出这个主题,打造简单易用的智能云网络,并通过洛神网络本身的演变过程与大家讨论这一概念。
企业上云,云网络不断发展,让我们来看看云网络发展的全过程。

在这三个阶段之后,,我一直在思考云网络建设的关键构思,我觉得最后还是要回到初心Back to Basic,让网络更方便洛神网络这列火车围绕这一理念不断快速演变。围绕这个想法,我今天演讲的主题是打造一个更简单易用的智能云网络。
洛神网络层次化产品系统,支持云原生应用全生命周期的部署
经过十多年的演变,洛神网络已经发展了c;已经建立了丰富完整的云网络产品体系。
从底部的云网络基础产品,有收费 CDT 和 CU,这是支持所有洛神网络产品系统的商业基础。上一层是全球化网络,基于此,企业可以部署全球化业务,并且连接支系,IDC 以及各种终端;上一层是数据中心网络,能够安排丰富、复杂、高规模并发的项目;再往上,应用交付网络,做好云端负载代管的关键工作。
另外,云网络的智能管理和运维服务,能够为用户提供高效的工具集,让用户更容易地使用和管理网络;构建网络很容易,控制网络事实上,使用网络很难,同时,为了让用户更容易、更快地发现网络问题和困惑,这就是我们做智能管理和运维的初衷。
产品和服务我将介绍洛神网络在稳定、安全、能源、响应弹、深度可观测和全面自我服务方面所做的一些工作。我们认为这六个级别,代表云网络产品建设的关键能力:
所以,过去很多年,洛神网络围绕稳定、高可靠性做了相当多的工作,可以说,对稳定的敬畏,总是刻在云网络的产品基因中a;

全球化网络,多运营商多线接入专线接入水平,提高这个混合云链路的可靠性;跨域连接,每个人都带来了超大的带宽水平;数据中心网络,基于全分布式和AZ备份的技术方案,提高可靠性;应用交付网络,通过多出口多段网络接入和跨机房多活共享水平,提高使用交互的稳定性。
今年,不限于此,大家继续深挖技术,压实产品的可靠性。

最先,根据以往十多年的网元产品经营经验和能力沉积洛神网络再次升级了网元线上架构,支持您更多的网元商品,例如 ALB/NLB/NAT 等 SLA 由原来的 99.95%提高到 9995%,缩短业务的时间 5~10 倍。
此外,在公网上,我们将主干网与公网连通,当地域公网出现问题时,我们可以快速将公网转换为另一个地区的公网出口,这提高了公网接入的可靠性。
此外,跨域网络我们通过 ZooRoute 该技术提高了跨域长传链接的可靠性,减少不能使用的时间ZooRoute 利用多路径技术解决长传链路的振动问题c;并且缩短了所有丢包时间 75%,大大提高了链接的稳定性。
进一步洛神网络还可以与客户一起积极提高其应用的稳定性
做基础设施运维的人都知道,当你建立基础设施时,,你心里放心吗?不那么安心你必须经常做一些故障演练因为你总是担心问题是否会真正产生,万一发生,你真的能平静地解决故障吗?
如何进行故障演练?根据原控制台和 Open API, 改正或删除这部分的所有原始目标?反而破坏了拓扑的稳定性。
今年,洛神云网络产品逐渐构建了容灾演习的功效,能让用户在不改变真正业务网络的情况下,开展积极有目的的容灾模拟演练,现在已经支持了 ALB/NLB 商品,EC 商品即将适用,基于云网络产品水平,用户可以选择打开容灾演习。
以 ALB 例如,ALB 每个可用区都有 VIP 公布,每个可用区 VIP 都会接受应用要求。用户可以主动选择关闭可用区 VIP,此时,流量和业务要求自然会转化为其他可用区,用户可以观察这个转换是否符合预期,判断容灾架构是否强大;根据容灾回切计划也可以再次使用那个可用区 VIP 恢复,这就完成了容灾演习的全过程。
更重要的是,,客户操作,例如,打开和关闭时间,流量转换、转移和恢复的时间,都产生日志并提提供客户客户可以自己分析你容灾演习的准确性。
02 云网络安全的各个方面
“
在企业业务场景下,我们应该有一个清晰的安全边界
可以保护南北互联网流量,可追溯性,东西向内网流量可控c;
达到安全合规比如金融业的强管控规定..
——某头部网络金融客户 运维主管
”
二是云网络安全,让我们谈谈我们的客户对安全的理解,“在公司场景中,要做到安全边界清晰南北网络安全,另一个更重要的是内网安全的可控性。”
云网络安全,过去很长一段时间,洛神云网络一直在建立丰富的安全能力:跨域带来全面安全合规的跨域组网水平;在 VPC 荒岛VPC带来可选c;及其安全组、子网 ACL、云防火墙三层安全系统;使用互动网络,洛神云网络给予高防 EIP,负载平衡支持一键开启 WAF,提供便捷的业务安全水平开放。

今年,每个人都在不断提高原来的安全能力,并覆盖更多商品。
今年,每个人都在不断提高原来的安全能力,并覆盖更多商品。
第一个,私网联接浏览 OSS 能力。
原先的 OSS 发布给用户连接时,也是通过互通的公用事业 VIP 让我们互相浏览,我们认为这种安全是不够的,所以这次我们要去 OSS 和 PrivateLink 结合在一起。每个用户都可以为他做一个 VPC 去个性化一个 PrivateLink 私网VIP,这一 VIP 只指定这个客户这个客户 VPC 可以浏览此外,源头安全鉴权、密钥管理、流量可视化、组网等相关特殊,大幅提升浏览量 OSS 的安全。
第二,适用于混合云网络的加密。
原来你要拉一条专线,将你的 IDC 和公共云的 VPC 当连接在一起时c;您使用的是运营商的专线,运营商这条专线是私有的,也让你建立一个私人网络。这一次,我们将 VPN 与我们的 EC 产品组合,您可以加密专线链接上传输的流量,这样就形成了一个混合云本身 IDC 的安全。融合公共云 VPC安全,中间传输链路的安全性,所有这些都能实现东西方向的整体流量安全。
第三,整合更多的网络安全合作伙伴
,共同构建更完整、系统的安全能力。例如,飞塔在中国首次发布 Flex-VM 预授权方法,适用于相似的按量支付能力提供公司级网络安全解决方案。
03 追求极致能
“
RTA广告商必须立即接受许多要求,并结合自己的信息 快速分析决策,所以他们对延迟,大带宽,
”
第一个是大带宽,我们最大的客户已经到达 51.2T 专线接入带宽,这是一个非常大的带宽;单个VPC,我们以前适用于单独 VPC 6 万只 IP, 6 万只 IP 代表6万多台虚拟机或器皿,也是一个非常大的算率规模;对于公网的 EIP,大家也提供 Tb 等级带宽,也有 NAT 200G 吞吐能力的带宽。

今年,我们大大提高了这些水平。
今年,我们大大提高了这些水平。
最先
,我们将单独 VPC 容下私网IP总数增加到 30 万,从 6 万提高到 30 万,这是一个很大的改进。我们认为洛神网络的能力已经大大超越了 30 万,因此,它必须为用户提供如此大的数量 IP 水平,没必要挤牙膏今年 6 万,来年 7 万,我们选择一次保证这种能力 30 万,最大限度的让价客户,让客户尽快体验云计算的规模收入。
第二个
,云原生早已被用户自然接受c;容器建立速率也成为一个非常关键的业务指标和挑战,取决于 K8S 能做到多弹。今日,我们将所有洛神网络从操纵链接到#xff0c;到虚拟化层到内核层全方位优化升级。今日,我们将所有洛神网络从操纵链接到#xff0c;到虚拟化层到内核层全方位优化升级。通过这次提升,我们将 ENI 建立速度提高到每秒 900 个。
第三个
,出航等全球化业务的快速发展,给出了建立全球网络的终极要求,在 TR 分享路由器,基于过去十年推出的网络转发和架构水平,将 TR 带宽增加到 100G也是很大的带宽吞吐。
04 面对自适应弹,自由使用负荷
解决突变的流量模型,我们应该能够随意使用弹能够发布,
不要担心负载平衡规格响应流量和连接数。
积极推进更加便捷稳定的网络结构,提高集群总数, 减少部署和维护费用‘零’压力完成应用负荷分配..——某交易电子集团 互联网业务发展部长
”
客户在云上布置业务,业务负荷会有多高?其实很难预测。
客户在云上布置业务,业务负荷会有多高?其实很难预测。预测保守,可能会导致资源不足,因此,业务受到影响;激进的预测,似乎不需要那么多,造成资源和成本消耗。有多少预测是合适的?事实上,业务负荷是一项基本不可能完成的任务。
那么如何解决这些问题最重要的是取消云产品的案例规范,相反,响应弹的水平来自于融入客户业务的增长和业务突发事件。假如一个产品有规格你必须考虑我有多少规格是合理的。
业务开始部署时,您设置了斜线规格,好像没事业务也可以正常运行。
第三阶段,业务持续改善再次叠加的持续增长。此时,您对负载的预测过于保守,也许是因为你认为之前的成本已经消耗了,预测传统点结果造成了业务损失。
多年前,洛神网络的许多产品开始给予自适应弹水平,即开即用客户不必关心业务所需的规格是多少,只需关注业务如何增长。今年,进一步优化和提高响应弹的水平,为了满足大多数弹出场景的需要。
最先
,NLB 提高商品自适应弹并发技能 1 十亿次,在面对海量物联场景时,这种弹能起到关键作用。根据自动移动后台,观察业务并发、新建、带宽等维度c;而且后台实时决策,进行弹伸缩。
第二个,ALB 公布固定 IP 的方式。当你的业务改善时,你 ALB 每个可用区域都有 VIP,你觉得这很好,因为他去了流量匀称的发散,但你可能会遇到一些受制于某些情况的情况 VIP 的提高。所以,我们把 ALB 固定()VIP 的自适应弹 QPS 提高到 50 万,立即盈利是为了防止 VIP 新增域名相关问题。

新功能发布:ALB 适用固定 IP 方式
下面,我详细介绍一下 ALB 固定 IP 模式背后的技术。
假设你现在有一个 ALB 案例打开固定 IP 方法,当这个 ALB 具体项目在增长时,不需要扩展新的VIP,相反,它可以再次压这个要求 VIP 上,洛神网络的后台将这样做 ALB 扩大案例共享集群,提高 ALB 项目承载力;
业务更大,也可以分享集群同组的横向扩展(新的共享集群),当水平和垂直结合在一起时,大幅提升 ALB 自适应弹的水平。
垂直和水平扩展资源不平衡可能会导致#xff0c;提高即时弹的技术水平,因此,我们还提供了一种跨集群水位平衡技术来平衡水位集群,始终使整个集群的水位处于最适合弹性伸缩的状态。
05 基深度可观测,逐步完善客户网络结构
“
在复杂的网络环境中,大家都迫切需要认识云虚拟化网络,
可视化呈现即时质量快速发现和定位网络问题, 防止自己成为业务瓶颈,减少被投诉…——国际零售巨头 运维主管
”

网络非常复杂,#xff00c;网络的复杂性来自于大量的网络目标,非常多的对象,目标中间有很多协议,这三个维度组合在一起,它给网络带来了织网的复杂性。网状结构容易出现问题,出了问题,能否快速发现和处理故障,这是一个很大的考验。
今年,对网络智能服务 NIS 全新的功能升级工具集c;使网络管理更加高效,更好的体验现在有免费的。
第一个
,NIS 提供深层观察能力,全场景覆盖认知,网络各维度的用量,9 类指标,57 个观察项。

第二个
,如果我们发现有问题或者阿里云后台本身发现问题我们将向用户推送积极预警事件,NIS 适用于事件中心功能 13 主动推送类网络问题;另外,还支持全面检查网络健康包括案例健康、路径连接和商品关键事件。
目前,有些水平已经过去了 OpenAPI 得到,并集成到客户现有的运维监控系统客户可以基于 NIS 构建自身业务网络全生命周期高效运维服务水平的能力。
让我们来看看具体的场景,客户在构建业务云网络时涉及选址、规划、配备、运营,多个环节,如故障,大部分操作都是手动,效率低,异常不能快速发现。
拥有网络智能服务 NIS 工具集后,客户云网络的全生命周期可以开始可视化,API 变革的高效管理,包括实时选址,拓扑在市场规划中的自动绘制水平,配备方面的配备检查和连接认证,还有操作对话级别观察,及其对故障的积极预警,自助诊断,定期检查等能力。
以配备为例路由配置错误是一种非常常见的现象。NIS 能够检查路由配置,如 IP 是否正确分配#xff0c;#xff0合理等c;NIS 都有类似的检查项目;发生故障时,您必须期待快速理解问题的原因并解决问题;针对此类故障问题NIS 还提供一键诊断水平,用户可以快速区分故障的来源和原因。根据 OpenAPI 未通过洛神网络的用户控制台,相反,它集成到我们的操作和维护系统,融入自己的业务系统,阿里云网络应用更快捷方便。
06 客户自服务水平,检验货物易用性很重要
“ 在迁移上云的过程中,多团队多项目并发正常,网络自动化连接每一个复杂的环境能力对我们至关重要c;
同时,大家也在积极探索让布局更简单的工具, 确保交付的高效和顺利,像 Terraform、FC… ——某 MNC 顾客 IT 架构师
”另一种是自服务能力,云客户最基本的要求是自动化,更简单实用,这就是为什么洛神网络一直致力于云网络自服务水平的建设。
最先
第二个
,加强客户诊断水平,包括提供 9 大云网络产品144 确诊项目粗粒度的诊断水平。

第三个
第三个,还提供更强的 IaC 水平,可以让用户根据 Terraform 云网络产品的应用。目前,洛神网络的核心产品早已存在 100% 连接 Terraform。

前面提到的真正复杂,是指用网和管网,特别是涉及多场景的云网络;让我们来看看头部游戏客户的运维问题,“大规模混合云网络难以管理,点到点互联配备复杂静态路由人工维护成本高。”
首先,让我们来看看专线接入这个原始架构。假设阿里云客户来自阿里云客户 4 接入一个区域 4 专线,建立了混合云链接,他在 4 个地区有 VPC,把这些都连接起来,有必要建立一个 full-mesh (类似于原VPC peering)接口方式这种方法的特点是复杂性,容易出错特别是每多一个对象,大大提高了错误的水平。
针对这种情况今年将推出洛神网络 专线ECR (Express Connect Router)。
ECR 能够聚集双方然后所有的专线只需要和专线一起使用 ECR 开展互联全部的 VPC 也只要跟 ECR 互联,不再选用 full-mesh 组网方式,而是采用 hub-spoke 组网方式,所有的复杂性都大大降低了,而且所有的网络结构都是分层的,从对接的 N 点成中间 ECR 1 点,大大简化了路由管理,而且还提供 BGP 动态路由同步功能;另外,ECR 还提供路由分组能力路由配置的复杂性可以进一步降低。“乾以易知坤以简能” 简单的东西,高效运行,更不容易出错。就像我逐渐提到的,经过十多年的发展产品的性能越来越多,收费的形状也越来越多,也许有越来越多的定义,学习和理解云网络的成本和门槛越来越高,这一次,我们将简化繁化,以技术创新促进客户成本节约c;主动与客户分享规模和技术红利。
我们将所有流量计费产品合并到公网 CDT,统一跨域长传流量计费 CDT,将 SLB、NAT、VPN 这种收费是统一的 CU,用户不需要理解复杂的概念,如新建、并发和带宽。
首先,带宽产品统一,计量、销售和出售公共网络和跨域账户,而且 CDT 给台阶计费的方法,可以更大程度地降低使用成本。同时,今年,我们将每月给每个用户 10G 完全免费流量,跨区域连接适用于按量支付#xff0c;所有这些都是我们期望给用户更多的折扣,降低客户上云的成本。 次之,统一网元收费模式,将 NAT、SLB、TR、GA 这类产品统一到网元收费模型 CU,多产品收费规格企业,统一的数据处理计量 CU,并支持按量支付。今年,CLB、GA 这两种新产品适用于按量支付#xff0c;TR 作为第一个产品开始适用 Saving Plan,后面会有更多的网元产品支持。针对原本突发项目,客户从原来的规格转变为按量付费,成本可能会大幅下降同时,它将掌握更强的弹性水平。针对原本突发项目,客户从原规格转变为按量支付,成本可能会大幅下降同时,它将掌握更强的弹性水平。 经过十多年的网络技术积累,飞天洛神云网络正在逐步发展。“让网络更方便”的信念,继续深耕技术,把复杂留给自己,把简单留给我们的客户,推动更多客户上好云,用好云。 我们的 ALB/NLB 助推 TCL 全球物联网构建了一个弹出智能的全球化b;作为著名的游戏制作人,网易雷火c;根据 Terraform 使用我们的 TR/EIP 商品,创造一个灵巧的安全球网全球游戏玩家体验大幅提升#xff1b;国泰产险是基于我们的 CEN/GA/TR/SAG 等商品,打造企业级高能弹云网络。 目前,我们已经为世界服务 400 多万客户1000 多万开发者在未来,我们将永远不会忘记我们的初衷c;不断创新努力打造更简单易用的智能云网络。 目前,我们已经为世界服务 400 多万客户1000 多万开发者在未来,我们将永远不会忘记我们的初衷c;不断创新努力打造更简单易用的智能云网络。