ICT数学问题

华为十大问题:大规模通信网络的最优控制问题

发布时间:2022-07-01 文:任疆

问题背景:

随着通信网络的快速发展浸入式AR/VR、车联网、工业互联网等新型的网络应用日益增多。与传统的应用相比,这些新应用在网络传输的带宽、时延、丢包、抖动等多方面指标都提出了多维度的新要求传统意义上的网络层TCP/IP协议栈以及无线MAC/PHY层的调度和资源分配算法无法直接支撑上述复杂多样化的业务需求;另一方面,随着网络节点规模与终端用户数量的激增,各个网络层所需处理的优化和控制问题的规模也随之呈现爆炸式增长,这给通信网络在如何将有限的网络资源实现快速合理分配的问题上带来更大的挑战。大规模通信网络的最优控制问题的快速稳定求解将成为构建未来智能通信网络的关键基石。在过去二三十年中,学术界在优化和控制领域实现了长足的发展和进步,然而新一代通信网络中业务的多样化需求和问题指数级增长的规模都给传统领域的方法论带来了全新的挑战。

从业务本身角度分析通信网络中的业务变得逐渐复杂多样其目标也难以用单一简洁的数学表达式刻画过去的传统业务目标可以较为直接与流量、时延与丢包等指标对应,而伴随5G商用,AR/VR与工业互联网等新型应用中的关键业务则需要更加严格的保障。此外,未来网络关注的是业务的端到端指标,网络单跳的性能指标无法直接准确反映终端用户的业务体验,因此需要对整体网络都搭建起可提供性能保障的理论模型但是由于业务本身的随机性分布非常复杂加之业务在网络上传输互相干扰与耦合都给端到端精准刻画业务的性能指标带来了极大困难不同业务在带宽、时延、抖动、同步等方面对网络提出了不同的需求使得其对网络的需求呈现出多目标的特征而其中单目标函数往往又是非凸非平滑的。对通信网络资源进行合理分配使得满足不同业务多维度的需求显得十分困难。

从通信网络设备角度分析,5G时代的底层设备日益复杂。经过复杂设计与精准校调后的底层设备在支撑起网络高效运行的同时其自身也逐渐变得难以用简洁数学模型精准刻画这些复杂的底层网络设备通常内部引入多种负反馈机制,在运行时不可避免地在整体网络控制过程中引入了多种非线性环节从网络控制角度出发在对底层网络设备进行建模时在较好描述物理过程的同时需要保持模型轻量化,方便后续理论分析进而获取性能保障。

从动态网络控制角度分析,未来通信网络的控制需要对非平稳业务实现全网分布式控制达到近似全局最优控制的效果。一方面,未来业务变化呈现出非自相似、重尾、强突发等特性,这给动态控制中的业务流量准确建模本身就带来了极大挑战。而且终端用户面临的网络环境也存在极大偏差,由于场景中的建筑和植被的影响,多径叠加与多普勒效应等因素给为终端用户提供端到端的优质网络服务带来额外的难题。另一方面,由于未来网络规模巨大,不可能仅使用一个全局控制器来控制整个网络,而是需要对网络进行系统性划分后分布式管理。新型业务对网络可靠性要求非常严苛,并且在故障发生后网络也必须具有故障快速定位和及时恢复能力网络中的各种调整变量之间也存在弱耦合,即使是单点的网络调整常常也会带来局部的较大改变。以上几点都给动态网络的最优控制带来了全新挑战。

从网络和业务规模角度分析随着未来网络的发展网络上的节点数量和种类、终端用户以及业务的数量会呈现激增。传统优化与控制领域能实时高效求解的问题的变量规模处于千万级别以下,而未来大规模网络下相同类型的问题的变量规模会上升到上亿甚至百亿级别。通信网络中优化和控制问题求解的精度与时效性要求很高任何超时或不可行的解会对整体网络产生不可估量的影响因此,如何设计高效稳定的优化算法框架和底层支持技术求解大规模优化和控制问题将是解决未来通信网络的关键。

问题定义

(1) 大规模非线性非凸网络建模与优化

对一个大规模的通信网络进行精准完全建模与高效资源分配。例如在传统网络效用最大化的优化问题中,主要关心的是网络带宽分配:

其中 x为网络业务的流量分配值R为网络的路由矩阵Uk为第 k 个业务对所分配流量的效用函数。而在未来通信网络中新型网络业务的通信质量不再仅仅取决于带宽分配而是与传输的时延、抖动等因素也有着密切关系同时业务流量间潜在的复杂耦合关系对网络状态也具有一定影响首先对业务流量需要做出一定假设,并基于特定的满足假设业务流量模型,结合业务的端到端的多目标需求设计网络资源分配的目标函数。然后对网络中信息传输过程,如链路传输时间和队列时延,完成适当精准的建模对网络中的物理限制如带宽容量等进行建模,最后统一将约束添加到优化体后进行求解,得到网络资源最优分配。值得注意的是在考虑以上复杂现象后得到的目标函数的非凸非光滑、零范数约束、低秩约束等都会极大影响该优化问题的求解难度。学术界的非凸优化理论以及各种类型的优化求解框架(比如 Primal-Dual Decomposition,ADMM Approach)等均可作为这类方法的起点。对于大规模网络优化问题的求解,并行化技术和机器学习等方法具有相当大的潜力,也值得进行系统性探究。

(2) 分布式在线动态控制

在传统网络优化控制问题中,一般业务流量模型和网络拓扑结构都假设是静态已知的,问题的目标主要集中在找到给定业务网络模型下的最优解传统经典的关于大型动力系统的动态控制往往依托于较强的假设,比如线性的动力系统方程与轻尾分布的噪声扰动。然而未来网络场景中的流量模型的高突发重尾及不平稳现象,使得之前工作中的假设不再满足同时,一个仅考虑当前时刻信息的静态的优化问题并不再满足实际需求而需要额外考虑业务和网络二者本身的动态变化在对业务在网络中的分布与网络本身结构建立合理准确的预测模型后,通过控制业务的准入、业务发送速率、网络设备的动态参数调整实现预测下的近似全网最优控制网络的集中式最优控制策略可以通过求 Bellman方程得到:

其中 s为系统状态a为系统动作V为价值函数r为回报函数 P则对应系统的转移概率因为维度灾难对大规模网络问题对应的Bellman方程进行精确求解极为困难而且在控制策略的实现方面,因网络规模极大,集中式控制方法受限于中央控制器的计算能力与底层执行设备间通信延迟,分布式控制策略成为了必需。在根据网络结构对网络状态进行一定的分层与分块后,Bellman方程的近似解可以在多个控制器中实现分布式计算。分布式控制方法需要考虑实际场景中通讯的延迟和指令执行的异步问题,如何在现有的网络架构下,基于新的假设与数学模型提出一套具有较好收敛速度等性能保障的分布式控制框架显得尤为重要。

未来研究方向:

大规模通信网络的最优控制问题有如下潜在研究方向

(1) 多目标优化

5G时代的如 VR/AR、工业互联网等重要业务的新需求进行系统性分析并合理构建新的网络通信质量指标以满足这些新需求将这些新指标作为业务的多个目标分出主次并搭建起精确合理的多目标优化网络资源分配框架与其对应的快速求解方法。

(2) 网络底层设备运行机制建模与控制研究

对网络底层的通讯设备研究并建立数学模型针对网络控制功能轻量化模型的同时得到较好的可量化的性能保障。

(3) 网络分块分层架构与分布式优化

全新的业务需求,复杂的网络性能指标引入了新的分布式优化问题。对新问题在优化分解的框架下做研究分析,探索新的网络分层架构。结合场景中的控制器通讯时延等因素,探索特定分层中的网络分片架构根据网络分块分层架构探索分布式优化中的实现问题例如控制器间通讯延迟下的异步式更新。

(4) 业务流量预测与高效连续求解

5G新业务建立新的流量分析与预测模型并将预测模型与网络优化问题有机结合起来在优化问题连续性求解的框架下提高资源部署分配效率。基于流量预测模型针对性,通过流量整形等功能降低不同业务间的流量耦合。

(5) 非凸大规模网络优化问题的快速数值求解

复杂的网络性能指标在优化问题中引入非凸部分。利用网络问题本身结构的性质,如稀疏性,研究如何完成大规模优化问题的快速数值精确求解或近似求解。

(6) 学习优化与多智能体

在网络分层分片后,各个子网的控制器可视为相互间较为独立的子系统。从分布式智能体与博弈论的角度,可研究分布式智能控制算法与相应的通信拓扑结构设计问题。从分布式智能体与博弈论的角度可研究分布式智能控制算法与相应的通信拓扑结构设计问题基于Markov决策过程、多臂老虎机和平均场博弈等方法,为解决大规模网络下的分布式控制问题提供了强化学习的理论工具。


附件下载: