ICT数学问题

华为十大问题:反问题高精度快速求解问题

发布时间:2022-07-01 文:任疆

问题背景:

大数据时代,每年产生的数据量成指数增长。根据 IDC2018年报 2025年全球将产生 175 ZB的数据量如此海量数据为数据存储提出了巨大的挑战。另一方面,近年来,越来越多的个人用户和商业用户把数据存储在云存储中这使得在所有存储方式中云存储占比呈明显的递增趋势。发展低廉、高效的适用于云存储的存储介质成为主要研究课题。在这种背景下,发展新型光存储成为当前存储领域的主要方向之一。

图1:五维玻璃存储基本原理及五维示

自从 1982 年第一款CD发布以来光存储历经了CDVCD、蓝光和AD等多代技术更新并在视频存储等方面取得了不错的成就。 经典的光存储一直向着更小存储尺度进发,从而一步一步提升单盘的存储能力这其中催生出了众多核心写入、读取、识别、编码和伺服技术。尽管近年来依然有各种突破衍射极限的技术存在,但单独发展更小存储尺度的技术面临越来越多的瓶颈如今,基于维度复用,向更高维度发展成为光存储的研究方向。

高维光存储的发展方向多种多样从形态上更高维度涉及多层(由平面转向三维空间)、多模(利用光的波长、偏振、相位等信息在同一个位置使用不同光写入多个信息)和多阶(利用光的能量、波长、偏振、相位等信息在一个位置写入多进制信息)。从实现方式上近年来发展出了多种核心技术,如基于飞秒激光射入石英玻璃产生纳米光栅结构技术的五维玻璃存储(三维空间、光的偏振和光的能量)、基于纳米金棒与飞秒激光共振技术的纳米金存储技术(三维空间、偏振、基于飞秒激光与有机玻璃产生熔融效果的有机玻璃存储(三维空间、能量和基于飞秒激光导致蚕丝蛋白结构改变的蚕丝蛋白存储技术众多材料的研发促进了光存储的发展,同时也提出了众多数学问题。

光存储中,数据读取是基于写入信息对光的物理性质的改变的特性。在传统光存储中,存储方式往往是单层、单模和单阶高维光存储可极大提升单盘的存储能力但同时也极大提升了数据读取的难度。多层、多模和多阶意味着强数据串扰和高数据恢复精度要求。在这种情况下,传统的基于数据恢复的方法精度难以满足要求。另一方面,更高存储密度也需要更高的读取速度来匹配,这对数据读取算法的效率提出了高要求如何发展高效、高精度数据读取算法成为关键问题。

反问题是一种从非直接测量数据获取所关心物理量的方法 20世纪40年代以来伴随着雷达和声呐的发展,反问题开始受到越来越多的关注之后地质学和石油勘探的发展进一步促进了反问题数值方法的研究和理论的发展医学成像又为反问题提供了一大应用场景如今反问题已发展成为应用数学的一大重要数学分支形成了一套反问题的求解方法和理论分析工具近期随着深度学习的发展,还发展出了一些融合反问题方法和神经网络的新的求解方法

反问题有三个基本要素:(1)测量算子 M即数据测量方式;(2)噪声模型 ε即描述测量算子误差模型;(3)正问题的先验模型 Fprior即在没有误差情况下已知待求解量到测量结果的模型通常情况下,实际测量数据

d = Mθ = F(θ)+ ε,

其中F是真实模型由于反问题病态性的特征,噪声模型关系到正则化方法的构造。正问题的先验模型是反问题理论分析和数值求解的基础在三者均清楚的情况下现有的反问题理论与数值方法已较为完善。

光存储中的数据读取是典型的反问题,即基于某种光学设备对存储介质中信息进行测量,从而计算出存储介质中对应点的某种物理性质进而获得该点存储的信息以五维玻璃存储(参见图16)为例,对于单层情形,正问题先验模型为:

其中Tt T0分别是接收和入射光强度α β为测量参数,∆ ψ为待测量物理量噪声模型依赖于材料和工艺而定,通常针对特定材料和工艺,噪声模型可从现实中学到基于反问题的思路可设计高效、高精度数据读取算法对于多层情形如何基于反问题的思路设计高效、高精度数据读取算法是极具潜力的研究方向,但也面临各种挑战。

问题定义:

光存储向更小存储尺度和更高维度的发展,为数据读取带来了各种各样的困难。更小的存储尺度导致数据读取时的读取信号中存在不同位置处的信号干扰在多层存储中数据读取的光路需经过多层介质后才聚焦在待读取层,层与层之间的串扰为测量数据带来巨大噪声。在多阶存储中,一个信息用于存储多个值,这对数据读取提出了很高的分辨精度要求。在多模存储中,同一个空间位置需要使用不同特性的光(如不同波长或偏振方向的光存入不同的信息这为测量信号带来非线性干扰。这些新的问题在数学上带来了以下学术难题:

(1) 正问题建模

高维存储中的正问题模型依然不清楚。以五维玻璃存储为例,纳米光栅方面的相关研究已比较丰富但是在多层存储中不同层间的纳米光栅相互干扰若直接将这些干扰作为噪声当存储层数较多时噪声逐渐增大导致数据读取误差递增考虑多层情形建模时层数增加后如何构造准确的近似模型变得复杂同时在存储尺度变小时同一存储层内不同纳米光栅也会产生相互干扰如何构造描述层内干扰的模型也是值得探索的方向。

(2) 噪声模型刻画

光存储中测量误差来源于多个方面包括材料均匀性、写入设备、读取设备和存储中材料变形等如何针对该复杂体系构造相应的噪声模型是反问题正则化方法构造的关键。

实际的存储中,更小尺寸、多层、多模(或多阶)往往同时出现众多种类的相互干扰使得最终测量信号具有极大的噪声针对存储中的特性如何探索噪声模型、设计专门的正则化方法和构建正问题模型是本质难点,如何构造高效、高精度数据读取算法是一个重要技术挑战。

未来研究方向:

以反问题理论为基础,结合光存储中问题的特性,充分挖掘海量测量数据特征是未来的研究探索方向,在物理建模结合数据驱动和正则化等方向上值得进一步研究。

(1) 数据 + 物理建模

针对多层、多模(或多阶情形层间干扰、层内干扰和多模模间干扰为正问题建模带来巨大困难实际研发中通常拥有海量的测量数据这使得数据 + 物理”的建模方式成为一种非常具有潜力的方法一方面基于光学理论可对问题进行初步分析获得模型的定性特征另一方面海量的数据蕴含着问题的模型信息该方向旨在设计一种基于某种可解释方法(如可微编程)充分利用数据并结合物理特征,进而从数据中学习模型规律,从而实现正问题的建模。

(2) 基于模型约简策略的物理建模

光存储中光的特性可以使用Maxwell理论等进行描述基于该基础模型对整体系统进行描述可获得准确的物理模型,但所得模型往往过于复杂而难以用于工程应用可基于模型约简策略(基于理论分析或数值方法)对底层物理模型进行约简,从而获得高精度的简化近似模型。

(3) 正则化方法探索

如前所述,光存储中测量误差来源多种多样,如何刻画噪声模型是研究难点,相对应的正则化方法构造变得难以确定而光存储中存储信号往往为 0 1,或少数几个离散值可否基于这些特征构造特定的正则化方法、提升数据分析的稳定性和准确性是研究方向之一另一方面由于拥有海量测量数据,如何从数据中学习获得噪声模型,并用其指导正则化方法构造也是研究方向之一。

(4) 高效反问题方法探索

由于存储读取速率的要求,传统基于迭代法的反问题求解方法的效率往往不够; 另一方面,传统光存储中基于数据分析的数据读取算法能取得不错效果。结合反问题的方法和数据分析的方法,联合设计超高效的数据读取算法是重要研究方向。

(5) 反问题的适定性分析

在获得正问题模型情况下,针对该反问题的理论分析,尤其是适定性分析是构造保证反问题解的稳定性和算法可靠性的关键;同时,反问题理论方面的研究是探索数据读取能力极限的理论基础。


附件下载: