昆明理工大学布金伟博士:融合星载GNSS-R数据和多变量参数全球海洋有效波高深度学习反演法|《测绘学报》2024年53卷第7期

本文内容来源于《测绘学报》2024年第7期(审图号GS京(2024)1261号)


融合星载GNSS-R数据和多变量参数全球海洋有效波高深度学习反演法
布金伟,1, 余科根,2, 汪秋兰1, 李玲惠1, 刘馨雨1, 左小清1, 常军3
1.昆明理工大学国土资源工程学院,云南 昆明 650093
2.中国矿业大学环境与测绘学院,江苏 徐州 221116
3.自然资源部第一大地测量队,陕西 西安 710054

摘要:星载GNSS-R作为一种新兴的观测方法,最近被应用于有效波高反演。现有研究通常使用从延迟多普勒图中提取的特征值以构建经验地球物理模型函数反演SWH。然而,使用多个变量参数作为模型输入具有很大挑战。为此,本文提出了一个融合星载GNSS-R数据和多变量参数反演全球海面SWH的深度学习网络模型(GloWH-Net)。为了验证本文模型的性能,ERA5、WaveWatch Ⅲ和AVISO SWH数据被用作广泛测试的参考数据,以评估GloWH-Net模型和先前模型(即经验模型和机器学习模型)的SWH反演性能。结果表明,当分别使用ERA5、WaveWatchⅢ和AVISO SWH作为参考值时,所提的GloWH-Net模型反演SWH的均方根误差分别为0.330、0.393和0.433 m,相关系数分别为0.91、0.89和0.84。相比基于最小方差估计器的经验组合模型反演SWH的均方根误差分别降低了53.45%、48.06%和40.63%;相比袋装树机器学习模型反演SWH的均方根误差分别降低了21.92%、18.72%和4.47%。表明了本文方法在反演全球海面SWH方面具有显著优势。关键词: GNSS-R; 延迟多普勒图; 海洋有效波高; 经验模型; 深度学习模型

基金项目

云南省基础研究计划项目(202401CF070151); 昆明理工大学高层次人才平台建设项目(20230041); 国家自然科学基金(42174022)(42161067); 云南省大学生创新训练计划项目(S202310674221)
作者简介

布金伟(1992—),男,博士,研究方向为GNSS反射遥感。E-mail:b_jinwei@kust.edu.cn通信作者: 余科根 E-mail:kegen.yu@cumt.edu.cn
本文引用格式布金伟, 余科根, 汪秋兰, 等. 融合星载GNSS-R数据和多变量参数全球海洋有效波高深度学习反演法[J]. 测绘学报, 2024, 53(7): 1321-1335. doi:10.11947/j.AGCS.2024.20230050.BU Jinwei, YU Kegen, WANG Qiulan, et al. Deep learning retrieval method for global ocean significant wave height by integrating spaceborne GNSS-R data and multivariable parameters[J]. Acta Geodaetica et Cartographica Sinica, 2024, 53(7): 1321-1335. doi:10.11947/j.AGCS.2024.20230050.
阅读全文
http://xb.chinasmp.com/article/2024/1001-1595/1001-1595-2024-07-1321.shtml

有效波高(significant wave height,SWH)是表征海浪的关键参数,通常用于海况监测,以确保海上航行安全。卫星雷达高度计是获取SWH信息的主要工具之一,但是,除非部署许多此类卫星,否则难以将其用于大规模海况监测。星载GNSS-R技术因其具有时空分辨率高、观测成本低、覆盖面广、全天候运行等独特优势可为估计SWH提供一种思路。GNSS-R技术已被证明是用于反演海面SWH的重要手段。一种典型的SWH反演方法是干涉复数场(interferometric complex field,ICF)[1-2]。该方法利用GNSS反射信号与直达信号的干涉复数场的有效相关时间反演海浪有效波高。另外一种方法是GNSS-R干涉图技术(interference pattern technique,IPT),该技术由文献[3]提出,岸基试验结果表明,该方法估计的有效波高精度达6 cm。
针对机载、岸基和船载试验,文献[4]利用GNSS-R实测及超声波浪仪同步观测数据计算有效波高参数,与波浪仪实测数据对比,反演平均误差为2.88 cm。文献[5]用三次多项式插值法计算相关时间,并建立了相关时间与SWH之间的经验公式,反演结果与声学波浪仪观测数据相比较为一致。文献[2]利用L、S和Ku波段机会信号进行双基地雷达SWH测量,提出了利用频谱带宽与SWH建立经验模型,试验结果表明,当SWH<3 m时,SWH反演精度达0.4 m。同年,文献[6]研究了反射信号功率特征及信噪比,提出了一种利用反射信号信噪比反演SWH的方法。文献[7]进行了国内首次船载GNSS-R有效波高测量试验,GNSS-R测量有效波高的结果与船上安装的WAVEX雷达波浪仪数据具有一致性,试验结果表明了基于船载观测平台的GNSS-R技术测量有效波高具有可行性。文献[8]在天津渤海湾特定区域基于机载平台观测了大量GNSS-R延迟多普勒图(delay Doppler map,DDM)数据,并从DDM中计算了相关功率波形,进而通过计算DCF(derivative of the correlation function)的函数波形宽度得到海面有效波高,验证了机载平台下GNSS-R方法测量有效波高的可行性。文献[9]提出了一种基于使用GNSS-R的多卫星观测的SWH反演方法,该方法通过岸基试验收集的DDM获得信噪比(signal to noise ratio,SNR),并引入了结合多卫星仰角差异的偏移校正,该校正提高了SNR和SWH之间的相关性,从而能够估计SWH。文献[10]也研究了岸基GNSS反射信号反演有效波高,利用GPS L1和L5信号构建了有效波高反演模型,结果表明,当SWH<3 m时,GPS L1和L5信号反演SWH的RMSE分别为0.30 m和0.28 m。文献[11]基于岸基GNSS-IR数据提出了利用NARX回归神经网络反演SWH的方法,试验结果表明,当SWH在0.1~2.5 m时,SWH反演的均方误差(mean square error,MSE)最小为0.01 m,相关系数为0.936。文献[12]使用大地测量GNSS接收机测量海面有效波高,提出了基于截止高程的SWH估计方法,结果表明SWH反演与广义浅水波浪增长模型(generalized shallow water wave growth,GSWWG)的SWH仿真非常吻合。
针对星载平台试验,受X波段雷达的SWH测量公式[13]的启发,文献[14]使用飓风全球导航卫星系统(cyclone global navigation satellite system,CYGNSS)DDM提取的SNR数据估算SWH,ECMWF SWH数据和AVISO SWH数据被用作参考数据,首次验证了使用星载GNSS-R技术估算SWH的可行性。之后,文献[15]对文献[14]提出的方法进行了进一步的修改。他们利用延迟多普勒图平均功率(delay-Doppler map average,DDMA)和前沿斜率(leading edge slope,LES)观测值构建了估计SWH的多项式函数模型,并将SWH反演结果与ECMWF数据相比,结果表明SWH反演的RMSE和相关系数分别优于0.257 m和0.945,然而,与基于DDMA和LES的单观测值方法相比,基于加权平均(weighted average,WA)方法的组合模型反演SWH的RMSE仅分别提高了2.59%和1.21%。随后,文献[16—17]基于CYGNSS卫星测量的星载GNSS-R数据,开发了用于SWH反演的单观测值模型和基于最小方差估计器(minimum variance estimator,MVE)方法的双观测值组合模型。结果表明,与基于WA方法的组合模型和基于积分延迟波形的LES观测值模型相比,基于MVE建立的双观测值组合模型的RMSE分别提高了20.15%和14.74%。此外,文献[18]提出了一种基于归一化积分延迟波形反演星载GNSS-R海浪SWH的方法,试验结果表明了所提建模方法在星载GNSS-RSWH估计方面具有可行性和可靠性。
综上所述,针对GNSS-R海浪有效波高反演研究主要集中在岸基、船载和机载试验,仅少数文献报道了针对星载平台的GNSS-R有效波高反演,且主要针对SNR、DDMA和LES观测值构建有效波高反演经验模型。尽管取得了一些有希望的结果,然而,基于这些观测值构建的有效波高估计模型对于高有效波高海况下,反演精度较低。此外,经验组合模型相比单观测值(如DDMA或LES)模型精度提升非常有限,并且在高有效波高海况下反演精度也并不理想。主要原因是利用与GNSS-R过程相关的其他因素(例如几何和风速)作为经验模型的输入具有挑战性,尚没有在建模中深入考虑。SWH受到多种复杂因素的影响,这些因素使得海面SWH与GNSS-R特征值之间的关系更加复杂,难以用简单的经验模型来表征。机器或深度学习已被广泛用于反演地球物理参数,并获得了比经验函数模型更好的反演性能[19]。文献[20]采用神经网络方法开发了一种从CYGNSS数据中估计SWH的算法,结果表明,神经网络模型反演SWH与ECMWF再分析、浮标和Jason-3高度计SWH数据具有一致性,然而,反演精度改进主要在1~3 m的SWH,因为大多数数据点都在这个范围内(约88.7%)。尽管神经网络模型反演高海况SWH(大于6 m)无法得到有效解决,但是这项研究证明了神经网络方法在星载GNSS-R海浪监测方面的巨大潜力。文献[21]基于逐步线性回归、高斯支持向量机、人工神经网络、麻雀搜索算法-极限学习机和装袋树(bagging tree,BT)算法构建了星载GNSS-R海面SWH反演回归模型。结果表明,在5种回归模型中,BT模型在随机选取100万组数据进行测试时表现最好,RMSE为0.48 m,相关系数为0.82。尽管该方法进一步提高了SWH反演性能,但是在模型开发算法中仅考虑了GNSS-R观测值和辅助变量参数,忽视了GNSS-R DDM图像中的关键特征信息而限制了模型反演SWH的精度。文献[22]首次利用卷积神经网络从DDM中自动提取特征,进一步提高了SWH反演性能。遗憾的是,截至目前,仅极少数的研究利用深度学习方法构建星载GNSS-RSWH反演模型。
鉴于此,本文提出了一种利用星载GNSS-R数据反演全球海洋SWH的深度学习方法,构建了一个GloWH-Net模型估计SWH。与之前的神经网络方法相比,GloWH-Net深度学习模型由3个核心的神经网络模块构成。第1个网络可利用卷积神经网络从BRCS DDM和有效散射面积中自动提取与海面SWH相关的特征值;第2个网络利用双向长短期记忆网络(bidirectional long short-term memory,BiLSTM)捕捉上下文信息,从而更好地理解输入序列;第3个网络采用全连接网络融合海面环境和卫星辅助参数信息。最终,通过联合3个核心网络并采用全连接网络输出SWH反演值。本文也采用训练数据集和测试数据集分别对所提GloWH-Net模型进行了训练和测试,以评估模型的通用性和可靠性。本文方法为利用深度学习方法执行星载GNSS-RSWH反演提供了有价值的参考。

1 试验数据

本文采用了5个数据集开发和测试基于深度学习的星载GNSS-R全球有效波高反演模型,这5个数据集分别是:CYGNSS L1级GNSS-R数据;ERA5风速、风向、水深和SWH数据;全球降水计划多卫星降水联合反演IMERG(integrated multi-satellite retrievals)降水产品;WaveWatch Ⅲ(WW3)SWH数据;AVISO卫星高度计SWH数据。这些数据时间跨度为2019年4月1日—2020年4月1日。

1.1 CYGNSS L1级GNSS-R数据

美国国家航空航天局于2016年发射了由8颗(即CY01、CY02、CY03、CY04、CY05、CY06、CY07、和CY08)微型卫星组成的CYGNSS卫星系统,并在8颗CYGNSS卫星上搭载了延迟多普勒图测量仪,专门用于接收GNSS反射测量获取的DDM数据。目前,用户可以在CYGNSS官网中免费下载3种级别(即level 1、level 2、level 3)的CYGNSS数据产品,本文使用V3.1版本的L1级数据。

1.2 ERA5再分析数据集

ERA5是ECMWF推出的第5代大气再分析产品,它包含多种类型的数据集。在本文中,使用从1940年至今的单层每小时ERA5数据,可从网站(https://cds.climate.copernicus.eu/cdsapp#!/dataset/reanalysis-era5-single-levels)免费获取,包括2 m空气温度、2 m露点温度、总降水量、平均海平面气压、表面气压、10 m u风分量和10 m v风分量、风向、水深、边界层高度和海面波高等信息。本文使用了ERA5风速、风向、水深和有效波高数据。其中,ERA5有效波高数据包括3种类型:风浪和涌浪组合的SWH、风浪的SWH和涌浪的SWH。在本文中使用的是风浪和涌浪组合的SWH数据,该数据用于训练模型和测试模型。需要说明的是,ERA5风向数据、水深数据和有效波高数据的空间分辨率为0.5°×0.5°,时间分辨率为1 h。而10 m u风分量和10 m v风分量的空间分辨率为0.25°×0.25°,时间分辨率为1 h。其中,10 m u风分量和10 m v风分量数据通过空间上的双线性插值和时间上的线性插值与其他数据进行匹配,然后进行风合成,合成风速作为海面以上10 m处真实海面风速的参考值。

1.3 IMERG降水产品

GPM-IMERG采用三级多卫星降水算法,该算法结合了来自所有星座微波传感器的间歇降水估计、来自地球静止卫星的红外观测数据及来自雨量计的月降水数据。最新数据版本为IMERG-V6,GPM-IMERG有3类产品,分别是延迟约4 h的实时产品(IMERG-E)、延迟约14 h的近实时处理产品(IMERG-L)和最终运行产品(IMERG-F)。3类产品的空间分辨率均为0.1°×0.1°,均具有1个月、1 d和30 min的时间分辨率。本文使用时间分辨率为30 min的IMERG-F产品,可从GPM网站(https://gpm.nasa.gov/data/directory)免费下载。

1.4 WaveWatch Ⅲ(WW3)SWH数据

WaveWatch Ⅲ(WW3)是第3代波浪模型,由美国国家海洋和大气局及美国国家环境预报中心开发和维护。WW3提供了不同类型的数据集,包括有效波高、涌浪高和风浪有效波高等。本文使用的是有效波高数据,空间分辨率为0.5°×0.5°,时间分辨率为1 h,经度的覆盖范围为(180°W,180°E),纬度的覆盖范围为(77.5°S,77.5°N)。该数据用于测试模型,可以从网站(https://pae-paha.pacioos.hawaii.edu/thredds/catalog/ww3_global/catalog.html?dataset=ww3_global/WaveWatch_Ⅲ_Global_Wave_Model_best.ncd)免费下载。

1.5 AVISO SWH数据

AVISO组织向用户免费提供针对海洋表面相关的卫星观测数据,AVISO提供的数据包括海洋表面高度、平均海平面测高产品和海洋表面风速等,这些数据在海洋科学研究、海洋预报和环境监测等领域具有广泛的应用价值。本文采用的是AVISO SWH数据,空间分辨率为1°×1°,时间分辨率为24 h。该数据也用于测试模型,可以从网站(https://www.aviso.altimetry.fr/en/home.html)免费下载。

2 星载GNSS-R有效波高反演模型构建

2.1 方法描述

星载GNSS-R海面有效波高反演方法的数据处理流程和建模过程如图1所示。首先,对CYGNSS GNSS-R数据进行下采样,并与ERA5风速、ERA5风向、ERA5水深、ERA5有效波高、IMERG降雨数据、WW3和AVISO有效波高数据进行时间和空间匹配,以生成匹配数据集。为确保数据集的质量,采样数据需要根据文献[23]中的标准进行质量控制和过滤,从而得到过滤后的高质量数据集。然后,将数据集根据观测时间分为训练集、验证集和测试集,它们分别占过滤数据集的30%、15%和55%。

图1



图1 星载GNSS-R海面有效波高反演的数据处理和模型构建过程

Fig.1 Data processing and model building process of spaceborne GNSS-R sea surface significant wave height retrieval

为了验证所提出的基于深度学习方法的有效波高反演模型的改进性能,本文将模型训练进一步分为3类方法,即经验模型(包括DDMA、LEWS和组合模型(DDMA+LEWS方法))、机器学习(包括支持向量机(SVM)、袋装树(BT)和人工神经网络(ANN)模型)和深度学习(GloWH-Net模型)方法。其中,经验模型和机器学习方法已经被广泛讨论,这两类方法分别用于与本文的GloWH-Net深度学习模型进行对比。在经验模型方法中,ERA5风速、风向、水深和IMERG降雨数据均未用于反演有效波高。在机器学习方法中,ANN模型中的输入参数仅包括GNSS-R观测值和辅助参数,这里讨论ANN模型的目的是分析引入GNSS-R观测值、辅助参数和DDM图像对反演模型性能的影响。为了深度融合海面环境和卫星辅助信息,本文进一步提出了GloWH-Net深度学习模型。不同模型的输入参数的信息见表1。这些模型直接由训练集进行训练,采用验证集进行监督不同模型训练的性能,并使用完全独立于训练数据集的测试集测试这些方法的泛化能力。测试集中的参考SWH数据包括ERA5、WW3和AVISO SWH数据,其中WW3和AVISO SWH数据没有用于模型训练,因此两种数据集可以更好地评估所提出模型的稳健性和通用性。

表1 不同模型的输入参数信息

Tab.1 Input parameter information of different models

模型DDMs与DDM相关与接收机相关与几何相关其他辅助参数
BT/SVMBRCS,effectivescattering areaDDMA,LES,TES,LEWS,TEWS,SNRgps_eirp,sp_rx_gainsp_inc_angle,sp_lat,sp_lon,RCG风速、风向、水深、降雨量
ANN
GloWH-NetBRCS,effectivescattering area

新窗口打开| 下载CSV


2.2 基于DDMA观测值和LEWS观测值的经验模型

根据大量数据的曲线拟合试验,DDMA和LEWS观测值与ERA5 SWH数据之间的关系如图2所示,公式为
(1)

式中,xDDMA,ixLEWS,i分别表示DDMA观测值和LEWS观测值,其他符号是模型的拟合参数,表2给出了两个观测值模型的拟合参数和拟合性能指标(即RMSE和R2)。拟合曲线如图2中的品红色实线所示。


图2



图2 基于DDMA和LEWS观测值的有效波高反演经验模型

Fig.2 Empirical model for significant wave height retrieval based on DDMA and LEWS observables

表2 有效波高反演经验模型拟合参数和拟合性能

Tab.2 Fitting parameters and fitting performance of empirical models for significant wave height retrieval

模型拟合参数拟合性能指标
abcRMSE/mR2
经验模型(DDMA方法)0.953 3-0.204 9-0.094 50.7120.25
经验模型(LEWS方法)0.857 0-0.228 7-0.013 90.7090.26

新窗口打开| 下载CSV


由表2可知,基于DDMA和LEWS观测值构建的经验模型拟合结果与原数据的RMSE分别为0.712 m和0.709 m,相关系数分别为0.25和0.26。相关系数较低,这与文献[21]呈现的结果(RMSE和相关系数分别为0.79 m和0.25)基本一致。尽管DDMA和LEWS观测值与SWH存在相关性,然而SWH容易受到多种海况因素的影响[20]。因此,简单的经验模型难以实现高精度的SWH反演。

2.3 基于最小方差估计器的组合模型

为了充分利用GNSS-R观测值进行SWH反演,从DDMA和LEWS观测值获得的SWH估计值可以组合在一起,以产生最佳估计值。该最佳加权估计器利用单个DDMA和LEWS估计中的误差之间存在的去相关度,以最小化SWH估计中的均方根误差。估计器是单个估计值的线性组合,通过要求估计器无偏(即其反演的预期值等于待估计的真实量)和最小化其方差来获得权重,从而获得更好的结果[24]。该组合方法如下
(2)

式中,

表示从DDMA和LEWS观测值中反演的SWH;m=[mDDMAmLEWS]表示组合系数的向量,满足m·1=1的条件,以确保组合结果无偏。



最小方差估计器的方差如下

(3)

式中,Lm的大小。设c为单个SWH估计中误差的协方差矩阵,则c的元素为cpq=<(up-utrue)(uq-utrue)>;uputrue分别表示第p个GNSS-R观测值估计的SWH和对应的真实SWH;在本文中,设置p>0,q<2;<*>是平均运算符。


2.4 袋装树模型

袋装树(bagging tree,BT)模型是一种集成学习方法,它结合了决策树和装袋技术,是构建回归模型最流行的技术之一。袋装树模型的算法流程如下。

数据采样:从原始训练数据集中,使用自助采样法(bootstrap sampling)随机选择多个子样本。自助采样允许一个样本多次出现在同一个子样本中,同时也可能将某些样本排除在子样本之外。

模型训练:对每个子样本,独立地构建一个决策树模型。决策树模型根据特征的不同分裂节点,建立树状结构来进行回归。
集成预测:使用这些独立的决策树模型进行预测。对于回归问题,则可以取平均值作为最终的预测结果。
在本文中采用袋装树模型构建有效波高反演模型,为确保模型的训练性能,需要进行如下参数设置:①n_estimators=10,即子样本数量。②random_state:用于控制随机数生成器的种子。本文中,random_state=1。③warm_start:一个布尔值参数,表示是否允许增量训练。本文中,warm_start=True。

2.5 支持向量机模型

支持向量机回归(support vector regression,SVR)是一种基于支持向量机的回归模型。SVR的目标是通过找到一个超平面,使得训练样本点尽可能地靠近该超平面,并在容忍度内尽量降低预测误差。SVR的基本思想是将回归问题转化为求解一个凸优化问题。具体而言,SVR引入了一个容忍度参数ε来定义一个间隔带,目标是使得实际回归值与预测值之间的差异落在这个间隔带内。
SVR的数学形式可以表示为

(4)

式中,ψ是映射函数;wxi的权重;P是惩罚参数(由用户确定);εi是松弛变量,表示允许误差的容差;b是偏差项。


在SVR中,需要选择合适的核函数来处理非线性关系。常用的核函数包括线性核、多项式核和径向基函数(RBF)核等。通过引入核函数,SVR可以将输入样本映射到更高维的特征空间中进行回归分析。为了提高模型的性能,本文采用RBF作为核函数,表示为

(5)

式中,γ>0确定内核的规模。


2.6 人工神经网络模型

ANN是处理复杂非线性问题非常有效的方法,已广泛应用于遥感等领域。ANN中使用的隐藏层数量通常在1~3之间,很少使用4层,因为更多的隐藏层会导致更高的计算成本[25]。一般来说,具有3个隐藏层的ANN架构可以在模型反演中获得最好的结果。因此,本文构建了一个5层前馈全连接网络(即FCN),包括1个输入层、3个隐藏层和1个输出层。输入层包含16个输入变量,3个隐藏层的神经元数量分别为64、128和64。由于整流线性单元(rectified linear unit,ReLU)激活函数在网络训练时不存在梯度饱和和消失的问题,并且训练的网络收敛速度快、计算复杂度低[26]。因此,本文使用ReLU作为最佳激活函数,定义为

(6)


为了避免量纲和数量级的影响,在使用ANN构建模型之前,需要对输入变量进行归一化

(7)

式中,XminXmax是输入变量的最小值和最大值;是归一化的输入变量。


2.7 GloWH-Net深度学习模型

2.7.1 GloWH-Net模型设计和配置

用于全球有效波高反演的GloWH-Net深度学习模型框架如图3所示。由图3可知,有效波高反演的GloWH-Net深度学习模型由3个核心的神经网络模块构成。第1个网络模块为卷积特征提取模块,输入为BRCS DDM和有效散射面积,可利用卷积神经网络从BRCS DDM和有效散射面积中有效提取与海面有效波高相关的特征值;第2个网络模块为特征关系推理模块,可利用双向长短期记忆网络(bidirectional long short-term memory,BiLSTM)捕捉到上下文信息,从而更好地理解输入序列;第3个网络模块为全连接网络,输入为海面环境和卫星辅助参数信息。最终,通过联合3个核心网络并采用全连接网络输出有效波高反演值。

图3

图3 GloWH-Net架构

Fig.3 Architecture of GloWH-Net

确定神经网络中的最佳激活函数是一项重要任务,因为它与网络性能直接相关。但是很难通过分析方法来确定这个函数。相反,最佳激活函数通常是通过反复试验或调整来确定的[27]。本文分析了5种激活函数,即ReLU、Tanh、Elu、Sigmoid和softplus。不同激活函数对有效波高反演精度影响很大,因此选择合适的激活函数非常重要。通过本文试验分析发现,ReLU激活函数在RMSE方面获得了最优的性能,因此,本文采用ReLU函数作为所有神经网络模型的最佳激活函数。同时,采用均方误差作为损失函数。优化器是训练模型的另一个重要配置。经过比较,本文选择了Adam优化算法对随机打乱的小批量进行训练。

2.7.2 GloWH-Net模型训练和验证

试验环境为英特尔Core i7-10700@2.90 GHz八核CPU、NVIDIA GeForce RTX 2080 SUPER GPU,32 GB(英睿达DDR4 3000 MHz)运行内存,Windows 10操作系统,试验平台为Matlab 2019b和Python 3.7,深度学习API为tensorflow 2.3.1和Keras 2.4.3。
预处理数据按特征归一化为零均值和单位方差,验证集用于避免过拟合,并采用了具有6个历元的早停条件。学习率设置为0.000 5。为了进一步防止过拟合问题,随机失活设置为0.1。
训练集和验证集的观测时间不相同。训练集用于训练网络模型,验证集用于对模型训练进行监督。本文中的批次训练大小设置为32,为确保具有较好的训练性能,将历元数设置为100。

3 全球海洋有效波高反演性能分析

3.1 不同模型反演SWH与ERA5 SWH数据对比

在本节中,将GloWH-Net模型反演的性能与传统的经验模型方法和一些现有的网络架构(如BT、SVM和ANN模型)进行了比较。利用测试数据集对有效波高反演性能进行测试,测试数据集在训练时没有使用,与训练集和验证集分开。因此,非常适合评估相应模型在盲数据集上的泛化能力。下面首先对比分析不同反演模型的有效波高反演性能,然后评估不同反演模型在反演全球海洋有效波高方面的性能。
表3给出了使用ERA5数据作为参考时从不同模型中反演有效波高的精度。在表中,RMSE、Bias、CC和MAPE(mean absolute ercentage error)分别表示均方根误差、平均偏差、相关系数和平均绝对百分比误差。由表3可以得出以下结论。

表3 不同模型在测试数据集上反演有效波高与ERA5数据对比的精度

Tab.3 Accuracy of comparison between the significant wave height retrieved by different models on the test data set and ERA5 data

模型RMSE/mBias/mCCMAPE/(%)
经验模型(DDMA方法)0.7150.0040.4931.18
经验模型(LEWS方法)0.7090.0010.5130.78
经验模型(DDMA+LEWS方法)0.7090.0020.5130.85
BT0.423-0.0130.8515.14
SVM0.5640.0470.7222.00
ANN0.4550.0010.8316.75
GloWH-Net0.3300.0320.9112.19

新窗口打开| 下载CSV


(1)经验模型方法反演精度较差,与ERA5再分析有效波高对比,GloWH-Net模型相比经验模型方法在RMSE、CC和MAPE方面有显著提高,与DDMA观测值模型相比,分别提高了53.87%、42.09%和60.91%。与LEWS观测值模型相比,分别提高了53.47%、40.80%和60.40%。与DDMA+LEWS方法相比,分别提高了53.45%、40.70%和60.50%。此外,相比SVM模型,分别提高了41.54%、19.32%和44.60%。
(2)在机器学习方法中,BT模型的反演性能优于SVM和ANN模型,BT模型在RMSE、Bias、CC和MAPE方面分别为0.423 m、-0.013 m、0.85和15.14%。GloWH-Net模型在RMSE、CC和MAPE方面相比BT模型分别提高了21.92%、6.05%和19.51%。
为了比较GloWH-Net模型和其他反演方法反演有效波高与ERA5有效波高产品相比在相关性方面的性能,图4给出了不同模型反演有效波高和ERA5有效波高数据的散点密度图。图中红色虚线代表1∶1参考线,洋红色实线代表反演有效波高与ERA5有效波高的线性拟合结果(拟合方程Y=aX+b)在图中显示),CC代表模型反演有效波高与ERA5有效波高之间的相关系数。由图4可知:

图4

图4 不同模型反演有效波高和ERA5有效波高的散点密度图

Fig.4 Scatter density plots of retrieved significant wave height by different models and ERA5 significant wave height


(1)GloWH-Net有效波高模型反演结果与ERA5有效波高之间的相关性较好,优于经验模型和机器学习方法。在有效波高值大于3 m时,经验模型和机器学习模型都出现明显低估现象。ANN模型和GloWH-Net模型在大有效波高情况下反演性能优于其他模型,反演有效波高值沿着1∶1参考线分布相对聚集。
(2)DDMA、LEWS、DDMA+LEWS和SVM模型对0~4 m范围内的有效波高呈现偏离1∶1参考线附近。然而,BT、ANN和GloWH-Net模型没有明显存在这个问题。其中,GloWH-Net模型反演性能最优,这表明在将DDM图像添加到GloWH-Net模型的输入层后,包含卷积层的架构比仅具有全连接层的架构具有更好的性能,因为它们使用了DDM中的模式。此外,由于增加BiLSTM网络可以更好地捕捉上下文信息,有效波高反演性能得到显著提高。
(3)与目前用于星载GNSS-R有效波高反演的经验模型和传统的神经网络模型相比,GloWH-Net模型架构在大有效波高的情况下反演性能较好,即GloWH-Net模型显著改善了大有效波高(SWH大于3 m)海况下的低估现象。然而,限于目前星载GNSS-R技术水平,大有效波高海况下的波高预测仍面临巨大挑战。因此,在未来工作中,有必要进一步优化GloWH-Net模型构架以适应高海况条件下的有效波高反演。
为了进一步评估不同模型在反演SWH方面的全球表现,图5展示了2019年10月—2020年4月ERA5有效波高与不同模型反演有效波高全球分布。图6给出了不同模型反演的有效波高与ERA5有效波高偏差的分布直方图(图中给出了平均偏差(μ)、标准差(σ)、平均绝对误差(mean absolute error,MAE)和偏差的80%分位数(Qua),蓝色条形图表示误差分布,红色实线表示误差的概率密度函数拟合曲线,绿色虚线表示偏差为0 m)。从图5和图6可以看出,GloWH-Net在反演全球有效波高方面的性能优于其他模型,将BT和GloWH-Net的有效波高反演结果与ERA5数据进行对比,发现GloWH-Net模型的性能更优,GloWH-Net模型有效波高反演结果与ERA5数据的偏差非常集中(80%的有效波高偏差小于0.38 m)且接近0 m的偏差线,而BT模型80%的有效波高偏差小于0.48 m,并且在全球20°S—40°S之间呈现比GloWH-Net模型更大的SWH偏差。从7个模型的有效波高偏差分布直方图来看,LEWS方法反演得到的全球有效波高结果最差,80%的有效波高偏差为0.98 m。以上分析进一步表明了GloWH-Net模型用于全球海洋有效波高反演具有较好的性能。

图5

图5 ERA5有效波高和不同模型反演有效波高偏差全球分布

Fig.5 Global distribution of ERA5 significant wave height data and retrieved significant wave height bias by different models


图6

图6 ERA5有效波高与不同模型反演有效波高的偏差分布

Fig.6 Deviation distribution between ERA5 significant wave height and retrieved significant wave height by different models


3.2 不同模型反演SWH与WW3 SWH数据对比

有必要通过独立的有效波高测量来评估本文模型的有效波高反演性能。WW3产品的时空分辨率与ERA5产品最为一致,适用于各种时空分辨率的科学研究[28]。因此,本文还收集了WW3有效波高数据,并与反演的有效波高进行了比较。
表4给出了通过将不同模型反演的有效波高结果与WW3数据进行比较的精度统计。从表4中可以看出,GloWH-Net模型的RMSE最小(0.393 m),其次是BT模型和ANN模型,RMSE分别为0.483 m和0.502 m。反演有效波高与WW3有效波高的对比结果与ERA5相似。此外,就4个指标(RMSE、Bias、CC和MAPE)而言,GloWH-Net模型的性能明显优于基于MVE方法结合DDMA和LEWS结果的模型,RMSE、CC和MAPE分别提高了48.06%、41.29%和56.29%;与DDMA观测值模型相比,分别提高了48.15%、41.29%和55.38%;与LEWS观测值模型相比,分别提高了48.16%、41.30%和57.27%;与BT模型相比,分别提高了18.72%、6.35%和14.20%。这表明优化网络结构并融合DDM和其他辅助参数建模对于提高有效波高模型性能非常重要。

表4 不同模型在测试数据集上反演有效波高与WW3数据对比的精度

Accuracy of comparison between the significant wave height retrieved by different models on the test data set and WW3 data

模型RMSE/mBias/mCCMAPE/(%)
经验模型(DDMA方法)0.7570.0500.4832.02
经验模型(LEWS方法)0.757-0.0310.4833.44
经验模型(DDMA+LEWS方法)0.7570.0460.4832.09
BT0.4830.0330.8316.65
SVM0.6250.0970.6923.17
ANN0.5020.0390.8117.98
GloWH-Net0.3930.0730.8914.29

新窗口打开| 下载CSV


3.3 不同模型反演SWH与AVISO SWH数据对比

尽管3.2小节使用WW3 SWH数据作为独立的参考数据测试不同模型性能,但有必要通过使用其他更多来源的SWH测量来分析每个模型的性能。与浮标数据相比,AVISO SWH数据与CYGNSS和ERA5数据在时间和空间分辨率上匹配良好,这可以避免由于数据之间的时空不匹配而导致的额外测试误差[18]。因此,AVISO SWH数据可以作为测试不同模型性能的最佳参考数据之一。
表5给出了不同模型反演的SWH结果与AVISO数据进行比较的精度统计。从表5中可以看出,GloWH-Net模型的RMSE最小(0.433 m),其次是BT模型和ANN模型,RMSE分别为0.453 m和0.469 m。反演有效波高与AVISO有效波高的对比结果与ERA5和WW3数据对比结果相似。此外,与BT模型相比,在RMSE、CC和MAPE方面分别提高了4.47%、1.93%和8.19%;与DDMA+LEWS方法相比,分别提高了40.63%、36.77%和55.32%;与SVM模型相比,分别提高了21.34%、16.49%和30.29%;与ANN模型相比,分别提高了7.63%、4.40%和12.69%。以上分析同样表明GloWH-Net深度学习模型相比经验模型和机器学习模型具有较高的SWH反演精度。

表5 不同模型在测试数据集上反演有效波高与AVISO数据对比的精度

Tab.5 Accuracy of comparison between the significant wave height retrieved by different models on the test data set and AVISO data

模型RMSE/mBias/mCCMAPE/(%)
经验模型(DDMA方法)0.707-0.0150.4630.19
经验模型(LEWS方法)0.801-0.3710.4739.25
经验模型(DDMA+LEWS方法)0.730-0.1930.4733.93
BT0.453-0.0210.8216.51
SVM0.5510.0420.7221.75
ANN0.469-0.0120.8117.36
GloWH-Net0.4330.0190.8415.16

新窗口打开| 下载CSV


3.4 讨论

本节首先选择GloWH-Net深度学习模型从不同星载GNSS-R观测变量和不同辅助变量参数对模型性能的影响两个方面进行进一步讨论和分析。然后对GloWH-Net深度学习模型和其他6种现有模型在不同有效波高区间的反演性能进行评估和误差分析。预计这些发现将为未来创建更先进的SWH反演算法提供有益的参考。

3.4.1 不同星载GNSS-R观测变量对模型性能的影响

为了讨论不同星载GNSS-R观测变量对GloWH-Net深度学习模型性能的影响,将不同的星载GNSS-R观测变量参数组合输入到GloWH-Net模型中进行性能评估。本文设计了两个方案。方案1:与DDM相关的观测变量,包括DDMA、LES、TES、LEWS、TEWS和SNR。在这种情况下,这些观测值与海面粗糙度相关。方案2:在方案1的基础上,增加了与接收机和卫星几何相关的观测变量,包括gps_eirp、sp_rx_gain、sp_inc_angle、sp_lat、sp_lon和RCG。将这些观测量与接收器和发射器几何的影响分开[29](图7)。

图7

图7 不同的星载GNSS-R观测变量参数组合输入到GloWH-Net模型中反演SWH与ERA5数据的对比结果

Fig.7 Comparison results of different combinations of spaceborne GNSS-R observation variable parameters inputted

into the GloWH-Net model to retrieve SWH and ERA5 data



两个方案均未使用表1中的其他辅助参数,因此可以直观地比较GloWH-Net模型中不同星载GNSS-R观测变量的SWH反演能力。图7给出了将不同的星载GNSS-R观测变量参数组合输入到GloWH-Net模型中反演SWH与ERA5数据的对比结果。案例1的RMSE、Bias、CC和MAPE分别为0.734 m、0.033 m、0.44和32.59%;案例2的RMSE、Bias、CC和MAPE分别为0.447 m、-0.05 m、0.84和16.38%。可以看出,除与DDM相关的观测变量外,输入与接收机和卫星几何相关的观测变量对于提高GloWH-Net模型的性能非常重要,研究还发现SWH反演性能对地理信息的依赖性,即加入反射点经纬度后,对SWH反演具有正贡献,导致RMSE降低。这表明SWH表现出显著的空间格局,地理参数为神经网络提供了额外的信息。对于近岸地区,沿海地形和海岸线方向也会影响海浪。在星载算法中考虑地理信息是有用的,因为利用镜面点的经纬度可以提高GNSS-R反演SWH的精度[20]

3.4.2 不同辅助变量参数对模型性能的影响

除了不同星载GNSS-R观测变量之外,包括降雨量、风速、风向和水深变量在内的辅助变量也可以发挥重要作用。海浪不仅受到风速和涌浪的影响,还受到海床变浅、折射和衍射的影响。因此考虑了水深变量对SWH反演的依赖性[20]。风速是海浪的驱动力,尤其是在高风速下,文献[21]中将ERA5风速作为已知变量添加到BT模型中,结果表明考虑ERA5风速后,模型的性能(RMSE、Bias和CC)显著提高,特别是在高SWH下。因此,风速被作为GloWH-Net模型的输入,与以往的研究不同,本文还引入了风向变量来讨论其对模型性能的影响。此外,在海浪反演研究中,降雨通常被认为是干扰,全球大约7%的散射仪测量受到降雨的影响[28]。文献[22]讨论了将降雨量作为SWH反演模型输入变量的必要性。因此,本文也将降雨量作为已知变量添加到GloWH-Net模型以评估对模型性能的影响。
为了验证不同辅助变量参数对模型性能的影响,在使用星载GNSS-R观测变量作为GloWH-Net模型输入的基础上,进一步讨论了考虑降雨量、风速、风向和水深作为输入变量对GloWH-Net模型性能的影响。表6给出了不同辅助变量作为GloWH-Net模型输入参数的SWH反演性能统计。由表6可以看出,与未考虑辅助变量参数的SWH反演结果相比,加入风速和风向后反演SWH的RMSE分别降低了18.64%和16.46%,相关系数CC均提高了5%。同时加入降雨量、风速、风向和水深变量对模型反演性能提高显著(RMSE降低37.77%)。尽管加入降雨量和水深变量后模型反演SWH的RMSE和CC改善不显著,但Bias和MAPE有所降低,这表明加入降雨量和水深变量有助于提高模型反演SWH的性能。

表6 不同辅助变量作为GloWH-Net模型输入参数的SWH反演性能统计

Tab.6 Performance statistics of SWH retrieval using different auxiliary variables as input parameters for the GloWH-Net model

辅助变量参数RMSE/mBias/mCCMAPE/m
未考虑0.413-0.0270.8615.28
降雨(RI)0.4220.0040.8615.26
风速(WS)0.3360.0350.9112.19
风向(WD)0.345-0.0340.9113.15
水深(wd)0.413-0.0070.8614.95
RI+WS+WD+wd0.257-0.0240.959.88

新窗口打开| 下载CSV


3.4.3 不同有效波高区间的反演性能和误差分析

为了分析不同SWH海况对模型反演性能的影响,研究了不同模型在不同SWH区间内的反演性能并分析了误差来源。图8给出了不同SWH区间内不同模型估计SWH的RMSE和Bias统计结果。由图8可以看出,所有模型都高估了低SWH(<3 m)。在高SWH下(>3 m),所有模型都呈现低估,这可能是由于DDM观测值在非常大的SWH下的灵敏度饱和所致,在高SWH下,GNSS-R的性能会下降。与其他6个现有模型相比,GloWH-Net模型反演性能表现出色,特别对高SWH条件下反演性能改善较好,这主要是因为网络模型优化后能更好预测高海况SWH。此外,当SWH值增加时,反演精度会降低,这主要是因为高海况条件下GNSS反射信号质量较差。此外,许多未知因素仍然会影响CYGNSS SWH的反演。

图8

图8 不同模型在不同SWH区间内的反演性能

Fig.8 Retrieval performance of different models in different SWH ranges


4 结论

本文研究了利用CYGNSS任务观测的星载GNSS-R数据反演海面有效波高的方法,提出了一种用于星载GNSS-R全球海洋有效波高反演的GloWH-Net深度学习模型。大量测试结果表明,GloWH-Net模型在RMSE、Bias、CC和MAPE 4个指标方面优于目前用于星载GNSS-R有效波高反演的经验模型和传统的神经网络模型。当使用ERA5有效波高数据作为参考值时,与DDMA+LEWS方法相比,RMSE、CC和MAPE分别提高了53.45%、40.70%和60.50%;与BT模型相比,分别提高了21.92%、6.05%和19.51%。当使用WW3有效波高数据作为参考值时,与DDMA+LEWS方法相比,RMSE、CC和MAPE分别提高了48.06%、41.29%和56.29%;与BT模型相比,分别提高了18.72%、6.35%和14.20%。当使用AVISO有效波高数据作为参考值时,与DDMA+LEWS方法相比,RMSE、CC和MAPE分别提高了40.63%、36.77%和55.32%;与BT模型相比,分别提高了4.47%、1.93%和8.19%。
需要说明的是,不同方法的空间分辨率有一定差异,对于ANN和经验模型而言,通常选择DDM中镜面反射点附近5个多普勒仓和3个延迟仓窗口计算GNSS-R观测值(如NBRCS和LES),以满足25 km空间分辨率的要求,具体取决于镜面反射点的入射角。本文采用卷积层的主要目的是从整个DDM而不是小盒子中自动提取特征,这可以避免人为从DDM中提取特征而导致一些信息丢失,从而限制反演精度。因此,本文所提方法是在稍微降低空间分辨率的前提下提高SWH反演的精度。
未来,有必要进一步优化GloWH-Net模型构架,应考虑数据长度、版本、质量控制、过滤和验证方法的差异,以确保新数据集的估计具有相同的准确性。此外,受限于当前星载GNSS-R技术水平,大有效波高海况条件下精确预测有效波高仍面临巨大挑战。众所周知,浮标数据已被广泛用作验证结果的参考真值,由于浮标(NDBC、TAO等)数据的获取和空间覆盖有限,本研究采用ERA5、WW3和AVISO数据作为对比数据。将来,一旦获得此类高质量数据,将可以使用浮标数据进行进一步验证。


初审:侯 琳
复审:宋启凡
终审:金 君

资讯