1.本发明涉及遥感信息处理与应用领域,具体涉及一种基于剖面观测数据的海洋内部温度场重建方法。
背景技术:
2.全球变暖的大背景下,人类越来越重视海洋内部热力结构变化。海洋温度和海洋热含量是表征海洋热力结构的重要参量,其中海洋温度是对全球海洋热力结构变化最直接的反映,是海气交互作用强烈程度的指标。海洋内部温度是海洋物理性质的关键变量,反映着海洋密度和层化结构,是全球洋流循环的主要驱动因素之一。近年来卫星遥感技术在海洋领域应用成效显著,但目前遥感在海洋领域大多应用于海表参量反演,无法直接观测海洋内部信息。纵观人类对海观测历史,主要的剖面观测仪器主要是一下几种,1967年以前主要以南森瓶(nansen bottle)和机械深海温盐测量器(mechanical bathythermographs,mbts)为主;1968年后至21世纪初主要以抛弃式测温仪器(xpendable bathy thermograph,xbt)为主;21世纪初期至今,以argo浮标为主。受不同历史时期技术条件的限制,海洋观测剖面空间分布不均,时空分辨率较低。海洋内部动力过程具有时空多维度多尺度特点,基于现有历史观测资料填补历史观测的空白,重建长时序高时空覆盖率的海洋温度场对了解全球海洋的变化机制和过程非常重要。
技术实现要素:
3.有鉴于此,本发明的目的在于提供一种基于剖面观测数据的海洋内部温度场重建方法,为海洋环境与全球气候变化研究提供有力的数据支撑。
4.为实现上述目的,本发明采用如下技术方案:一种基于剖面观测数据的海洋内部温度场重建方法,包括以下步骤:步骤s1:获取历史海洋观测的剖面数据,并对剖面数据进行格网化预处理,得到格网化剖面观测数据;步骤s2:通过预设比例随机选取格网化剖面观测数据作为交叉验证集,其余作为输入数据;步骤s3:根据输入数据集生成训练集和测试集;步骤s4:基于卷积自编码器神经网络对训练集进行迭代训练,构建卷积自编码器模型;步骤s5:将测试集输入到自编码器模型中,重建长时间序列的海洋温度数据。
5.进一步的,所述步骤s1具体为:获取海洋en4 profile、argo浮标数据、iap时间序列格网温度和海表温度遥感数据,并进行空间范围统一处理;统计iap数据不同深度不同时相的极值,对en4 profile进行极值检查;将海表温度遥感数据、iap数据、en4 profile和argo数据的时间分辨率统一为每
月,利用最邻近插值将海表温度遥感数据空间分辨率统一为1
°×1°
;剖面数据格网化处理中,0m、5m、和10m的格网深度范围拓展2m,20m和30m格网深度范围拓展5m,50~1000m的格网深度拓展10m。将检索到的格网中观测值取平均值代表格网温度值。
6.进一步的,所述步骤s2具体为:每一时相二维稀疏分布的格网化剖面观测,构成三维时间序列的格网化剖面观测数据;通过matlab中find算法提取出时间序列格网化剖面观测数据中非空值的格网索引,再以randperm算法预设比例从上述非空值格网索引中随机选取,保留为交叉验证集;交叉验证集保存以后,将其对应的时间序列格网化剖面观测数据中的值设为空值,生成输入数据集。
7.进一步的,所述步骤s3具体为:将基于输入数据集生成的归一化温度随机掩膜设为空值,并随机加入5%高斯噪声,生成训练数据集,基于完整的输入数据集生成归一化的输入变量构成测试集。
8.进一步的,所述模型训练和测试过程中,根据输入的位置、时间、协方差,通过二维卷积学习主要的时空特征。
9.进一步的,所述步骤s4具体为:将训练集分为多个mini
‑
batch,再输入到卷积自编码器神经网络中进行训练;参数调优防止过拟合或欠拟合,通过调节l2正则化、丢弃正则化和学习率进行模型参数优化。
10.本发明与现有技术相比具有以下有益效果:本发明以时间序列数据为基础,充分利用的剖面数据含有多种海洋观测仪器的数据,如mbts、xbt、ctd及argo等,基于剖面观测数据的时空分布特征,采用卷积自编码器神经网络方法,建立高效的时序重建模型,时空重建了0
‑
1000m海洋温度,重建结果有良好的精度,能准确、直观的呈现全球海洋0
‑
1000m温度结构的空间分布特征和时间序列变化。
附图说明
11.图1为本发明的方法流程示意图;图2 为本发明实施例的精度评价图;图3~6为本发明实施例的结果展示图。其中图3~图6依次为2006年5月、2019年9月30m、200m和600m、1000m深度层,argo格网温度(左图)和模型重建的温度(右图reconstruction)对比图。
具体实施方式
12.下面结合附图及实施例对本发明做进一步说明。
13.请参照图1,本发明提供一种基于剖面观测数据的海洋内部温度场重建方法,包括以下步骤:步骤s1:获取历史海洋观测的剖面数据en4 profiles,并对剖面数据进行格网化预处理,得到格网化剖面观测数据(en4 gridded measure data,en4
‑
gmd)。获取argo浮标
数据、中国科学院iap格网化温度数据和遥感海表温度数据。
14.步骤s11:获取海洋en4 profile、argo浮标数据和iap时间序列格网温度数据,并将这些数据的空间范围统一(经度:180
°
w~180
°
e,纬度:77.5
°
s~78.5
°
n);步骤s12:统计iap数据不同深度不同时相的极值,对en4 profile进行极值检查,超出极值的认定为异常值,将其去除;步骤s13:将海表温度遥感数据、iap数据、en4 profile和argo数据的时间分辨率统一为每月,利用最邻近插值将海表温度遥感数据空间分辨率统一为1
°×1°
;步骤s14:剖面数据格网化处理中,0m、5m、和10m的格网深度范围拓展2m(如5m检索3m
‑
7m的剖面),20m和30m格网深度范围拓展5m,50~1000m的格网深度拓展10m。将检索到的格网中观测值取平均值代表格网温度值,其中0m深度由1955年1月至1981年12月的en4剖面数据和1982年1月至2019年12月的遥感海表温度数据共同组成。
15.步骤s2:将每一时相非空的en4
‑
gmd随机选取1%作为交叉验证集(en4
‑
gmd
‑
vs),其余作为输入数据(en4
‑
gmd
‑
in)。en4
‑
gmd
‑
vs不参与整个重建运算,仅用于重建结果精度验证。
16.步骤s21:将每一时相空间稀疏分布的格网化剖面观测数据,构成三维时间序列的en4
‑
gmd;步骤s22:通过matlab中find算法提取出时间序列en4
‑
gmd中有值格网的索引,再以randperm算法从上述每一时相有值格网索引中随机选取1%,保留为交叉验证集(en4
‑
gmd
‑
vs);步骤s23:en4
‑
gmd
‑
vs保存以后,将其对应的时间序列en4
‑
gmd中的值设为空值,生成输入数据集(en4
‑
gmd
‑
in);步骤s3:基于输入的时空数据en4
‑
gmd
‑
in生成训练集和测试集,将en4
‑
gmd
‑
in生成的归一化温度随机掩膜其中一部分设为空值,并随机加入5%高斯噪声,生成训练数据集,基于完整的en4
‑
gmd
‑
in生成归一化输入变量构成测试集;步骤s31:en4
‑
gmd
‑
in数据以1955年1月为基准,计算每一时相对应的时间序列数,构成时间time输入变量。经度0
‑
360
°
维度
‑
77.5
‑
78.5,通过meshgrid方法构成二维lon和lat变量;步骤s32:将经纬度、温度及时间等变量进行归一化处理,温度距平减掉时空平均值,时间time变量的归一化以时序数比12的正余弦值表示;步骤s33:上述归一化输入变量直接构成测试集,训练数据集则需将归一化温度随机掩膜(设为空值)其中一部分,并加入5%的高斯噪声。
17.步骤s4:使用卷积自编码器神经网络对训练集进行迭代训练,建立卷积自编码器模型;步骤s41:因海洋时空数据量较大,需要设置batch
‑
size将完整训练集分为多个mini
‑
batch,再输入到卷积自编码器神经网络中进行训练,这样可以降低模型训练时所占内存;步骤s42:参数调优防止过拟合或欠拟合,通过调节l2正则化、丢弃正则化和学习率等进行模型参数优化。
18.步骤s5:将测试集输入到自编码器模型中,重建长时间序列的海洋温度数据,得到
0
‑
1000m海洋内部温度分布。
19.以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。
技术特征:
1.一种基于剖面观测数据的海洋内部温度场重建方法,其特征在于,包括以下步骤:步骤s1:获取历史海洋观测的剖面数据,并对剖面数据进行格网化预处理,得到格网化剖面观测数据;步骤s2:通过预设比例随机选取格网化剖面观测数据作为交叉验证集,其余作为输入数据;步骤s3:根据输入数据集生成训练集和测试集;步骤s4:基于卷积自编码器神经网络对训练集进行迭代训练,构建卷积自编码器模型;步骤s5:将测试集输入到自编码器模型中,重建长时间序列的海洋内部温度数据。2.根据权利要求1所述的基于剖面观测数据的海洋内部温度场重建方法,其特征在于,所述步骤s1具体为:获取海洋en4 profile、argo浮标数据、iap时间序列格网温度和海表温度遥感数据,并进行空间范围统一处理;统计iap数据不同深度不同时相的极值,对en4 profile进行极值检查;将海表温度遥感数据、iap数据、en4 profile和argo数据的时间分辨率统一为每月,利用最邻近插值将海表温度遥感数据空间分辨率统一为1
°×1°
;剖面数据格网化处理中,0m、5m、和10m的格网深度范围拓展2m,20m和30m格网深度范围拓展5m,50~1000m的格网深度拓展10m;将检索到的格网中观测值取平均值代表格网温度值。3.根据权利要求1所述的基于剖面观测数据的海洋内部温度场重建方法,其特征在于,所述步骤s2具体为:每一时相二维稀疏分布的格网化剖面观测,构成三维时间序列的格网化剖面观测数据;通过matlab中find算法提取出时间序列格网化剖面观测数据中非空值的格网索引,再以randperm算法预设比例从上述非空值格网索引中随机选取,保留为交叉验证集;交叉验证集保存以后,将其对应的时间序列格网化剖面观测数据中的值设为空值,生成输入数据集。4.根据权利要求1所述的基于剖面观测数据的海洋内部温度场重建方法,其特征在于,所述步骤s3具体为:将基于输入数据集生成的归一化的温度随机掩膜设为空值,并随机加入5%高斯噪声,生成训练数据集,基于完整的输入数据集生成归一化的输入变量构成测试集。5.根据权利要求1所述的基于剖面观测数据的海洋内部温度场重建方法,其特征在于,所述模型训练和测试过程中,根据输入的位置、时间、协方差,通过二维卷积学习主要的时空特征。6.根据权利要求1所述的基于剖面观测数据的海洋内部温度场重建方法,其特征在于,所述步骤s4具体为:将训练集分为多个mini
‑
batch,再输入到卷积自编码器神经网络中进行训练;参数调优防止过拟合或欠拟合,通过调节l2正则化、丢弃正则化和学习率进行模型参数优化。
技术总结
本发明涉及一种基于剖面观测数据的海洋内部温度场重建方法,包括以下步骤:步骤S1:获取历史海洋观测的剖面数据,并对剖面数据进行格网化预处理,得到格网化剖面观测数据;步骤S2:通过预设比例随机选取格网化剖面观测数据作为交叉验证集,其余作为输入数据;步骤S3:根据输入数据集生成训练集和测试集;步骤S4:基于卷积自编码器神经网络对训练集进行迭代训练,构建卷积自编码器模型;步骤S5:将测试集输入到自编码器模型中,重建长时间序列的海洋温度数据。本发明提高了海洋内部温度时空观测分辨率与完整性,在海洋遥感及全球气候变化领域有较高的应用价值。有较高的应用价值。有较高的应用价值。
技术研发人员:苏华 王安
受保护的技术使用者:福州大学
技术研发日:2021.03.26
技术公布日:2021/6/29
转载请注明原文地址:https://doc.8miu.com/read-2291.html