• 工作总结
  • 工作计划
  • 读后感
  • 发言稿
  • 心得体会
  • 思想汇报
  • 述职报告
  • 作文大全
  • 教学设计
  • 不忘初心
  • 打黑除恶
  • 党课下载
  • 主题教育
  • 谈话记录
  • 申请书
  • 对照材料
  • 自查报告
  • 整改报告
  • 脱贫攻坚
  • 党建材料
  • 观后感
  • 评语
  • 口号
  • 规章制度
  • 事迹材料
  • 策划方案
  • 工作汇报
  • 讲话稿
  • 公文范文
  • 致辞稿
  • 调查报告
  • 学习强国
  • 疫情防控
  • 振兴乡镇
  • 工作要点
  • 治国理政
  • 十九届五中全会
  • 教育整顿
  • 党史学习
  • 建党100周
  • 当前位置: 蜗牛文摘网 > 实用文档 > 公文范文 > 基于机器学习的长江重庆航道雾情特征提取

    基于机器学习的长江重庆航道雾情特征提取

    时间:2023-04-08 20:00:03 来源:千叶帆 本文已影响

    陈施吉,李家启,王远谋,李科,孙恩虹

    (1. 重庆市气象服务中心,重庆 401147; 2. 长寿区气象局,重庆 401220; 3. 江津区气象局,重庆 402260)

    长江,素有“黄金水道”之称,是横贯我国东西的水运大动脉。大雾、暴雨、强风等恶劣天气常对长江水上交通安全及运输效率产生不利影响,其中又以雾情影响最为严重。1990 年代以来,相关领域专家学者针对长江干线的雾情特征开展了大量研究,俞香仁等[1]结合长江沿岸气象台站的监测记录,分析了长江雾的时空分布特征,李子华等[2]利用南方各省的野外探测资料,开展了长江雾情特征分析,结果与前者较为一致。

    近年来,针对长江雾情的研究逐渐聚焦在重点航段,如三角洲地区、三峡库区等。孙锦铨等[3]通过在长江南通航段的江心囤船上建设自动监测站,探讨了长三角南通段的江面雾时空气候特征;
    周伟灿等[4]和张恩红等[5]选取长三角地区多个代表站的能见度监测资料,分析了该地区的能见度变化特征;
    田小毅等[6]对长江江苏段的江面雾时空特征进行统计分析,提出了“象鼻形”先期振荡的概念模型。

    三峡库区河段航道属于山区航道,复杂地形造成了库区航道多雾的气候特征,三峡成库后航道等级提高,库区航运量不断增加,雾情对航运的影响愈加明显[7]。陈乾金等[8]以宜昌站为代表,利用气象监测资料分析了三峡坝区长江雾的基本特征。虞俊等[9]和黄治勇等[10]选取三峡库区多个气象站作为代表站,利用多年历史资料分析了库区极端大雾天气的气候变化特征;
    白永清等[11]和王林等[12]进一步利用长江三峡航道沿线的能见度监测仪和人工监测雾情台站资料,分析了涪陵、万州、宜昌3组区域的能见度时空分布特征和气象因子、地理因子对雾情的影响;
    王中等[13]利用重庆市气象监测资料,谢斌等[14]和代娟等[15]利用长江重庆航道局监测资料研究了长江航道重庆段的大雾时空分布特征。

    受监测频次和精度限制,以往的研究多是基于逐时、逐日的监测资料开展,鲜有利用分钟级监测数据的精细化分析。随着长江上游航运能力的提升,大雾天气对长江航运及航道维护的影响服务需求愈加精细化。重庆市气象局自2017年开始对沿线的航道气象监测站进行升级,时间精度提高到分钟级,本文即是基于此类监测资料,对长江航道重庆段雾情特征进行分析,研究结果对提升水上交通安全、保障航道高效运行具有重要意义。

    2.1 资料来源

    研究采用的长江重庆航道沿线26个自动气象监测站(图1)2018—2020 年期间的逐5 min 能见度监测数据来源于重庆市气象信息技术与保障中心,重庆海事管辖水域数据来源于重庆市海事局,长江重庆航道地理位置信息来源于长江航道测量中心。

    图1 长江重庆航道气象监测站空间分布图

    表1 给出了26 个航道站的长江航道位置信息,可见涪陵及其下游的各海事处辖区内均设有2个及以上的能见度气象监测站。

    表1 长江重庆航道气象监测站地理位置信息

    2.2 雾过程定义

    长江干线重庆段内,不同天气条件下(如:轻雾、大雾、浓雾天气[16])采取禁限航措施不同:当能见度不足1 500 m 时,禁止客船下行;
    当能见度不足1 000 m 时,客船禁止出港和航行,渡船不能开航,其他船舶禁止下行;
    当能见度不足500 m 时,禁止所有船舶出港和航行[17]。研究不同类型大雾天气的发生发展过程,对于航运有效管控具有积极意义。

    根据不同类型的大雾天气分别开展时间序列变化特征分析,为了便于后期提取雾情过程的前兆信息,本文定义长江重庆航道的一次轻雾过程为自水平能见度2 000 m 的a 点开始以某种形态降低,于b 点降至1 500 m 以下,而后在c 点开始以某种形态返升至2 000 m 的d 点,大雾、浓雾过程则是自b 点开始分别降至1 000 m、500 m 以下(图2)。

    图2 (轻/大/浓)雾过程概念图

    2.3 资料处理方法

    2.3.1 数据预处理

    为了便于雾情时间序列样本提取,设置能见度2 000 m为阈值,超过该值的能见度监测值均作2 000 m处理,缺测值以线性插值算法补齐。

    根据2.2 节的雾情过程定义,从能见度监测数据集中提取到了11 619个雾情过程样本。对该样本集按照3σ原则以时间长度为指标检测异常样本,3σ原则是基于概率统计的异常检测算法,检测效果具有很好的鲁棒性[18]。将超过3σ的样本均视为异常样本,作删除处理。最终得到长江重庆航道2018—2020 年期间的雾情过程样本共8 784个,其中轻雾过程4 272 个、大雾过程2 600 个、浓雾过程1 912个。

    2.3.2 时间序列形态识别

    本文在样本提取过程中发现,不同雾情过程的时间长度差异很大,如2020 年6 月29 日涪陵外坪水域的浓雾过程样本时长达到24 h 左右,而2020年8月30日凌晨万州苎溪河附近水域的轻雾过程时长仅10 min。针对样本之间差异过大的样本集,直接提取时间序列形态会产生平滑效应,因此本文对样本集作进一步处理。

    (1) K-Means 分类。根据“肘部”观察法确定分类K值,基于样本的时间序列长度属性,利用KMeans算法[19]对雾情过程进行分类。

    (2) 等长时序样本集。对每一个样本按照该类最大时长,线性插值随机生成1 000 个时间序列。基于动态时间规整方法(DTW)[20],选择该样本的1 000个时间序列中距离最小者作为新样本,从而得到新的时间长度相等的时间序列样本集。

    (3) 主成分分析。经局部加权回归散点平滑(LOWESS)技术[21]加工后,对等长时序样本集进行标准化处理,利用主成分分析法(PCA)提取样本集的主要形态特征。

    2.3.3 算法实现说明

    本文通过Python 工具实现数据的分析与处理,涉及到的工具包主要为Sklearn(包括K-Means、PCA)、Tslearn(DTW)。Sklearn(scikit-learn)是基于Python语言的开源机器学习库,包括分类、回归、聚类、降维等模块,K-Means 属于聚类模块的常用算法,PCA 则为降维算法中的一员。Tslearn 库是Python 下专门用于时间序列数据的机器学习工具包,DTW是其中的一个算法,主要通过计算两个时间序列的相似度实现序列的延展或压缩。

    3.1 空间分布特征

    长江重庆航道地处西南山区,航道呈典型山区河流特征,三峡成库后,自然航段、回水航段、库区航段并存,有着水流态势复杂、局地小气候明显的特征。2018—2020 年3 年间重庆境内长江航道的26 个航道站共发生了8 784 次雾情过程,其中轻雾过程占48.6%,大雾过程为29.6%,而浓雾过程仅占总次数的21.8%。

    图3 为长江重庆航道自动气象站的雾情过程空间分布图,可见雾情过程随着航道里程的减小呈现“中-高-低”分布型,其中长寿海事水域上游平均发生330次雾情过程,巴南水域的唐家沱和黄溪沟、朝天门水域的普子岩相对偏多。雾情高发区主要位于涪陵-忠县航段,平均发生560 次雾情过程,涪陵海事水域尤为显著,而万州及下游的水域发生雾的起数最少,平均仅194次。统计各监测站附近水域的雾情过程发生频次,普遍表现为轻雾最多、大雾次之、浓雾最少,普子岩、虾子梁两处水域则是轻雾最多,大雾最少。长江重庆航道沿线雾情发生次数最多的是涪陵海事处管辖水域,虾子梁、外坪分别发生了679、667 次雾情过程,前者轻雾242 次、大雾209 次、浓雾71 次,居全航道之最,后者轻雾366次、大雾167次、浓雾134次,仅次于虾子梁水域。

    图3 长江重庆航道气象监测站雾情发生频次图

    总体而言,涪陵-忠县水域雾情高发,长寿及上游水域次之,万州水域雾情次数较低,这与陈施吉等[22]关于巴南-涪陵一带气候危险性最高的研究结论较一致。

    3.2 时间分布特征

    3.2.1 月变化

    王中等[13]指出长江航道低能见度冬季出现最多,其次是秋、春季,夏季最少。田小毅等[6]的研究认为6 月是长江江苏段江面雾的峰值之一。代娟等[15]的研究表明长江山区航道有冬少夏多的情况存在。谢斌等[14]认为长江山区航道受航道跨度长、地形复杂等因素影响,不同河段的雾情分布差异较大。

    利用2018年1月—2020年12月长江沿线的实况监测资料分析了江面雾的月变化特征(图4),可见长江重庆航道的雾情主要呈现夏季多、冬季少的分布特征,二者分别占48%、10%,春季约占26%,秋季约占16%;
    雾过程在1—7 月期间逐渐增多,6月增幅尤为显著,8月骤降,自9月开始呈逐渐下降趋势;
    就不同雾情过程发生频次来看,全年均呈现轻雾最多、大雾次之、浓雾最少的分布特征。

    3.2.2 日变化

    雾情过程的发生包括开始、进入、返回、结束4个时间点,统计各时间点占该类雾情过程总数的百分率(图5),长江重庆段的江面雾具有明显的日变化特征,雾情过程的开始、进入、返回、结束时间均主要集中在凌晨或早晨,自08 时开始递减至12时后维持低值水平,20时开始又呈现出返升趋势。

    图5 长江重庆航道雾情过程的日变化特征 a. 开始时间ta;
    b. 进入时间tb;
    c. 返回时间tc;
    d. 结束时间td。

    表2 给出长江重庆航道雾情过程时长。无论是轻雾、大雾过程,或是浓雾过程,大部分的雾情过程时长在1 h内,造成较大概率发生在夜间的雾情过程也主要在夜间结束。8 784 个样本序列中有约77%的样本时长处于1 h内,近14%的样本时长处于1~2 h之间,雾情过程时长超过2 h的样本数仅占9%。值得注意的是,随着雾情的加重,雾情过程时间序列长度逐渐增大,轻雾过程超过2 h的样本仅占轻雾过程样本数的2%,大雾过程占10%,浓雾过程则增至19%。

    表2 长江重庆航道雾情过程时长统计表

    3.2.3 低能见度持续时间

    当能见度不足1 500 m时,海事管理部门开始采取禁限航措施。因此有必要了解雾情过程“进入-返回”时段内的低能见度维持状况。表3 统计了长江重庆航道雾情过程的低能见度持续时间,可以看出,低能见度持续时间特征与雾情过程的时长特征较为一致。低能见度持续1 h 以上的雾情过程为浓雾过程最多,共有151 次,为轻雾过程的1.8 倍、大雾过程的4.7 倍。约99%的大雾过程低能见度仅持续不到1 h,而近8%的浓雾过程低能见度持续超过1 h。随着雾情的加重,持续不足1 h 的雾情过程逐渐减少,轻雾过程占总样本数的48%,大雾过程降至29%,浓雾过程仅1 761 次,占比跌至20%。

    表3 长江重庆航道雾情过程低能见度持续时间统计表

    不同的雾情过程样本,时间长度差异很大,为了更精准地提取时间序列形态特征,研究首先利用K均值算法对时间序列样本进行分类。通过“手肘法”发现,当K=3 时,误差平方和SSE 的递减趋缓。因此,基于时间序列长度属性将雾情过程样本集最佳分为3 类:第一类为时长5.6 h 以内的样本,第二类样本集的时长不足27 h,即5.6~27 h,第三类则为超过27 h 的样本,各样本集的样本数分别为8 563、202、19个。基于DTW 算法,每个样本在随机生成的1 000 个时间序列中选择距离最小的序列作为新样本,构建了新的等长时间序列样本集。对新样本集进行平滑、标准化处理,利用PCA技术提取到了各样本集的主要形态特征(图6)。

    图6a 是第一类样本集的前三个成分曲线,可见第一成分主要表征的是能见度快速下降,方差贡献率高达0.61,第二成分则主要体现能见度缓慢下降,方差贡献0.24,第三成分代表能见度的波动变化信号,当雾情过程时长在5.6 h 内时,波动变化信号很弱。随着雾情过程时长的增加,但不超过27 h 时(图6b),雾情过程的能见度快速下降信号迅速变弱,跌至方差贡献率为0.26 的第二成分。能见度缓慢下降信号增强至第一主成分,方差贡献为0.46。而能见度的波动变化信号仍然较弱,仅增长了1个百分点的方差贡献率。当雾情过程时长超过27 h(图6c)后,能见度的波动变化信号激增,方差贡献率达到0.14,信号强度较第二类样本集增强了1倍。伴随波动变化信号的加强,第一成分、第二成分的方差贡献率分别下降至0.39、0.24,而两个成分表征的信号区别主要在于能见度下降后的形态,第一成分为能见度缓慢上升,第二成分为能见度波动上升。值得注意的是,能见度变化的波动信号与“象鼻形”概念模型[6]的先期振荡信号颇为相似,即“象鼻形”先期振荡信号随着雾情过程时长的加大而进一步增强。

    图6 长江重庆航道雾情过程的主要形态特征 a. 第一类样本集;
    b. 第二类样本集;
    c. 第三类样本集。图例中括号内的数值表示成分对应的方差贡献率,能见度波动为无量纲值。

    综上所述,长江重庆航道雾情过程随着时间长度的不同,表现出不同的形态特征。当时长在5.6 h内时,主要是能见度快速下降和缓慢下降;
    不足27 h时,转为以能见度缓慢下降为主,能见度快速下降次之;
    当过程时长进一步增加,含“象鼻形”先期振荡信息的波动信号逐渐加强,能见度下降过程的信号变化也不再那么强烈,反而体现了能见度的回升阶段信号,即缓慢上升、波动上升。

    本文利用2018—2020 年长江重庆航道沿线26 个自动气象监测站每5 min 1 次的能见度监测资料,通过定义轻雾、大雾、浓雾三类雾情过程,统计分析了航道能见度的时空变化特征,利用KMeans、DTW、PCA 等机器学习算法提取了航道能见度时间序列的形态特征。

    (1) 雾情过程随着航道里程的减小呈现“中-高-低”分布型,雾情高发区主要位于涪陵-忠县航段,平均发生560 次雾情过程,涪陵海事水域尤为显著,长寿及上游水域次之,而万州及下游的水域发生雾的起数最少,平均仅194次。

    (2) 长江重庆航道的雾情过程在6—7 月有1个波峰,即1—7 月逐渐增多,6 月增幅尤为显著,8月骤降,自9 月开始呈逐月下降趋势,主要表现为夏季多、冬季少的特征。无论轻雾、大雾、浓雾过程,大部分雾情过程时长均在1 h 内,造成较大概率发生在夜间的雾情过程也主要在夜间结束。

    (3) 长江重庆航道雾情过程随着时间长度的不同,表现出不同的形态特征。当时长在5.6 h 内时,主要是能见度快速下降和缓慢下降;
    不足27 h时,转为以能见度缓慢下降为主,能见度快速下降次之;
    当过程时长进一步增加,能见度下降过程的信号变化也不再那么强烈,反而是主要体现了能见度的回升阶段信号,即为缓慢上升、波动上升。值得注意的是,“象鼻形”先期振荡信号随着雾情过程时长的加大而进一步增强。

    (4) 雾情对航运影响严重,而重庆雾日较多[23],因此建立长江重庆航道雾情监测预警模型尤为重要。本文提取到雾情过程时序形态的前兆信号,可进一步利用机器学习算法进行识别建模,与王远谋等[24]利用航道影像资料建立的雾图像识别模型耦合,有望基本实现重庆航道能见度的多源资料融合,提升航道雾情过程监测预警能力。

    猜你喜欢大雾能见度航道大雾帖(组诗)山花(2022年5期)2022-05-122005—2017年白云机场能见度变化特征及其与影响因子关系研究Advances in Meteorological Science and Technology(2019年6期)2019-12-30厦门港航道通过能力建模及应用中国航海(2019年2期)2019-07-24趣谈大雾的功与过百科探秘·航空航天(2017年10期)2017-11-08新航道留学(2017年5期)2017-03-29英语高能高分 就上新航道留学(2017年5期)2017-03-29低能见度下高速公路主动诱导技术的应用中国交通信息化(2016年6期)2016-06-06大雾小学阅读指南·低年级版(2016年5期)2016-05-14前向散射能见度仪的常见异常现象处理及日常维护海洋气象学报(2016年3期)2016-02-28前向散射能见度仪故障实例分析气象研究与应用(2016年4期)2016-02-27
    相关热词搜索:长江航道重庆

    • 名人名言
    • 伤感文章
    • 短文摘抄
    • 散文
    • 亲情
    • 感悟
    • 心灵鸡汤