教学科研

机器学习方法助力天文数据处理

来源: 时间:2024-11-21 作者:

近日,强振平教授团队在《The Astrophysical Journal Supplement Series》(ApJS,中国科学院一区TOP期刊,IF=8.5)发表题为“CME Velocity Field Calculation Model Based on an Unsupervised Transformer Optical Flow Network”的研究性文章。论文第一作者为大数据与智能工程学院2021级硕士生陈清洋,强振平教授为论文通讯作者。本次发表的论文提出了一种针对天文数据的处理方法。

ApJS是一份国际性的天体物理学期刊,由美国天文学会出版,在天文学和天体物理学领域享有较高的学术声誉,特别是在处理和分析大型天文数据中,ApJS发挥了重要的作用。

研究背景

日冕物质抛射(Coronal Mass Ejection,CME)是太阳大气中最为常见且最为剧烈的现象之一,是从太阳的日冕层向外喷射的巨大泡沫状气体,携带着大量的等离子,通常持续时间为几分钟到几个小时。CME运动通常会伴随着其他太阳活动,比如日冕波动、日冕昏暗和耀斑,而这些活动会对地球产生干扰,对覆盖在地球外太空的卫星网形成冲击,减少卫星在轨时间,甚至强烈的CME事件会对地球的地面供电网络和地磁产生影响。了解并计算CME的物理特征有助于研究者们了解CME的结构和演化过程,计算CME在不同时刻速度的变化可以帮助人们更加准确地预测CME到达地球的时间和强弱。

研究成果

团队提出一种无监督的基于视觉自注意力机制的多尺度光流计算网络(UTFlowNet)。该网络由多尺度特征提取模块和由粗到细的全局光流计算模块组成。多尺度的模块架构和Transformer的全局自注意力使得网络能够拥有全局的大视野,能够检测大尺度的位移。CME爆发出的太阳高能粒子运动也遵循一定的物理学规则,作者将基于流体运动的损失函数应用于解析高能粒子流的运动以更好地解决了CME运动场提取的问题。论文中提出的方法可以应用于不同观测设备的CME速度场实时自动提取,能很好地处理观测数据中光度的不统一、CME的大尺度运动,同时具有强大的噪声自适应性。团队在SOHO载体的C2数据集和HAO天文台的MLSO数据集进行了实验和验证,并基于LASCO C2数据构建了大尺度位移的模拟数据集进行测试,均验证了提出方法的准确性。

图文赏析

图1,网络架构概览。网络模型由特征提取模块和光流计算模块两个模块组成。Correlation softmax为相关度计算模块。I1,I2为输入的前后两组观测数据,F1和F2分别为I1和I2提取到的高维特征图,Flow是计算得到的光流。其中Encoder、Muti-scale CNN和SWin Transformer Layer模块均共享权重。

图2,在模拟位移数据集上的结果可视化。a) 输入的第一组数据,b) 输入的第二组数据;c) 计算得到的位移场稠密可视化;d) 计算得到的位移场稀疏可视化;e) 更改移动的方向和距离的输入数据;f) 是e)相当于a)计算得到的稠密光流可视化;g) 是e)相当于a)计算得到的稀疏光流可视化。

图3,连续光流速度场,CME速度场的伪彩色图显示。从图中可以明显看出冕流结构在向外喷发过程中的速度变化以及不同区域之间的速度差异。速度的快慢一般和受力的大小呈正相关,该成果可以直接为太阳物理的研究提供研究数据。

图4,针对太阳大面积全向喷发时候的速度场展示。第一行为太阳白光观测数据,第二行为计算得到的稠密光流场可视化,第三行为稀疏光流场显示,箭头的颜色代表方向,箭头的长度代表强度,第四行为光流强度稀疏可视化,对应的箭头颜色为速度,速度映射由下面的图例给出。

图5,通过光流计算最高点速度与国际通用的手工标注CDAW目录之间速度的比较。本文使用自注意力的无监督光流网络提取的速度场速度与手工标注的目录之间差异较小,计算得到的速度处于人工标注的速度区间,且比CDAW标注的速度变化更加平滑,符合CME喷发过程中的物理特征,验证了使用本文提出的自注意力无监督光流网络比手工特征提取更加准确。进一步,论文方法在模拟数据集中,验证了提出方法的效果均优于已有的传统方法和基于深度学习的无监督方法。

团队提出的无监督光流网络可以提取CME喷发前后的速度场,其使用的损失函数是基于CME的运动特征,并增加多种损失抑制噪声对结果的影响。在自建的SOHO LASCO C2的54个数据集共2409张图像和MLSO的1个数据集共77张图像分别训练并推理了CME喷发过程中的密集速度场。实验证明了本文提出的方法在不同的观测设备和数据之间具有普适性,可以被应用于不同的数据,且对噪声和曝光具有更强的鲁棒性。这个方法也可以被应用在更多对速度场估计有需求的场景,尤其是非刚性物体的运动推理中。模型推理产生的速度场可以通过阈值等自动化的方法判断CME爆发以其速度变化,也可以用作研究CME速度结构的细粒度演化提供研究基础,以辅助计算CME物质到达地球的时间,为空间天气预报提供基础数据。

通讯作者简介

强振平,博士,教授,博士生导师,获云南省兴滇英才支持计划“青年拔尖人才”项目,365体育官方唯一入口大数据与智能工程学院计算机系系主任。主要研究方向为图像处理与计算机视觉,机器学习及数据挖掘。近年来,在国内外学术期刊、会议发表学术论文60余篇,其中SCI、EI检索四十余篇,主持参与国家及省部级项目20余项。

Copyright  ©  2003 – 2024 365体育官方唯一入口. All rights reserved. 滇ICP备10002112号-2

Baidu
sogou