首页
 > 科技资讯 > 媒体聚焦

新华日报:从5亿个疑似信号中找到81个快速射电暴 机器学习实现“大海捞针”

发布日期:2021-09-10 10:50   浏览次数:

从5亿个疑似信号中找到81个快速射电暴

机器学习实现“大海捞针”

新华日报 2021年9月8日 第15版

本报记者 蔡姝雯

快速射电暴是近几年最受关注的天文现象之一。记者从中国科学院紫金山天文台获悉,其参与的中澳合作项目,利用机器学习算法,从5亿个疑似信号中成功找到81个快速射电暴,实现数量级突破,并解决了以往对于暗弱快速射电暴的搜寻难题。此成果近期在英国《皇家天文学会月刊》上在线发表。

探索来自宇宙深处的信号

对于大部分人来说,“快速射电暴”这一天文现象既陌生又神秘,它被我们人类发现的时间并不长,只有短短十几年,却在近年来成为与引力波同样热门的天文学研究对象。

“科学家们通过高空间分辨率的观测确认,证明了大部分快速射电暴是一种来自宇宙深处的信号。”论文通讯作者、中国科学院紫金山天文台ACAMAR博士后张松波介绍,快速射电暴能在毫秒甚至更短时间内,完成一次极高的射电波段的能量释放,瞬时亮度超过太阳上亿倍。目前,大部分快速射电暴只被探测到单次的爆发,少数呈现出重复爆发的现象。

2007年,Duncan Lorimer等人在帕克斯64米射电望远镜的数据库中发现第一个快速射电暴。此后,全球诸多射电望远镜纷纷开展对这类新现象的观测。经过10多年研究,天文学家取得了相当多的观测突破,包括发现了可重复的快速射电暴,确定大部分快速射电暴是来自银河系外,观测到了第一次银河系内的快速射电暴等。而随着望远镜技术的发展,被探测到的快速射电暴的样本数量也大大提升,目前已经有600多例快速射电暴信号被发现。科学家们也对其起源进行了非常多的研究,提出了很多模型。但是,迄今为止,快速射电暴的起源和爆发机制依然是未解之谜。

筛选疑似信号犹如“大海捞针”

近几年,紫金山天文台高能时域天文团组专注于快速射电暴的理论和观测方法研究,已利用帕克斯望远镜的历史数据构建了一个系统的单脉冲数据库,该数据库内包含了快速射电暴标准搜寻方法所寻找出的5.6亿个信噪比大于7的单脉冲疑似信号,在此基础上,天文学家要从这些海量的疑似信号中找到快速射电暴,并对其进行深入分析。

这项工作无异于“大海捞针”。“快速射电暴的研究难点就在于‘快速’二字。”张松波说,它们的持续时间一般从微秒到毫秒量级,在一片漆黑的天空当中突然出现又快速消失,难以对其进行长期稳定地观测。到目前为止,发现重复爆发的快速射电暴仅有20多例,且只有少量几个重复暴能够获取频繁的重复爆发信息。此外,科学家目前只能在射电波段观测到快速射电暴,还没有发现其他波段如光学的对应体。因此,无论是在数据中找到这些信号,还是对这些信号进行深入分析,都非常困难。

以往的筛选方法无法对全部的疑似信号进行区分。张松波解释道,疑似信号中掺杂着大量的噪声和人造信号,那些比较明亮的快速射电暴,因为置信度高,得以优先被挑选出来;但剩下的信号,按照传统的方法,只能由有经验的天文学家用肉眼来识别,费时费力。而由于挑选出暗弱的信号需要对海量数目的疑似信号进行识别,这显然是一项不可能完成的任务,因此大量的信号被丢弃。

“机器学习”找到快速射电暴获量级突破

“机器学习”让“大海捞针”成为可能。此次研究组引入了机器学习算法,训练残差神经网络对所有疑似信号进行图像识别。“机器学习中的残差神经网络是人工神经网络的一个变种,它模拟最基本的生物神经元,将接收到的信号进行分析,并判别信号的种类,就如同人眼一般。”论文第一作者、紫金山天文台高能时域天文团组博士研究生杨轩告诉记者,在这一过程中,天文学家需要做的,就是手动标记一批信号作为机器的教科书,教导他们哪些信号是假信号,哪些信号是快速射电暴。一旦教学完成,机器就可以代替人眼来对这些信号图片进行识别了。

研究组利用这一方法最终成功找到81例新的快速射电暴,相比以往在相同的观测数据里找到的快速射电暴数目,有着量级上的突破,并且解决了以往对于暗弱快速射电暴的搜寻难题,为大样本、大数据下的数据处理问题提供了解决方法。

“天文学中的很多信号往往具有复杂的结构,靠人为设置条件筛选已经无法满足日益增长的海量数据。‘机器学习’能够从包含复杂干扰的图片中找到来自宇宙的真实信号,极大地加快了我们的研究速度。”张松波说,随着望远镜技术的不断发展,人类接收宇宙中信号的能力越来越强,比如帕克斯望远镜的上一代多波束接收机4年的观测数据就产生了上亿个单脉冲信号,国内现有的高灵敏度望远镜中国天眼(FAST),以及中国正式启动的国际合作项目平方公里阵列望远镜(SKA),必将带来海量的数据,未来的天文观测必将是大数据的时代,人工智能则是最可行的解决方案。

扫一扫在手机打开当前页
加入收藏 取消收藏 打印 关闭