【文/观察者网 陈思佳】近年来,高速发展的人工智能开始在越来越多的专业领域发挥作用。作为一门需要处理海量数据的学科,天文学正成为AI应用的最佳场景之一,AI正逐渐为系外行星探测、天文数据分析、物理模拟乃至卫星的指挥调配方面提供帮助。
未来AI会如何推动天文科学发展?7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议期间,“AI for Science-人工智能赋能中国空间天文”举办,围绕AI驱动天文研究、AI与系外行星发现、AI与空间高能天文、AI与空间天文数据等领域展开讨论。
AI for Science-人工智能赋能中国空间天文专题论坛2024世界人工智能大会
传统方法处理数据慢,科学家寻求AI帮助
中国科学院院士、中国载人航天工程空间科学首席专家顾逸东在演讲中介绍了他参与的爱因斯坦探针卫星(EP)、天基多波段空间变源监视器(SVOM)等空间科学卫星项目,以及巡天空间望远镜(CSST)、高能宇宙辐射探测设施(HERD)、宇宙伽马射线暴偏振探测器(POLAR-2)等基于中国空间站的天文任务。
顾逸东表示,以ChatGPT为代表的生成式人工智能的重大突破,推动了各领域AI应用的爆发式增长,可能引发新的产业革命。“AI for Science”正在快速兴起,作为自然科学前沿的天文学要如何把握新发展态势,深度融合AI和天文,是当前的重大课题。
中国科学院院士顾逸东发表演讲2024世界人工智能大会
他指出,空间天文具有数据量空前的指数级增长、天体目标丰富多样、目标信息提取及高精度和定量化要求这些特点。随着我国空间科学飞速发展,数据量正以空前的速度增长,“从几十亿个不同类型的天体中获取形状、光谱、坐标、红移、引力透镜、爆发时变等大量数据,依靠传统数据处理模式已经很难满足科研需求。”
他举例说,EP和SVOM每年数据可达几十TB。预计CSST发射升空后,每幅图像将达到5GB,一年获取12万幅图像,数据总量将达到30PB以上。HERD预计也将每年产生3.5PB的数据。
顾逸东认为,AI可以在天文图像目标分类和特征信号搜寻、粒子天体物理等探测数据智能处理、复杂约束的望远镜运行优化决策、宇宙学和天体物理模拟、知识图谱构建、卫星和望远镜健康诊断等方面发挥作用。
中国科学院上海天文台研究员、讲席教授葛健介绍了AI如何助力系外地球巡天。他举例说,利用人工智能GFPC全新算法,研究团队已在开普勒数据中发现5颗超短周期亚地球系外行星,搜寻速度提高了1000倍,精度和完备性都有所提升。
目前国际上运行的空间搜寻系外行星的卫星全都采用成熟的凌星法,但至今依然没有找到“地球2.0”。葛健表示,中国科学院空间先导背景型研究支持的“地球2.0”空间巡天(ET)计划用4年时间探寻“地球2.0”,预计将发现约3万颗系外行星,是目前已知数量的6倍。
葛健还表示,ET的高精度测光数据将是开普勒数据的至少10倍,将极大地扩展系外行星的参数空间。
他指出,系外行星巡天已经产生了海量数据,传统数据处理方法速度慢、精度和完整度不够,AI深度学习算法可以解决海量天文数据的微弱信号搜寻,ET科学卫星结合AI深度学习算法有望快速探测到“系外地球”的微弱信号。
美国麻省理工学院卡夫利天体物理和空间研究所副教授安德鲁·范德伯格(Andrew Vanderburg)也通过视频方式发表演讲,他表示,随着数字探测器和更强大计算技术出现,探测系外行星等宇宙探索的过程将变得更加高效,科学家可以通过更详细、更数字的方式识别系外行星。
2015年12月,我国首颗暗物质粒子探测卫星“悟空号”发射升空。“悟空号”已连续工作了8年多,在太空中接收来自宇宙的高能原子核、电子和伽马射线的信号。在对“悟空号”收集的数据进行处理的过程中,AI也发挥了重要作用。
中国科学院紫金山天文台副台长范一中介绍说,高电荷高能量核素导致“悟空号”仪器“着火”通道数过多,局部共模噪声无法计算,数据大片丢弃。科研人员通过AI工具重建了这些粒子的正确轨迹,这是经典方法无法做到的。
发射更多科学卫星,需要AI助力指挥
中国科学院高能物理研究所粒子天体物理中心主任、“慧眼”天文卫星首席科学家张双南表示,目前中国只有3个X射线天文望远镜,但这已经是国际领先水平,全世界也只有屈指可数的X射线天文望远镜。
他指出,一颗这样的天文卫星成本高昂,造价通常为几亿乃至上百亿人民币,研制和发射需要几年到几十年时间,运行团队也需要几十到上百人。面对宇宙中海量的暂现源、变源,如何进行后随观测是当前研究人员面临的挑战和机遇。
6月22日,搭载中法天文卫星SVOM的长征二号丙运载火箭在西昌卫星发射中心发射升空,与之同行的还有一颗全变源追踪猎人星座01星(CATCH-1卫星),这是中国科学院高能物理研究所提出的全变源追踪猎人星座CATCH项目的首发试验星。
该项目计划在2030年前后全面部署,发射100多颗小卫星组成星座,核心科学目标是“刻画极端宇宙的多维度动态全景”。张双南表示,该项目具备低成本、无漏网、高质量的特点,星座由百颗微纳卫星组成,探测各种变源和爆发现象,成批“活捉”各类天体。
中国科学院高能物理研究所粒子天体物理中心主任张双南发表演讲2024世界人工智能大会
然而,如何指挥上百颗卫星协同合作成为了研究人员面临的新难题。张双南回忆说,在自己的当机立断下,2017年发射的“慧眼”卫星抓住重大观测机遇,在2020年发现快速射电暴来自于中子星,2022年又观测到“千年一遇”的迄今最亮伽马射线暴。
但他坦言,“如果让我管100个卫星,我是没有办法每一次都能做对决策的,事实上也不可能做这样的决策。”他认为,即使有100位首席科学家,也不可能做到。
因此,研究团队将使用人工智能技术实现全变源追踪猎人星座的在轨自主协同观测。
“首先,我们要对这个智能网络进行训练,然后根据训练的情况制定我们的策略。让它根据训练的情况和发生的情况来决定观测的策略,指挥上百个卫星,然后下达观测任务。”张双南说,“在天上分布的上百个卫星根据它的情报和决策,根据情况决定是否要接受观测任务等等。”
张双南最后表示,全变源追踪猎人星座的首颗试验星已于上个月发射,接下来第二步是希望建立一个小型的星座,并在这一过程对人工智能的基本技术途径进行验证。
6月22日,长征二号丙运载火箭在西昌卫星发射中心升空视觉中国
中国科学院国家天文台研究员、爱因斯坦探针卫星(EP)首席科学家助理金驰川也提到,对卫星传回的海量数据进行分析需要大量时间和人力。今年1月,EP卫星在西昌卫星发射中心升空,其主要任务是捕捉对天文研究具有重大意义的暂现源。
金驰川介绍了EP科学中心的日常值班运行情况。他表示,对单个暂现源的分析需要调用不同工具和参考数据,平均耗时10到30分钟。每天暂现源分析工作量大,平均每天有50个人工检查需求。科学中心自动化程度较低,实现了一定程度的暂现源证认自动化,但只给出真假源和分类初步建议,无明确依据。
金驰川表示,EP暂现源研究具有AI应用需求和场景,AI可以显著提升暂现源证认效率,解决证认耗时耗力、准确性严重依赖人员经验的问题。人工智能还可以为暂现源的判别、属性、分类和对关键暂现源的后随观测提出规划建议,AI与值班人员的交互可以使证认结果具备坚实的可信度和优秀的可解释性。
巡天数据体量激增,“AI+云”将成数据管理新模式
巡天是高效的天文观测手段,我国首个大型空间光学天文望远镜CSST也正在研制中,但如何处理它所产生的海量数据是研究人员不得不面对的一大难题。中国科学院国家天文台研究员刘超表示,预计CSST发射后将观测超过100亿个天体,产生大量数据。
刘超介绍说,巡天数据的处理已经走过了三代发展模式,第一代是将观测数据列成星表,以纸质出版物的方式发表;第二代是数据库形式,通过网站查询数据;第三代则引入了“云”的模式。他指出,在过去40年里,巡天数据体量已经增长了4个数量级。
刘超认为,下一代巡天数据管理模式应该是“AI+云”的模式。他指出,空间巡天需要多种巡天数据的融合处理,“例如将地面和空间的巡天设备数据相互对比和补充”。他表示,AI可以通过自监督学习来获取星系的亮度、结构、形状等特征,为天文学家提供更全面的信息。
“通过AI和人的结合,我们有可能去构建下一代的巡天数据管理模式。”刘超说,“展望未来,对于天文学的巡天数据,我们可以采用新型的星表。天文学家以后要掌握AI技术,以AI的方式更好地挖掘数据,从中做出更多突破性的发现。”