天文系与自动化系交叉团队,提出AI深空探测增强模型 “星衍”(ASTERIS)显著提升了詹姆斯韦布望远镜(JWST)的探测深度(深1个星等),绘就迄今最深邃的 “极致深空场”。基于此,团队发现大量先前未知的 “宇宙黎明时期”候选星系,首次测得红移 z=9-16 星系光度函数的极暗端,确认极暗星系占比高于预期。星衍有望构筑深空探测的 “智能新引擎”,助力下一代望远镜加速前沿科学发现。
相关研究成果于2月20日凌晨以“加速优先出版”(First Release)的长文形式发表于《科学》杂志(Science)。

模型星衍概念图
探索宇宙中遥远、暗弱的天体与结构,是解锁宇宙起源演化、物质能量循环、时空本质等核心科学谜题的关键,有利于人类拓展认知边界、追寻宇宙奥秘。
为了更好进行宇宙探索,人类不断增大望远镜口径、精进传感器性能,甚至将先进设备送入太空。然而,明亮的天光背景噪声(如太阳系黄道光散射、银河系漫射光、未分辨的河外背景等),与望远镜热辐射噪声相互叠加,如同为深空蒙上了一层“迷雾”,让本就微弱的信号难以彰显。
更棘手的是,噪声分布往往不独立、非均匀,不同区域和时段的噪声既难以解析刻画,又存在复杂关联性;传统数据堆叠提信噪比的方法时常默认噪声接近独立同分布,长期并没有充分发挥探测装置的最佳效能。

星衍增强前后的韦伯空间望远镜近红外观测数据对比
团队聚焦天文降噪痛点,融合 AI 算法、海量观测数据与计算光学原理,研发出 “星衍”。该模型通过“自监督时空降噪技术”将深空图像重构为时、空、光的三维体,以光度自适应筛选为核心,结合噪声与天体联合建模,提取重建暗弱信号。模型依托真实噪声的实际观测数据训练,无需复杂物理“正向建模”,可快速准确还原目标信号。
保证科学的严谨、真实是AI赋能科学的前提
过去,计算机专家利用AI解码深空数据的研究并不少,但多数沿用了计算机视觉领域的通用指标衡量性能。这些指标往往易将模型导向一种误区:数据变得干净平滑,实则“磨平”了极暗弱信号,改变了天体形态,并影响了科学测光。
本次,团队构建了基于天文科学的AI评价方法,摒弃单纯的视觉效果提升,以探测能力、形态保真、测光准确等为核心评价指标,将深空观测中的多帧曝光策略内化为模型的数据输入逻辑,从科学需求引导星衍的架构设计。
“星衍”在增加探测深度的同时,保持了测光的精准。模型采用了“分时中位,全时平均”联合优化策略,在提升探测暗弱信号的同时,大幅降低虚假信号的产生概率,保证了数据的科学与严谨。

天文观测数据不同增强方法对比(红圈代表准确的星点探测)
AI for Science的核心,在于用科学增量来评价AI
与NASA空间望远镜科学研究所(STScI)生成的数据产品对比,在保证90%的样本完备度情况下,星衍对暗弱天体的探测能力提升了约1.0星等;保证90%样本纯度情况下,星衍提升了约1.6星等。
基于此,星衍获取了迄今探测极限最深的影像,从中发现了超过160个宇宙早期候选星系,其中110个是先前未知的,部分未知星系已被后续光谱认证。首次获得了宇宙学红移 9—16(大爆炸后仅2至5亿年)的星系极暗端(MUV ~ -16)光度函数。证实在早期宇宙中,暗弱星系占比显著,其数量超过部分流行的理论模型,为理解宇宙“第一缕星光”、“再电离”等科学问题迈出关键一步。同时,在还原遥远旋涡星系悬臂结构、更好呈现引力透镜所产生的光弧等广泛问题上,星衍也展现出优秀的能力。

过往研究(蓝紫星标52个)与星衍(橙色星标162个)发现的高红移候选星系效果对比
在优化昴星团望远镜(Subaru)的数据中,星衍模型展现出跨平台泛化能力。未来,作为通用深空探测增强平台,有望应用于更多新一代望远镜(如第五阶段光谱巡天MUST、空间站巡天望远镜CSST等),通过新的观测策略,为解码暗能量、暗物质、宇宙起源、系外行星等关键重大科学问题提供助力。
Science杂志以 “Deeper detection limits in astronomical imaging using self-supervised spatiotemporal denoising” 长文 (extended format research article) 优先发表了这项由我系蔡峥副教授团队和自动化系戴琼海院士团队合作领衔的工作。共同第一作者为自动化系郭钰铎、张昊,天文系李明宇;共同通讯作者为自动化系戴琼海、天文系蔡峥、自动化系吴嘉敏;其他共同作者还包括自动化系郝钰涵,天文系黄崧、于阜江、原天文系(现东京大学)吴昀荆、天文系林小靖,人工智能学院李欣阳,东京大学梁永明。研究成果受国家重点研发计划、国家自然基金委、中国博士后科学基金、新基石科学基金会、马化腾基金会、清华大学笃实专项、脑与认知智能北京实验室(北京市教委)、青海大学、清华大学无锡应用技术研究院等支持。