面对现代天文台产生的海量数据,人工智能已成为天文学家不可或缺的工具。通过深度学习等技术,它能自动完成关键任务:搜寻系外行星、分类星系、探测超新星、搜索引力透镜现象以及光谱分析。人工智能不仅分析数据,还能模拟整个宇宙,并预测快速射电暴等现象。下一个挑战是将它集成到望远镜中,实现实时处理。
天文学已进入大数据时代。像LSST(薇拉·鲁宾天文台)这样的观测站每晚将产生近20TB的数据。人工分析这些海量信息是不可能的。人工智能,特别是机器学习和深度学习,已成为对这些数据流进行分类、整理和发现隐藏现象的关键工具。
历史上,科学发现依赖于耐心的观察和手动计算。如今,经过数百万张图像训练的算法能在瞬间识别星系、超新星或小行星,其准确性往往超越人眼。
监督式机器学习技术使得模型能够被训练以识别光谱或光变曲线中的特定特征。例如,对于测量宇宙膨胀至关重要的Ia型超新星探测,如今已通过这些算法实现了高度自动化。
凌星法通过探测行星经过恒星前方时导致的亮度下降来发现系外行星,目前已发现数千颗系外行星。然而,这些信号极其微弱,常常被仪器噪声或恒星自身变化所淹没。
神经网络,例如开普勒和TESS任务所使用的,比传统统计方法更有效地过滤这些噪声。它们学会区分真实的凌星现象与恒星亮度的自然变化。TRAPPIST-1恒星系统拥有七颗岩石行星,尤其得益于这些先进分析,得以确认其复杂的轨道周期。
注:谷歌开发的AstroNet算法通过重新分析开普勒旧数据,发现了两颗新的系外行星(Kepler-90i和Kepler-80g),展示了人工智能发现人类遗漏之物的能力。
星系的形态揭示了其历史和演化的关键信息。 银河动物园项目于2007年启动,最初动员了数十万志愿者手动对星系图像进行分类。 如今,卷积神经网络能在数秒内以相当甚至更高的精度完成这一任务。
算法能够区分螺旋星系、椭圆星系和不规则星系,甚至识别出星系棒或旋臂等精细结构。 这种自动化技术使得处理包含数十亿个星系的星表成为可能,为宇宙结构形成与演化的统计研究开辟了前所未有的规模。
| 应用领域 | AI技术 | 典型精度 | 节省的时间 |
|---|---|---|---|
| 系外行星探测(凌星法) | 卷积神经网络 | 95-98% | × 1000 |
| 星系分类 | 深度学习(CNN) | 95% | × 10,000 |
| 超新星探测 | 监督学习 | 90-95% | × 100 |
| 自动频谱分析 | 循环神经网络(RNN) | 92-96% | × 500 |
| 搜索引力透镜 | 计算机视觉 | 88-93% | × 5000 |
| 天文图像重建 | 自编码器 / 生成对抗网络 | 90-97% | × 2000 |
| 空间天气预报(太阳风、日冕物质抛射) | 循环网络 / LSTM | 85-92% | × 500 |
| 彗星与小行星的识别 | CNN + 监督学习 | 90-96% | × 1000 |
| 伽马射线暴的探测 | 时间序列上的深度学习 | 93-97% | × 300 |
| 星际尘埃云的映射 | 自编码器 + 分割 | 88-94% | × 2000 |
| 观测调度优化 | 强化学习 | 80-90% | × 50 |
| 恒星亮度变化(变异性)分析 | RNN / Transformer | 91-95% | × 400 |
来源:编译自Baron(2019),arXiv:1904.07248 以及 Fluke & Jacobs(2019),WIREs数据挖掘与知识发现。
人工智能不仅分析,更能预测和模拟。模拟宇宙大尺度结构(如纤维状结构、星系团)形成的宇宙学模型计算量极大。如今,生成对抗网络(GAN)能以创纪录的速度生成逼真的模拟,使研究人员能够测试数千个宇宙学参数(\( \Omega_m, \sigma_8 \)),并与观测结果进行对比。
它还有助于通过识别历史数据中的前兆模式,来预测快速射电暴(FRB)或恒星耀斑等可变天体的行为。
注:卷积神经网络(CNN)特别适用于天文图像分析,因为它能自动学习从单个像素到大尺度结构等不同空间尺度下的相关特征,无需手动编程检测滤波器。
主要挑战仍然是人工智能模型的可解释性。 神经网络可以识别异常,但并不总能提供清晰的物理解释。XAI是天文学中一个至关重要的研究领域。
未来,人工智能将直接集成到望远镜中,实现实时数据处理,自主决定指向罕见瞬变事件,例如引力波或千新星。 诸如ZTF(兹威基瞬变设施)以及即将在薇拉·鲁宾天文台投入使用的LSST等项目,已开始运用算法实时分析数据,并在数分钟内触发自动警报。
注:千新星是由两个致密天体(中子星或黑洞与中子星)合并产生的短暂爆炸现象。 该现象于2017年GW170817事件中首次被探测到,其亮度在数天内迅速衰减,因此需要近乎实时的观测。
凌星法通过探测行星经过恒星前方时引起的微小亮度下降来发现行星,但产生的信号微弱,常被噪声淹没。神经网络过滤噪声的效果远超传统统计方法,能学会区分真实凌星现象与恒星自身的亮度变化。最典型的例子是AstroNet算法,它证明了人工智能可以发现人类遗漏的信号。TRAPPIST-1系统也得益于这些先进的分析方法。
卷积神经网络如今在星系分类中通常能达到超过95%的准确率。它们甚至能识别出星系棒或旋臂等精细结构。这一表现与"星系动物园"项目的志愿者相当,甚至更优,但时间效率显著提升:算法可在数秒内完成数千名人类耗时数年才能处理的任务。
人工智能在天文学中的主要挑战是其缺乏可解释性。神经网络可以识别异常或做出预测,但并不总能为其推理提供清晰的物理解释。可解释人工智能是一个研究领域,旨在使人工智能的决策对科学家透明且易于理解。这对于验证发现并将其融入我们对宇宙的物理认知至关重要。