想象一下(xià),星团、星(xīng)云和其他星际(jì)现象都是由计算机在无(wú)人监督的(de)情(qíng)况下凭空生成的。这听起来可(kě)能像是对未来全息技术的描述,但是爱(ài)丁堡(bǎo)大学感知研究所(suǒ)和(hé)天文学研(yán)究所的(de)研究(jiū)人员,就在人工智能的(de)帮助下设计了这(zhè)样(yàng)一个(gè)系统。
研究人员描述了一种人工(gōng)智能模型,该模型能够(gòu)生成合成星系的高分辨率图像,这些图像遵循(xún)了真实的星系分(fèn)布(bù)。
“21世纪的天文学发现自己拥有大量数据,大部分数据在捕获(huò)时会被过(guò)滤掉,以(yǐ)节省内存存储,”他们写道。“对于深(shēn)度(dù)学习等现代技术来说,进入这一(yī)领域的(de)时机已经成熟。星系在(zài)这类(lèi)应(yīng)用中(zhōng)起了关(guān)键(jiàn)作用,我们探(tàn)索了利用(yòng)人工(gōng)智(zhì)能(néng)来生成星系图像的可能性。”
该团队机器学(xué)习架构(gòu)的核心是生(shēng)成对(duì)抗性网(wǎng)络(GAN)——由生成样本的(de)生成器(qì)和试图区(qū)分(fèn)生成样本和(hé)真实样本的鉴(jiàn)别器组(zǔ)成的两部分神(shén)经网络。将GAN描述为AI算法中的“神童”并不夸张;它(tā)们被用(yòng)来(lái)发现新药,制作令人信服(fú)的汉堡和(hé)蝴蝶照(zhào)片,甚至生成脑癌(ái)的人工扫(sǎo)描图(tú)。
这(zhè)一星(xīng)系生成系统由两个(gè)五层(céng)GANs组成:阶段一GAN和阶段二(èr)GAN。第(dì)一个生成(chéng)低分辨率(lǜ)图像(64x64像素),而第(dì)二个使用一种叫做(zuò)超(chāo)分辨率(lǜ)的技术将它们转换(huàn)成高分辨率图(tú)像(128x128像素)。研究(jiū)人员指出,在实(shí)际(jì)过程中,阶段二GAN会(huì)自我填充缺失的像(xiàng)素,更加注重(chóng)现实性而非准确性。
为了“鼓励”阶(jiē)段二GAN中的生成器生成类似于放大实像对应(yīng)物的(de)合成星(xīng)系图像(xiàng),该论文作者引入了一个“双目(mù)标函数”,该函数计算了分(fèn)辨率增强图(tú)像和实像(xiàng)之间的误差标准。其结果是生成了(le)大量保留(liú)星(xīng)系“更稀(xī)有”特征的样本,如旋臂(bì)。
研究人员使用(yòng)英伟达(dá)GTX 1060 GPU在PC上训练人工智能系统,并为其提供来(lái)自Galaxy Zoo 2数(shù)据集的恒(héng)星和行星体(tǐ)的全色图像,Galaxy Zoo 2是(shì)一个众包天文(wén)学项目。他们在(zài)评(píng)估结果时考虑了四个属性:椭圆度(dù),或偏离圆形度的程度(dù);与(yǔ)水平面的仰角;总流量;以(yǐ)及(jí)半长轴(椭圆最长(zhǎng)直径的一半)的尺寸测量。
在论文的最(zuì)后(hòu),研究人员写道,该模型生成了非常类(lèi)似真实星系“物理真(zhēn)实”的图像。他(tā)们(men)认为,这一系统可以(yǐ)被(bèi)用(yòng)来扩充真实样本的数据库,实际上这也是深度学习(xí)模型的数据(jù)源。
“能够创(chuàng)建物理真实的星系图像生成模型有许多(duō)实际用途,”他们写道。“我(wǒ)们的工作(zuò)展示了GAN架构作为现(xiàn)代天文(wén)学宝贵工具(jù)的潜力(lì)。”