- BrainTools - https://www.braintools.ru -

Шекспировские луны, темные льды и распухшие города: как ИИ извлекает из старых архивов новые открытия

Во Вселенной нет понятия «старых новостей» — эта чудесная зловещая бездна еще совсем младенец, а потому термины «старый» и «новый» по отношению к космосу имеют смысл в основном для мозгастого астрофизика или греческого филолога. С 5 сентября 1977 года, даты запуска аппарата «Вояджер-1», минула уйма времени — 48 лет, но как только мы переводим эту цифру в единицы сагановского Космического календаря [1], останутся жалкие ~0,11 секунды — не поживишься. Впрочем, для ученых такой релятивизм как раз таки плюс — даже крохотный момент бытия Вселенной (ну, скажем, весь период существования человеческой цивилизации, ~23 секунды по Сагану), может стать источником интересных и неустаревающих научных открытий.

Еще до «Вояджеров» человечество, например, дерзнуло и создало Паломарский атлас звездного неба [2], кропотливо составленный вручную из 936 квадратиков фотопластинок. На сегодня же космические миссии/проекты NASA уже принесли человеку больше 100 петабайт данных, — это примерно как 20 миллиардов фото со смартфона — но лучше, потому что все же не массивы селфи (хотя кто бы отказался от игривого селфи ксеноморфа?).

Pale Blue Dot («Бледная голубая точка»), снимок Земли с «Вояджера-1», — самый известный архивный документ NASA. В этом году кадру 35 лет

Pale Blue Dot («Бледная голубая точка»), снимок Земли с «Вояджера-1», — самый известный архивный документ NASA. В этом году кадру 35 лет

Итак, NASA хранит свыше 100 петабайт научных данных — это телеметрия миссий, спектроскопия, карты, замеры магнитосфер и атмосферы, съемка Земли и Луны, радиоданные и геоданные (LiDAR, радары, гиперспектральные карты) — множество разрозненных сведений. Однако сейчас — с появлением новых методов анализа, от совмещения кадров и фильтрации, computer vision и распознавания паттернов до фундаментальных узкообученных моделей ИИ, — самое время задаться вопросом: не пора ли уже зарыться с головой в эти архивы? Мы и задались — и вот что узнали.

Основная идея Космического календаря (Cosmic Calendar) Карла Сагана

Карл Саган предложил не церемониться и сжать всю историю Вселенной до одного календарного года (365 дней).

То есть:

  • 1 год календаря (вся история Вселенной) = 13,8 млрд лет,

  • 1 день = 37,8 млн лет,

  • 1 час = 1,58 млн лет,

  • 1 минута = 26 300 лет,

  • 1 секунда = 438 лет.

Данные для расчета:

  • запуск «Вояджера-1» и «Вояджера-2»: 1977 год,

  • текущий год: 2025-й,

  • прошло: 48 земных лет.

Собственно расчеты:

1 секунда космического календаря = 438 земных лет,

48 лет ÷ 438 лет/с = 0,1096 с — то есть с момента запуска Voyager прошло ~0,11 секунды Космического календаря.

Начало. Потерянные луны

Одним из первых интересных архивных кейсов стала история с лунами Урана: Пердитой и Купидом. Когда в январе 1986 года «Вояджер-2» пролетел мимо планеты, он сделал множество снимков, спектральных и частично маппинговых наблюдений системы Урана и его спутников. На тот момент были обнаружены 10 новых спутников (помимо уже известных). Но многое из того, что послал «Вояджер-2», осталось в тени — особенно мелкие, темные, близкие к планете объекты. 

В течение десятилетий эти архивные снимки анализировали многократно, но безуспешно, — вплоть до 1980–1990-х, когда компьютеры и оцифровка изображений позволили пропускать данные «Вояджеров» через фильтры, вычитать фон и совмещать кадры, а не просто рассматривать на пленке. 

Тело 1. Пердита

Однако первое открытие произошло еще позже — в 1999 году Эрих Каркошка (Erich Karkoschka) опубликовал работу, в которой на старых снимках «Вояджера-2» он заметил слабый светящийся объект в той области, где ранее спутников не наблюдали. Ученый суммировал десятки кадров, выровняв их по предполагаемой орбите, отфильтровал фон и шум и таким образом «вытянул» из данных крошечную луну — Пердиту

Позже снимки «Хаббла» помогли подтвердить, что в том месте действительно есть спутник, и Пердита официально стала признанной. Ее орбита показала, что она находится в резонансе 43 к 44 с более массивной луной Белиндой, — то есть обе движутся почти синхронно, и гравитация Белинды слегка «подталкивает» соседку, удерживая ее орбиту в устойчивом ритме. Этот резонанс не скрывает спутник, но делает его движение немного нерегулярным, — из-за этого точное положение Пердиты на старых снимках долго оставалось неочевидным.

Часть спутников Урана. Надо ли объяснять, что все они названы в честь персонажей произведений Уильяма Шекспира и Александра Поупа 

Часть спутников Урана. Надо ли объяснять, что все они названы в честь персонажей произведений Уильяма Шекспира и Александра Поупа 

Тело 2. Купид

Еще один «пропавший» спутник — Купид — нашли уже в XXI веке, спустя почти двадцать лет после «дела Пердиты». Он тоже прятался на тех же архивных снимках «Вояджера-2», но оказался еще менее заметным: его диаметр всего около 18 километров, альбедо (отражательная способность) ниже, чем у угля, и орбита всего в 74 тысячах километров от Урана, прямо у ослепительно яркого кольца.

Купид удалось поймать с появлением космического телескопа «Хаббл» (запущен в 1990 году) и новых алгоритмов анализа. В 2003 году группа Марка Шоуолтера из SETI Institute, обрабатывая изображения с «Хаббла», применила усовершенствованные методы цифрового вычитания фона и коррекции движения по орбите — похожие на те, что ранее использовал Каркошка, но уже с гораздо более высокой чувствительностью. 

После совмещения сотен кадров и подавления фонового шума на орбите между Белиндой и Пердитой проявилась крошечная светлая точка — еще одна луна Урана. Так Купид был официально внесен в список спутников планеты (сегодня их, к слову, насчитывается 29 штук).

Кстати, орбита Купида тоже оказалась непростой: он движется всего в нескольких тысячах километров от Белинды и находится вблизи орбитального резонанса, из-за чего его траектория может слегка «гулять». По моделям NASA, эта часть уранианской системы нестабильна: малые луны там постоянно обмениваются орбитальной энергией, и через миллионы лет некоторые из них могут столкнуться или распасться.

Два небесных тела, обнаруженные скорее алгоритмами, чем съемками, стали хорошим стартом — открытия продолжились.

Лед в темноте, или В дело вступает ML 

Следующим громким воскрешением архивов стала история водяного льда на Луне. Казалось бы, этот вопрос ученые закрыли еще в прошлом веке: миссии «Аполлон» не нашли ни одной замерзшей капли, а поверхность Луны считалась абсолютно сухой, выжженной солнечным ветром. Но — как и с «потерянными» лунами Урана — оказалось, что дьявол кроется в деталях в тенях.

Лунные льды Южного полюса

Лунные льды Южного полюса

Смена парадигмы случилась благодаря данным Lunar Reconnaissance Orbiter (LRO), запущенного в 2009 году. Этот аппарат собирал терабайты информации о рельефе, температуре и составе поверхности, включая труднодоступные полярные регионы. Сенсация всплыла спустя годы, когда исследователи начали заново анализировать архивные данные инфракрасных камер и спектрометров LRO — уже с применением улучшенных методов шумоподавления, спектральной классификации на базе ML и коррекции освещенности (модели учились отличать «ледяные» полосы поглощения от шума и артефактов геометрии съемки). 

Lunar Reconnaissance Orbiter (LRO)

Lunar Reconnaissance Orbiter (LRO)

В 2018 году независимые группы из NASA Ames и NASA Goddard, пропустив старые наблюдения через новые алгоритмы, обнаружили четкие спектральные сигнатуры поверхностного водяного льда в постоянно затененных кратерах у лунных полюсов; ключевую роль сыграл анализ полос поглощения H2O в ближнем ИК-диапазоне и вероятностная фильтрация ложных срабатываний.

В 2024-м переанализ тех же регионов подтвердил: лед не только существует в «вечных тенях» Южного полюса, но и встречается гораздо шире — даже в мелких трещинах и кратерах вне основной зоны замерзания. Для проверки использовали data-fusion-пайплайны (совмещение тепловых карт LRO и отражательных/топографических слоев) и модели машинного обучения [3] для ранжирования «ледяной правдоподобности» площадок, с кросс-проверкой по данным других миссий (включая индийские «Чандраяны»). 

Теперь именно на обнаруженных ледниках планируют сажать будущие лунные миссии.

Взгляд вниз. Тайный город майя

В 2024 году археологи и специалисты NASA сообщили о находке нового, до этого неизвестного города майя, скрытого под густыми джунглями мексиканского Кампече. И снова — никакой экспедиции с мачете и картами Индианы Джонса: все произошло внутри архивных данных, пролежавших на серверах NASA больше десяти лет.

Открытие началось с того, что исследователи из Университета Аризоны и NASA Goddard решили переобработать старые данные миссии G-LiHT (Goddard’s LiDAR, Hyperspectral & Thermal Imager), полученные еще в 2013 году. Тогда эти данные использовали для картографирования лесных экосистем, но в 2020-х их пропустили через современные нейросетевые фильтры, способные отличать геометрические структуры, созданные человеком, от хаотичных природных форм.

Обнаруженное таинственное поселение майя покрывает примерно 50 гектаров и включает пирамиды, террасы, дворцовые постройки, храмы, резиденции знати и систему дорог (сакбе)

Обнаруженное таинственное поселение майя покрывает примерно 50 гектаров и включает пирамиды, террасы, дворцовые постройки, храмы, резиденции знати и систему дорог (сакбе)

ИИ «просканировал» поверхность, убирая растительность слой за слоем, и выдал удивительный результат: под зеленым куполом Амазонии тянулась сеть дорог, платформ, террас и пирамид, явно рукотворных. Так на экранах исследователей проступил Ocomtún [4], «каменная колонна» на языке майя, огромный город, процветавший более тысячи лет назад.

И снова Земля. Распухшие города

Если древние города археологи ищут под листвой, рискуя нарваться на неописуемые ужасы джунглей, то современные просто растут на глазах, и именно космические архивы позволяют измерять этот рост буквально по пикселям.

Спутники Landsat и Sentinel-2 десятилетиями фиксируют изменения земной поверхности: от смены растительности до расширения промзон и дорог. Сегодня NASA объединило эти массивы в единый временной ряд с помощью проекта Harmonized Landsat and Sentinel-2 (HLS), синхронизировав миллионы снимков по дате и спектрам с помощью алгоритмов машинного обучения. 

ИИ-модели устраняют атмосферные и геометрические искажения, калибруют яркость, компенсируют различия в угле съемки и освещенности, чтобы каждый пиксель Земли можно было сопоставить с тем же местом через 5, 10 или 30 лет. Результат — масштабная хроника урбанизации планеты. Например, анализ архивных данных Landsat показал, как за 30 лет пригород Онтарио (Калифорния) буквально распух: сельхозполя уступили место складам и аэропорту, а жилые массивы сомкнулись с индустриальными зонами. Алгоритмы HLS фиксируют даже микродинамику — где за год исчезает зеленая зона, а где появляется новый микрорайон.

Онтарио (Калифорния), 1985 год

Онтарио (Калифорния), 1985 год
Этот же регион, 2010 год. Рассмотреть лучше можно тут

Этот же регион, 2010 год. Рассмотреть лучше можно тут [5]

Сегодня эти же инструменты используют для прогнозирования: нейросетевые модели NASA учатся распознавать паттерны городского роста, предсказывать, куда «поползет» застройка, и оценивать ее влияние на экосистемы. Иными словами — следят, как цивилизация меняет ландшафт в реальном времени и как быстро мы заполняем собственную карту мира.

Что дальше? Foundation

Сегодня среди приоритетов NASA — переход от единичных отраслевых проектов на базе ИИ к созданию экосистемы foundation-моделей. Всего в NASA пять ключевых дивизионов: Astrophysics, Biological and Physical Sciences, Earth Science, Heliophysics, and Planetary Science, а цель — разработать свою специализированную модель для работы с архивами каждого. 

22 июня 2013 года спутник Landsat 8 сделал это псевдоцветное изображение пожара East Peak, охватившего южную часть Колорадо недалеко от города Тринидад. Сгоревшие участки выглядят темно-красными, активно горящие зоны — оранжевыми. Темно-зеленые области соответствуют лесам, а светло-зеленые — травянистым равнинам. Данные Landsat 8 использовались для обучения моделей ИИ Prithvi

22 июня 2013 года спутник Landsat 8 сделал это псевдоцветное изображение пожара East Peak, охватившего южную часть Колорадо недалеко от города Тринидад. Сгоревшие участки выглядят темно-красными, активно горящие зоны — оранжевыми. Темно-зеленые области соответствуют лесам, а светло-зеленые — травянистым равнинам. Данные Landsat 8 использовались для обучения моделей ИИ Prithvi

Одной из первых подобных моделей стала Prithvi Geospatial [6], обученная на данных Landsat 8, включая снимки лесных пожаров, эрозии и вырубок. Она умеет определять «шрамы» выгоревших территорий и помогать оценивать последствия катастроф. Ее сестра — Prithvi Weather [7] — анализирует климатические архивы, отслеживая погодные аномалии и долгосрочные тренды. На основе их успеха NASA уже разрабатывает модель для гелиофизики, которая должна предсказывать солнечную активность и космическую погоду, способную влиять на спутники, связь и даже электросети на Земле. В пайплайне также — модель Луны, помогающаялучше понять распределение ресурсов и поведение [8] лунной среды.

Сейчас эти модели — результат совместной работы NASA, IBM и университетских лабораторий — проходят научную валидацию на уровне агентства как виртуальные ассистенты-исследователи, использующие десятилетия накопленных данных, чтобы быстрее и точнее выявлять скрытые закономерности в архивах. 

Повторить трюк, подобный тому, что сейчас проворачивает [9] Обсерватория Веры Рубин, где мощности ИИ направлены на распознавание снимков южного неба, здесь невозможно — данные NASA слишком разрозненны, охватывают десятки дисциплин и миссий. Тем не менее в перспективе ближайших 5–10 лет у человечества, благодаря работе с архивами, есть реальный шанс на научный [10] скачок даже при снижении финансирования новых миссий. От обнаружения новых небесных тел и изучения геохимии планет до уточнения солнечных циклов и моделирования урбанизации.

Кстати!

Большая часть данных NASA доступна открыто — можно самим занырнуть в архивы и посмотреть, что там есть. Например:

PDS — Planetary Data System

pds.nasa.gov [11]
[12]Архив всех планетарных миссий NASA: Voyager, Cassini, Juno, New Horizons, Perseverance и др.
Здесь хранятся снимки, спектры, карты, топография Луны, Марса и астероидов, радиолокационные и гравиметрические данные.
Данные доступны в научных форматах (FITS, IMG, CSV) с подробными метаданными и инструментами для просмотра.

MAST — Mikulski Archive for Space Telescopes

archive.stsci.edu [13]
[14]Архив телескопов NASA: Hubble, TESS, Kepler, JWST и др.
Содержит изображения, спектры, каталоги экзопланет и галактик.
Данные можно смотреть в браузере, строить графики или выгружать через API. Это один из самых богатых открытых астрономических архивов.

NASA Earthdata

earthdata.nasa.gov [15]
[16]Огромная база наблюдений Земли со спутников Terra, Aqua, Suomi NPP, Landsat, ICESat-2 и др.
Карты растительности, льдов, океанов, загрязнений, температуры, CO2 и метана, включая почти реальные временные ряды.
После быстрой бесплатной регистрации (Earthdata Login) можно загружать данные и визуализировать их прямо онлайн.

Главный вывод: открытия перестали быть элитарными

Самое интересное во всей этой истории с воскрешением архивов — не сами находки, а то, кто теперь может их делать. Еще пару десятилетий назад, чтобы «вытянуть» крошечную луну из шума на снимках «Вояджера», требовалась не только докторская степень и многолетний опыт [17], но и эксклюзивный доступ к вычислительным мощностям NASA, закрытым данным и благословение научного совета. Космические архивы были привилегией избранных — тех, кто работал в правильных лабораториях, с правильным финансированием, в правильных странах.

Сегодня барьеры если не рухнули, то заметно просели. Те же петабайты данных лежат в открытом доступе, foundation-модели можно дообучить, а методологии публикуются в open-access-журналах. Конечно, обработка терабайт LiDAR или обучение нейросети на снимках Landsat по-прежнему требуют серьезных ресурсов и компетенций, но теперь это могут делать не только NASA Goddard или MIT, а любые исследовательские группы. 

Архив NASA — это не музей, а действующее месторождение, где следующую сенсацию можно добыть. Во Вселенной, как мы помним, нет понятия «старых новостей» — а значит, и монополии на их обнаружение тоже нет.

Автор: maxim_tsar

Источник [18]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/21776

URLs in this post:

[1] сагановского Космического календаря: https://en.wikipedia.org/wiki/Cosmic_Calendar

[2] Паломарский атлас звездного неба: https://ru.wikipedia.org/wiki/%D0%9F%D0%B0%D0%BB%D0%BE%D0%BC%D0%B0%D1%80%D1%81%D0%BA%D0%B8%D0%B9_%D0%BE%D0%B1%D0%B7%D0%BE%D1%80

[3] обучения: http://www.braintools.ru/article/5125

[4] Ocomtún: https://www.bbc.com/travel/article/20230704-ocomtn-a-long-lost-maya-city-that-was-just-discovered

[5] тут: https://science.nasa.gov/open-science/archival-data-discoveries/

[6] Prithvi Geospatial: https://huggingface.co/ibm-nasa-geospatial

[7] Prithvi Weather: https://huggingface.co/Prithvi-WxC

[8] поведение: http://www.braintools.ru/article/9372

[9] проворачивает: https://www.gadgets360.com/science/news/rubin-observatory-to-use-ai-algorithm-imagemm-bringing-ground-based-views-closer-to-space-quality-9374011

[10] научный: http://www.braintools.ru/article/7634

[11] pds.nasa.gov: http://pds.nasa.gov

[12]
: https://pds.nasa.gov

[13] archive.stsci.edu: http://archive.stsci.edu

[14]
: https://archive.stsci.edu

[15] earthdata.nasa.gov: http://earthdata.nasa.gov

[16]
: https://earthdata.nasa.gov

[17] опыт: http://www.braintools.ru/article/6952

[18] Источник: https://habr.com/ru/companies/gazprombank/articles/965242/?utm_source=habrahabr&utm_medium=rss&utm_campaign=965242

www.BrainTools.ru

Rambler's Top100