- BrainTools - https://www.braintools.ru -
Существует стереотип, что современная наука [1] об экзопланетах — это прерогатива NASA, ESA и ученых с миллионными грантами. Мы — команда обычных школьников и наш наставник — решили доказать, что для открытия новых миров достаточно ноутбука, Python и понимания того, что Машинное Обучение [2] (ML) без физики — это просто генератор случайных чисел.
Это история проекта ExoLogica AI. Путь от сокрушительного провала на республиканской конференции до создания гибридного интеллекта [3], который видит то, что иногда пропускают профессиональные телескопы.
Наше исследование началось с проекта под названием ExoScan. Задача была амбициозной: восстановить пропущенные данные в архивах NASA. Из-за особенностей методов обнаружения (транзитный метод) у тысяч планет известен радиус, но абсолютно неизвестна масса. Мы решили: «Окей, мы же в 21 веке, пусть это сделает ИИ!».
Мы использовали популярный алгоритм KNN (К-ближайших соседей). Логика [4] казалась безупречной: если у новой планеты радиус и период обращения совпадают с уже известной планетой, то и масса у них должна быть одинаковой.
На защите на республиканской конференции исследовательских работ нам устроили настоящий «разнос». Жюри — профессиональные астрофизики и математики [5] — указало нам на то, что наша программа — это «черный ящик» без капли физического смысла.
«Стена клонов»: ИИ выдавал одинаковые массы для совершенно разных систем. На графиках плотности мы видели пугающую прямую линию — все планеты имели плотность 8.49 г/см³.
Отсутствие формул: У нас не было математических доказательств того, почему планета весит именно столько. Мы просто слепо верили алгоритму.
Мы вернулись в школу с пониманием: в науке нельзя доверять Машинному Обучению без надзора Фундаментальной Физики.
После провала на конференции мы поняли: нам не нужно «просто машинное обучение». Нам нужен цифровой арбитр, который знает законы физики так же хорошо, как нейросеть знает статистику. Мы заперлись в школьном кабинете информатики и начали проектировать новую архитектуру — Neuro-Physical Synthesis.
Первым серьезным вызовом стала база данных. Работать только с архивом NASA — значит видеть мир «одним глазом». Мы приняли дерзкое решение: ExoLogica AI должна использовать все три крупнейшие мировые базы (NASA Exoplanet Archive, exoplanet.eu [6] и японскую ExoKyoto).
Почему это было чертовски сложно для нас, школьников? Каждая обсерватория живет в своем «формате». У NASA планета — это pl_name, у европейцев — просто name. Массы могут быть в Юпитерах, а могут в Землях. Но самая большая проблема — дубликаты. Одна и та же планета в разных базах может иметь чуть разные координаты и параметры.
Чтобы это заработало, мы написали на Python гибкий загрузчик с системой «маппинга» (сопоставления) колонок:
# Фрагмент нашего кода для стандартизации данных из разных источников
def standardize_columns(df, source_type):
mappings = {
'NASA': {'pl_name': 'name', 'hostname': 'star_name', 'pl_masse': 'mass_e'},
'EU': {'name': 'name', 'star_name': 'star_name', 'mass': 'mass_e'},
'ExoKyoto': {'#PlanetName': 'name', 'StarName': 'star_name', 'MassEarth': 'mass_e'}
}
# Приводим всё к единому стандарту ExoLogica
return df.rename(columns=mappings.get(source_type, {}))
# Удаление дублей: если планета есть в двух базах, оставляем ту, где больше данных
df_total = pd.concat([df_nasa, df_eu, df_jp]).drop_duplicates(subset=['name'], keep='first')
В новой версии программы мы изменили иерархию. Теперь процесс выглядит так:
Слой ИИ: Модель (XGBoost) делает «сырое» предсказание массы.
Слой физической фильтрации: Программа подставляет результат в формулы (Кеплер, Стефан-Больцман).
Слой синтеза: Если ИИ предлагает «железную болванку» там, где по всем законам должен быть газовый гигант, физический движок принудительно корректирует значение.
Мы провели честное соревнование трех архитектур на объединенном датасете (более 9000 записей):
KNN (К-ближайших соседей): Наш старый враг. Он снова подтвердил свою непригодность, упершись в «стену» средних значений (плотность 8.82 г/см³). KNN просто копировал прошлое, не создавая будущего.
Random Forest (Случайный лес): Справился лучше, но «усреднял» уникальные миры. Он выдавал стабильные, но «скучные» результаты, игнорируя аномалии, которые как раз и важны для поиска жизни.
XGBoost (Градиентный бустинг): Стал нашим триумфатором.
Почему XGBoost оказался «умнее» всех? Для нас, школьников, это стало открытием: градиентный бустинг строит деревья решений последовательно. Каждое дерево учится на ошибках предыдущего.
Представьте, что вы рисуете портрет: первое дерево намечает овал лица, второе — исправляет форму носа, а третье — добавляет блеск в глазах.
Благодаря этой дотошности XGBoost смог математически «нащупать» Зазор Фултона — нелинейную зависимость, где планеты определенного радиуса резко теряют массу, переходя из каменного состояния в газовое. Мы не говорили ему об этом — он сам нашел это в цифрах!
У нас нет серверов. Весь «Neuro-Physical Synthesis» мы реализовали на Python, используя scikit-learn, xgboost и pandas. Интерфейс написали на Tkinter, потому что он легкий и «летает» даже на старых школьных компьютерах.
Мы добавили в программу раздел «Академия», где прописали все формулы. Это был наш ответ жюри конференции: «Теперь мы не просто нажимаем кнопку, мы понимаем каждый мегабайт данных».
Многие ИИ-проекты в сфере R&D грешат тем, что за красивыми цифрами метрик в итоговых отчетах скрывается неповоротливый код в Jupyter-ноутбуках, непригодный для реального использования. Для ExoLogica AI мы изначально пошли по другому пути и своими силами разработали полноценный графический интерфейс на Tkinter. Он не просто отображает данные, он служит окном в «мозги» нашего гибридного интеллекта.
Давайте разберем по скриншотам, как именно архитектуре Neuro-Physical Synthesis удалось победить «стену клонов» и научить программу видеть физическую суть планет.
Начнем с базового режима работы — «Архивы Обсерваторий».
На этом скриншоте вы видите сводную таблицу, объединившую стандартизированные данные NASA, EU и ExoKyoto. В этом режиме отображаются только реально измеренные параметры.
На что обратить внимание [7]:
Цветовая легенда: Для удобства анализа мы внедрили систему цветовой маркировки по физическим типам. Зеленым подсвечиваются потенциально землеподобные миры, синим — водные миры/океаниды, красным — горячие гиганты.
Автоматический расчет ESI: Программа «на лету» рассчитывает Индекс подобия Земле (ESI) для каждого оригинального объекта на основе доступных параметров. Вы можете видеть колонку ESI, где, например, у Kepler-11 g он составляет 0.723, а у Gliese 581 d — 0.784.
Здесь всё «честно», но таблица пестрит пропусками в колонках массы и плотности из-за ограничений транзитного метода обнаружения. Именно здесь вступает в игру ИИ.
Чтобы понять, почему архитектура «чистого ИИ» несостоятельна в астрофизике, достаточно взглянуть на скриншот работы алгоритма KNN (К-ближайших соседей) без подключения физического движка.
Это — наглядная демонстрация того, что мы назвали «галлюцинациями ИИ». Взгляните на колонку «Плотн(г/см3)». Алгоритм KNN, не отягощенный знанием физики, просто экстраполировал наиболее часто встречающиеся значения из обучающей выборки. Все восстановленные планеты в таблице получили идентичную плотность — около 8.82 г/см³.
Для «наивного» ML-алгоритма экзопланеты были просто точками в n-мерном пространстве признаков. Он населил галактику идентичными железными болванками, полностью игнорируя Зазор Фултона и специфику материнских звезд. Этот «черный ящик» требовал радикальной переработки.
А теперь — то, ради чего мы полностью переписали ядро проекта. Режим «ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ» с выбранным алгоритмом XGBoost и включенным физическим движком.
На этом скриншоте видно, что ИИ больше не выдает усредненные цифры. Программа начала учитывать физическую вероятность существования объекта.
Анализ данных:
Уточненная природа: Программа не просто ставит формальный штамп исходя из радиуса. Она видит физическую суть: Proxima Centauri b классифицирована как «Замерзший каменистый мир» (учет низкой инсоляции у красного карлика). TRAPPIST-1 e, f, g четко определены как «Землеподобные планеты (Обитаемая зона)».
Физически обоснованное разнообразие: Колонка плотности перестала быть статической. Для Kepler-1544 b алгоритм «нащупал» Мини-Нептун с плотностью 4.49 г/см³, применив нашу Теорему о плотностном барьере.
Это доказательство работоспособности Neuro-Physical Synthesis: модель XGBoost генерирует веса по массе, а физический движок корректирует классификацию и температуру, создавая реалистичный профиль.
Финальный аналитический инструмент ExoLogica AI — вкладка «Графики (Синтез)».
Этот график позволяет визуализировать структуру всего каталога. По оси X отображается восстановленная масса, по оси Y — плотность.
На что смотреть:
Фазовые зоны: Цвета фона обозначают зоны автоматической классификации: от субземель (серый) до газовых гигантов (красный).
Выделение KOI-4878 b: Мы выделили конкретный объект (красная точка с черным контуром). Визуально она находится высоко в «оранжевой» зоне Суперземель, но заметно сдвинута вправо по оси плотности. Это графическое подтверждение того, что наш алгоритм предсказал ей аномально мощное железное ядро — структуру «Гигантского Меркурия».
Скриншоты подтверждают: ExoLogica AI превратилась из кода для импорта данных в полноценный аналитический комплекс, способный восстанавливать физическую картину Вселенной на основе фрагментарных данных.
Для глубокого анализа конкретного мира в ExoLogica AI предусмотрено интерактивное «Досье». Это не просто информационное окно, а полноценный аналитический хаб, где результаты работы ИИ сталкиваются с жесткой проверкой физического движка.
Функционал карточки включает три ключевых модуля:
Пошаговый физический расчет: раскрывает всю математическую цепочку (от Кеплера до индекса ESI).
3D-модель системы: визуализация орбиты в пространстве.
Экспорт в PDF: генерация официального паспорта объекта для научных докладов.
Главная фишка системы — прозрачность фильтрации. Когда пользователь выбирает фильтр «Только обитаемые», программа не просто проверяет значение «True/False» в базе. Она запускает движок верификации, который проводит объект через 6 этапов физического контроля:
ШАГ 1: Орбитальная механика. Пересчет дистанции до звезды. Для KOI-4878 b она составляет 1.1368 AU.
ШАГ 2: Светимость и Зона обитаемости. Определение границ жидкой воды (H Zin и H Zout). Мы видим, что планета находится в пределах зоны (1.018 – 1.467 AU).
ШАГ 3: Равновесная температура. Учет альбедо и светимости звезды. Результат: 246 K.
ШАГ 4: Поверхностная гравитация. Расчет ускорения свободного падения. У KOI-4878 b оно составляет 15.56 м/с².
ШАГ 5: Плотность (p) и Атмосфера (Λ). Здесь вступает в силу наша теорема. Плотность объекта — 8.40 г/см³. Параметр Джинса Λ≈50.5 подтверждает: гравитация планеты способна удерживать плотную атмосферу (водород и гелий не улетают).
ШАГ 6: Индекс ESI. Финальный расчет схожести с Землей. У данного объекта он феноменален — 0.972.
В нижней части досье программа выводит финальную классификацию. Для KOI-4878 b вердикт однозначен: «ПРАЙМ-КАНДИДАТ! Планета является одним из лучших кандидатов на наличие привычной нам жизни».
Такая многоступенчатая проверка исключает «галлюцинации» ИИ: если XGBoost предсказал массу, которая в сочетании с радиусом дает физически невозможную плотность или температуру, движок верификации пометит это в досье как аномалию.
Сухие числа в таблице — это фундамент, но астрофизику необходимо видеть пространственную конфигурацию системы.
При нажатии кнопки «3D МОДЕЛЬ СИСТЕМЫ» в досье, программа открывает отдельное TopLevel-окно. Используя параметры орбитального периода (P) и массы звезды (M⊕), физический движок рассчитывает большую полуось орбиты (a).
Затем, опираясь на эти данные, модуль визуализации рендерит интерактивную 3D-модель орбиты планеты вокруг родительской звезды. Модель полностью интерактивна: используя навигационную панель Matplotlib в нижней части окна, пользователь может вращать систему, масштабировать её (AU масштаб), чтобы наглядно оценить положение KOI-4878 b относительно её «Солнца» и зоны обитаемости. Это критически важно для визуальной оценки эксцентриситета орбит в сложных системах.
В разделе «Академия» нашей программы мы реализовали пошаговый вывод всех параметров системы. Программа анализирует систему как единый организм, начиная с материнской звезды.
Мы поняли, что смотреть нужно не только на планету, но и на её «родителя». ExoLogica AI классифицирует звезды по массе, радиусу и температуре (Teff). Это критически важно:
Орбитальная механика: По Третьему закону Кеплера мы вычисляем большую полуось (a):
Гравитационное доминирование: Мы внедрили расчет Сферы Хилла, чтобы понять, способна ли планета удержать спутники или её гравитация полностью подавлена звездой.
Используя закон Стефана-Больцмана с учетом альбедо (A=0.3), программа вычисляет равновесную температуру (T_eq}$). Финальным аккордом является расчет Индекса подобия Земле (ESI):
Самым важным научным достижением нашего проекта, рождённым в ходе дискуссий в школьном кабинете информатики, стала Теорема о плотностном барьере. Она стала нашим ответом на «разнос», полученный на республиканской конференции, и позволила превратить ИИ из генератора случайных цифр в инструмент с физическим мышлением [9].
Анализируя первые результаты работы алгоритма KNN, мы обнаружили странную аномалию, которую назвали «Стеной клонов». ИИ предсказывал массу планет таким образом, что их плотность почти всегда оказывалась равной 8.49 г/см³.
Для небольших планет это выглядело правдоподобно, но когда мы дошли до объектов с радиусом 1.7–1.8 R⊕, возник парадокс [10]. Согласно ИИ, такие планеты должны были весить около 9 масс Земли. В реальности же такие миры — это чаще всего «пухлые» Мини-Нептуны, состоящие из газа и льда, с гораздо меньшей массой.
Мы обратились к астрофизическим данным и обнаружили феномен, известный как Зазор Фултона (Fulton Gap). Статистика показывает, что в природе существует очень мало планет с радиусом от 1.5 до 2.0 радиусов Земли.
До 1.5 R⊕ — преобладают скалистые Суперземли.
Выше 2.0 R⊕ — преобладают газовые Мини-Нептуны.
Проблема нашего ИИ заключалась в том, что он пытался «заселить» этот пустой зазор тяжелыми железными планетами, что противоречит законам формирования планетных систем.
Чтобы решить этот конфликт [11] между статистикой ИИ и физикой, мы внедрили в программный код фазово-плотностной барьер.
Теорема ExoLogica о плотностном барьере:
При достижении критического радиуса Rp ∈ [1.5, 2.0] R⊕ планета обязана преодолеть плотностной порог p≥ 5.0 г/см³, чтобы сохранить статус каменистого мира.
Математическое обоснование:
Для проверки этого условия мы используем формулу расчета плотности, интегрированную в наше ядро:
Если расчетная плотность p оказывается ниже 5.0 г/см³, программа принудительно переквалифицирует объект из «Массивной каменистой Суперземли» в «Газовый карлик (Мини-Нептун)».
Внедрение этой теоремы мгновенно изменило качество данных.
KNN и Random Forest продолжали сопротивляться, пытаясь удержать плотность на высоком уровне.
🏆 XGBoost продемонстрировал невероятную гибкость: он стал учитывать плотностной барьер и начал выдавать для переходных планет (вроде Kepler-1544 b) массу 4.59⊕ и плотность 4.49 г/см³. Это идеально совпадает с характеристиками Мини-Нептунов, имеющих легкую атмосферу.
Мы доказали, что в условиях школьного проекта можно создать алгоритм сепарации данных, который не просто слепо верит обучающей выборке, а критически оценивает её через фильтр «Авторской теоремы». Это позволило нам не только преодолеть «Стену 8.49», но и начать корректно классифицировать планеты-океаны и лавовые миры, которые раньше ИИ считал обычными кусками железа.
Визуализация в программе: В интерфейсе ExoLogica AI мы добавили специальный график «Зазор Фултона», где красным цветом выделяются планеты, сумевшие преодолеть этот барьер и сохранившие статус потенциально обитаемых миров.

Если в экзопланетологии и существует «Святой Грааль», то это KOI-4878 b. Это не просто очередной номер в каталоге, а кандидат, чьи параметры наиболее близки к земным за всю историю наблюдений. Однако здесь кроется главная проблема: его радиус (R) известен благодаря транзитам телескопа Kepler, но масса (M) остается неподтвержденной. Без массы мы не знаем главного — имеем ли мы дело с твердой планетой или газовым «пузырем».
Именно KOI-4878 b стал финальным испытанием для нашего гибридного алгоритма XGBoost, работающего под присмотром физического движка.
Пока мировое научное сообщество ожидает данных от миссий нового поколения, наш ИИ произвел «цифровую вивисекцию» системы. Мы основывались на параметрах материнской звезды — желтого карлика класса G (аналог нашего Солнца) — и уточненной орбитальной механике.
Результаты синтеза ExoLogica AI:
Прогнозируемая масса: 1.71 М⊕(масс Земли).
Расчетная плотность: 8.40 г/см³.
ESI (Индекс подобия Земле): 0.972.
Равновесная температура: 246 K (-27$ °C).
С точки зрения [12] ESI — это практически «близнец» Земли, но с одной важной оговоркой, которую нашел наш алгоритм.
Цифра плотности в 8.40 г/см³ — пожалуй, самый интригующий результат. Наш алгоритм предсказал структуру, радикально отличающуюся от земной (5.51 г/см³).
Согласно вердикту физической экспертизы ExoLogica AI, KOI-4878 b — это мир с аномально мощным железным ядром. Фактически, перед нами «Гигантский Меркурий». Но если обычный Меркурий в нашей системе — это выжженный кусок камня без атмосферы, то KOI-4878 b за счет своей массы обладает колоссальной гравитацией. Мы прогнали эти данные через параметр Джинса, интегрированный в наш код: при такой массе и температуре планета способна удерживать плотную вторичную атмосферу (азот, кислород [13], водяной пар) на протяжении миллиардов лет. Это делает её даже более перспективной для жизни, чем Марс.
В ходе тестов старые алгоритмы (KNN) постоянно спотыкались на этом объекте. Они пытались выдать для него «усредненную» плотность 8.49 г/см³, просто копируя паттерны из обучающей выборки. Это и была та самая «стена клонов», за которую нас критиковали на конференции.
XGBoost же проявил «интеллектуальную гибкость». Он учел огромный орбитальный период в 449 суток (почти полтора земных года) и светимость звезды, скорректировав массу до 1.71 М⊕. Это позволило избежать галлюцинаций и получить цифру, которая идеально вписывается в современные модели формирования планет из богатых металлами протопланетных дисков.
Мы официально публикуем этот прогноз. Да, это исследование проведено в стенах обычной школы, но оно бросает вызов убеждению, что для таких расчетов нужны суперкомпьютеры NASA.
Наша научная ставка: когда европейская миссия PLATO или инфракрасный телескоп ARIEL наконец измерят массу KOI-4878 b методом лучевых скоростей, значения окажутся в коридоре 1.65–1.75 М⊕.
Если наш прогноз подтвердится, это станет окончательным доказательством того, что гибридный интеллект ExoLogica AI способен не просто обрабатывать статистику, а «видеть» физическую суть миров сквозь световые годы. Мы не просто ищем «вторую Землю» — мы доказываем её существование математически.

Мы осознаем: то, что мы создали в стенах обычной средней школы, — это лишь фундамент. У нас нет доступа к закрытым базам данных, у нас нет мощностей университетских лабораторий и научного бэкграунда академических институтов. Наша «научная база» — это школьный кабинет информатики, энтузиазм и открытые данные.
Однако именно это ограничение заставляет нас искать максимально эффективные пути. Мы понимаем, что для поиска настоящей «второй Земли» текущей модели недостаточно. В следующей версии ExoLogica AI мы планируем внедрить критерии, которые сегодня являются «передним краем» мировой экзопланетологии:
Даже если планета идеально подходит по массе и температуре, без глобального магнитного поля она обречена. Атмосфера будет просто «сдута» солнечным ветром, как это случилось с Марсом. Мы работаем над алгоритмом оценки магнитного момента, который будет основываться на предполагаемой массе железного ядра (исходя из нашей теоремы плотности) и скорости вращения планеты.
Большинство целей программы — это планеты у звезд М-класса (красные карлики). Они склонны к чудовищным вспышкам. Мы уже внедрили параметр Джинса для оценки диссипации (утечки) атмосферы, но в будущем модель должна учитывать накопленную радиационную дозу, которую получает планета. Жизнь в зоне обитаемости может быть невозможна, если звезда ежечасно «стерилизует» поверхность жестким рентгеном.
Многие из найденных нами миров находятся так близко к своим звездам, что, скорее всего, находятся в приливном захвате — они всегда повернуты к солнцу одной стороной. На одной стороне — вечный лед, на другой — расплавленный камень. Мы планируем интегрировать упрощенную модель атмосферного теплопереноса, чтобы понять, существует ли на таких планетах «зона сумерек», пригодная для жизни.
На сегодняшний день программа ExoLogica AI — это уже не просто учебный код. Она умеет генерировать профессиональные PDF-паспорта экзопланет, проводить многофакторный физический анализ и строить 3D-модели орбит.
Но нам, как школьному проекту, критически важен взгляд со стороны «большой науки». Мы приглашаем астрофизиков, планетологов и специалистов по Data Science к открытому тестированию нашей системы. Нам нужны ответы на вопросы, которые мы не можем найти в учебниках:
Насколько корректно наш ИИ интерпретирует «водные миры»? Не переоцениваем ли мы влияние водного слоя на общую плотность в наших расчетах?
Плотность 5.0 г/см³ для Зазора Фултона — это разумный компромисс или слишком жесткая планка? Мы вывели это число эмпирически, но нам важно знать мнение профессиональных теоретиков.
Где границы применимости XGBoost? В каких случаях градиентный бустинг может начать выдавать ложные корреляции в условиях дефицита данных?
Ваша обратная связь поможет нам превратить этот проект из успешного школьного доклада в серьезный инструмент, доступный исследователям-любителям и студентам по всему миру.
Команда проекта ExoLogica AI Научный руководитель: Логвинович Виктор
«Наша работа в обычной школе доказала: когда ИИ встречается с астрофизикой, рождается наука, доступная каждому. Мы верим, что великие открытия начинаются не с бюджета, а с правильно заданного вопроса. Per aspera ad astra!»
Автор: Lomakn
Источник [14]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/27910
URLs in this post:
[1] наука: http://www.braintools.ru/article/7634
[2] Обучение: http://www.braintools.ru/article/5125
[3] интеллекта: http://www.braintools.ru/article/7605
[4] Логика: http://www.braintools.ru/article/7640
[5] математики: http://www.braintools.ru/article/7620
[6] exoplanet.eu: http://exoplanet.eu
[7] внимание: http://www.braintools.ru/article/7595
[8] ошибки: http://www.braintools.ru/article/4192
[9] мышлением: http://www.braintools.ru/thinking
[10] парадокс: http://www.braintools.ru/article/8221
[11] конфликт: http://www.braintools.ru/article/7708
[12] зрения: http://www.braintools.ru/article/6238
[13] кислород: http://www.braintools.ru/article/5138
[14] Источник: https://habr.com/ru/articles/1016416/?utm_campaign=1016416&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.