- BrainTools - https://www.braintools.ru -
Учёные Института AIRI разработали [1] новый подход для предсказания оптических свойств молекул на основе трёхмерных графовых нейронных сетей. Метод позволил снизить ошибку [2] предсказания более чем на 30% по сравнению с лучшими существующими нейросетевыми моделями.
Знание оптических свойств веществ важно для разработки красителей, OLED-материалов, флуорофоров, фотосенсибилизаторов, биомаркеров и УФ-фильтров. Необходимо заранее понимать, свет какого цвета вещество поглощает, какого испускает, и насколько эффективно это происходит. Проверка огромных библиотек веществ экспериментальным путём или с помощью квантово-химических расчётов требует значительных затрат времени и средств. Предложенный подход решает эту задачу за доли секунды на одну молекулу.

Для обучения [3] моделей исследователи собрали специализированный набор данных nablaColors-3D из открытых источников. В него вошли экспериментальные данные об оптических свойствах молекул в разных растворителях вместе с дополнительно рассчитанными пространственными структурами. Записи вручную сверяли с первоисточниками, ошибочные исправляли или удаляли. Это первый крупный набор данных, где для молекул-хромофоров доступны пространственные структуры.
Наличие геометрии в данных позволило применить трёхмерные графовые нейронные сети, которые учитывают пространственное строение молекулы. Такие модели предсказывают оптические свойства точнее, чем предыдущие нейросетевые подходы и методы вычислительной физики.
Учёные сравнили пять современных моделей, работающих с геометрией молекул: PaiNN, DimeNet++, GemNet-OC, eSCN и UniMol+. Каждую модель сначала предобучили на крупных химических датасетах, а затем дообучили на nablaColors-3D для предсказания экспериментальных спектров. Дополнительно в сравнение включили несколько сильных базовых моделей из лучших существующих решений, которые используют только информацию о химических связях без учёта геометрии молекулы.
Качество предсказания оценивали по метрике средней абсолютной ошибки между предсказанной и экспериментальной длиной волны. Лучшая модель без учёта геометрии достигла ошибки около 24 нанометров, а лучшая модель с учётом пространственной структуры снизила ошибку до 16 нанометров. Для сравнения квантово-химический метод TD-DFT на том же тесте давал ошибку около 62 нанометров. Исследователи также показали, что чем точнее метод расчёта геометрии молекулы, тем лучше качество предсказаний.
Научный [4] сотрудник группы органической химии Центра ИИ-разработки новых лекарственных препаратов Института AIRI Денис Потапов, отметил, что одного знания о том, какие атомы и связи есть в молекуле, недостаточно для точного предсказания оптических свойств. По словам Дениса Потапова, пространственное расположение атомов определяет электронную структуру молекулы, а значит, и то, как она поглощает и испускает свет. Именно это даёт основной прирост точности в предложенном подходе.
Автор: Lexx_Nimofff
Источник [5]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/27352
URLs in this post:
[1] разработали: https://www.nature.com/articles/s42004-026-01944-5
[2] ошибку: http://www.braintools.ru/article/4192
[3] обучения: http://www.braintools.ru/article/5125
[4] Научный: http://www.braintools.ru/article/7634
[5] Источник: https://habr.com/ru/news/1011958/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1011958
Нажмите здесь для печати.