Учёные AIRI разработали нейросеть для предсказания оптических свойств молекул с точностью на 30% выше аналогов. airi.. airi. oled.. airi. oled. искусственный интеллект.. airi. oled. искусственный интеллект. искуственный интеллект.. airi. oled. искусственный интеллект. искуственный интеллект. научно-популярное.. airi. oled. искусственный интеллект. искуственный интеллект. научно-популярное. свойства материалов.. airi. oled. искусственный интеллект. искуственный интеллект. научно-популярное. свойства материалов. Химия.

Учёные Института AIRI разработали новый подход для предсказания оптических свойств молекул на основе трёхмерных графовых нейронных сетей. Метод позволил снизить ошибку предсказания более чем на 30% по сравнению с лучшими существующими нейросетевыми моделями.

Знание оптических свойств веществ важно для разработки красителей, OLED-материалов, флуорофоров, фотосенсибилизаторов, биомаркеров и УФ-фильтров. Необходимо заранее понимать, свет какого цвета вещество поглощает, какого испускает, и насколько эффективно это происходит. Проверка огромных библиотек веществ экспериментальным путём или с помощью квантово-химических расчётов требует значительных затрат времени и средств. Предложенный подход решает эту задачу за доли секунды на одну молекулу.

Учёные AIRI разработали нейросеть для предсказания оптических свойств молекул с точностью на 30% выше аналогов - 1

Для обучения моделей исследователи собрали специализированный набор данных nablaColors-3D из открытых источников. В него вошли экспериментальные данные об оптических свойствах молекул в разных растворителях вместе с дополнительно рассчитанными пространственными структурами. Записи вручную сверяли с первоисточниками, ошибочные исправляли или удаляли. Это первый крупный набор данных, где для молекул-хромофоров доступны пространственные структуры.

Наличие геометрии в данных позволило применить трёхмерные графовые нейронные сети, которые учитывают пространственное строение молекулы. Такие модели предсказывают оптические свойства точнее, чем предыдущие нейросетевые подходы и методы вычислительной физики.

Учёные сравнили пять современных моделей, работающих с геометрией молекул: PaiNN, DimeNet++, GemNet-OC, eSCN и UniMol+. Каждую модель сначала предобучили на крупных химических датасетах, а затем дообучили на nablaColors-3D для предсказания экспериментальных спектров. Дополнительно в сравнение включили несколько сильных базовых моделей из лучших существующих решений, которые используют только информацию о химических связях без учёта геометрии молекулы.

Качество предсказания оценивали по метрике средней абсолютной ошибки между предсказанной и экспериментальной длиной волны. Лучшая модель без учёта геометрии достигла ошибки около 24 нанометров, а лучшая модель с учётом пространственной структуры снизила ошибку до 16 нанометров. Для сравнения квантово-химический метод TD-DFT на том же тесте давал ошибку около 62 нанометров. Исследователи также показали, что чем точнее метод расчёта геометрии молекулы, тем лучше качество предсказаний.

Научный сотрудник группы органической химии Центра ИИ-разработки новых лекарственных препаратов Института AIRI Денис Потапов, отметил, что одного знания о том, какие атомы и связи есть в молекуле, недостаточно для точного предсказания оптических свойств. По словам Дениса Потапова, пространственное расположение атомов определяет электронную структуру молекулы, а значит, и то, как она поглощает и испускает свет. Именно это даёт основной прирост точности в предложенном подходе.

Автор: Lexx_Nimofff

Источник

Rambler's Top100