Почему искусственный интеллект не может заменить врачей и ученых, но может им помочь. ИИ.. ИИ. искусственный интеллект.. ИИ. искусственный интеллект. лекарства.. ИИ. искусственный интеллект. лекарства. математика.. ИИ. искусственный интеллект. лекарства. математика. Машинное обучение.. ИИ. искусственный интеллект. лекарства. математика. Машинное обучение. медицина.. ИИ. искусственный интеллект. лекарства. математика. Машинное обучение. медицина. научно-популярное.. ИИ. искусственный интеллект. лекарства. математика. Машинное обучение. медицина. научно-популярное. фармакология.

Всем добрый день! 

Я уже почти 15 лет работаю в сфере разработки инновационных лекарственных препаратов и диагностических инструментов, и на моей памяти приход новых технологий не раз порождал иллюзию скорого избавления человечества от всех болезней. И, конечно, разного рода открытия в области генной инженерии, иммуно-онкологии и молекулярной биологии поспособствовали появлению инновационных терапий, однако, к сожалению, многочисленные заболевания пока не поддаются излечению.  

В какой-то момент инструментом поиска панацеи стал считаться искусственный интеллект (здесь достаточно вспомнить намерения Цукерберга вылечить все болезни или заявления Билла Гейтса о том, что ИИ заменит большую часть врачей).  Однако, как и во многих других отраслях, вслед за бумом завышенных ожиданий пришло осознание границ применимости методов и более зрелое отношение к технологиям. В этой статье я хотела бы описать взгляд традиционного ученого на “хайп” вокруг нейросетей и громогласные высказывания о том, что скоро нас всех заменит искусственный интеллект.

Традиционный подход в разработке лекарств 

Для того, чтобы оценить применимость искусственного интеллекта в разработке препаратов, давайте вспомним ключевые этапы на пути создания нового лекарства и получаемые в процессе данные (рис. 1): на начальных этапах происходит определение мишени для терапевтического вмешательства и поиск химических структур, обладающих заданной активностью в отношении выбранной мишени. Оценка безопасности, стабильности и биологической активности отобранных молекул тестируется на клеточных культурах in vitro и в различных исследованиях на животных, in vivo. При положительном результате препарат выводится в клинические исследования, где показатели эффективности и безопасности потенциального лекарства изучаются уже на людях. Регуляторные органы проводят экспертную оценку полученных данных и принимают решение о допуске препарата на рынок. Для многих препаратов также проводятся постмаркетинговые исследования, направленные на изучение особенностей применения препарата в реальной клинической практике. 

Рис. 1. Процесс создания нового лекарства: от идеи до аптечной полки.

Рис. 1. Процесс создания нового лекарства: от идеи до аптечной полки.

Как видно из приведенной схемы, по мере разработки стоимость исследований и число вовлекаемых пациентов значительно увеличивается, при этом наибольшая часть молекул выбывает на начальных этапах.

Успехи ИИ в Drug discovery 

Путь новой молекулы начинается с понимания патогенетических механизмов заболевания и выбора биологической мишени, с которой должен взаимодействовать препарат. Здесь с одной стороны, требуется определение ключевых компонентов патогенеза (клеток, ферментов, цитокинов и т. д.), воздействие на которые окажет необходимый биологический эффект (это является задачей системной биологии), с другой стороны важно оценивать, насколько прицельно мы можем бить в эту мишень и как это лучше делать. На данном этапе критически важным является изучение пространственной структуры мишени для выявления потенциальных сайтов связывания, однако необходимые экспериментальные исследования являются технически сложными и дорогостоящими, что сильно ограничивает возможности исследователей. Преодолеть эту проблему помогла нейросеть AlphaFold 2, способная предсказывать 3D структуру белка на основе данных о последовательности аминокислот. Значение AlphaFold 2 для мировой науки оказалось настолько велико, что создатели алгоритма, Демис Хассабис и Джон Джампер, были удостоены Нобелевской премии по химии в 2024 году.

Еще одной популярной точкой приложения ИИ стоит считать поиск оптимальных химических структур, демонстрирующих высокое сродство к выбранным мишеням и обладающих оптимальными фармакологическими свойствами. Так, к середине 2025 года 45 молекул, сгенерированных ИИ, уже находились на разных стадиях клинических исследований. Звучит действительно впечатляюще, но есть особенности данных, которые накладывают ограничения на полную автоматизацию процесса. Одной из ключевых проблем в области является невозможность использования химических формул и структур в качестве входных данных как для классических моделей машинного обучения, так и нейросетей. Для решения этой задачи предполагается использование различных дескрипторов, характеризующих определенные свойства молекул, однако универсального решения пока нет, поэтому разработка и применение таких моделей требует продвинутой экспертизы в области химии. 

Рис. 2. Варианты представления химических структур на языке математики. a) Примеры дескрипторов, b) Использование 3D дескрипторов в графовых нейросетях. Источник [Gaurav et al., Microbiology 2023;169:001333] 
Рис. 2. Варианты представления химических структур на языке математики. a) Примеры дескрипторов, b) Использование 3D дескрипторов в графовых нейросетях. Источник [Gaurav et al., Microbiology 2023;169:001333] 

Еще одной проблемой является получаемое при использовании ряда дескрипторов (например, Morgan fingerprints) количество итоговых признаков в модели, которое может достигать тысяч, что приводит к необходимости использования большого объема данных для обучения моделей, поэтому если вы вдруг не работаете внутри фармацевтического гиганта, в котором рутинно проводятся соответствующие эксперименты, то могут возникнуть сложности cо сбором датасета.  

Также стоит отметить, что показатели измеряемой в экспериментах биологической активности, токсичности и распределения препаратов в значительной степени зависят от условий эксперимента, например, от культуры клеток, плотности рецепторов и многих других тонкостей, поэтому если для обучения модели использовать такой набор гетерогенных данных, полученных из разных источников, не задумываясь об их природе, то результат может быть некорректным.  

Это приводит к осознанию того, что любые алгоритмы являются лишь инструментом в руках ученых с хорошей базой в химии, биологии и математике, которые не только смогут построить валидную модель и сгенерировать какую-то структуру, но и оценить, сколько она вообще может существовать в природе, и какие сложности могут возникнуть с ее синтезом. 

Несмотря на ряд ограничений, стоит отметить рост популярности применения таких алгоритмов в разработке препаратов, и за период с 2016 по 2023 Управление по санитарному надзору за качеством пищевых продуктов и медикаментов США получило уже более 500 заявок, содержащих в себе компоненты ИИ, что мотивировало регуляторные органы установить 10 основополагающих принципов для безопасного использования ИИ анализа, включая мультидисциплинарную разработку продуктов, оценку потенциальных рисков, определение границ применимости методов и создание детальной документации касательно используемых данных и разработки алгоритмов.

Двуликий ИИ для клинической разработки 

В качестве примера приведу одну из стандартных задач по оценке безопасности терапии. Зачастую для решения подобных вопросов в разработке используются модели множественной логистической регрессии, которые в качестве предикторов используют дозу или концентрацию препарата, а также характеристики пациентов, например пол и возраст, а в качестве зависимой переменной – вероятность наступления побочного эффекта на фоне лечения. Такая модель на самом деле, является очень простой, однако при ее использовании мы получаем значения параметров, которые могут быть проинтерпретированы с клинической точки зрения, а поведение самой модели является предсказуемым. При использовании сложных нелинейных алгоритмов эта интерпретируемость зачастую теряется, кроме того, оценка доверительных интервалов расчетов в данном случае затруднительна, то есть мы не знаем, насколько точно оценены параметры алгоритма, поэтому сложно заставить себя доверять полученным цифрам.  

Однако, несмотря на то что в целом область статистической обработки медицинских данных весьма консервативна, ИИ может выступить в качестве вспомогательного инструмента и ассистента для написания программного кода, и в настоящее время такие продукты уже начинают появляться на рынке (например, разработки от Sonata Software). 

Кроме базовых статистических методов в разработке лекарств также используются более сложные модели, позволяющие не просто спрогнозировать то или иное событие, но и интерпретировать результаты полученных расчетов с точки зрения патофизиологии, фармакологии разрабатываемого препаратов и индивидуальных особенностей пациента. Такие модели состоят из уравнений, характеризующих конкретные физиологические процессы такие как клеточное деление, ингибирование работы фермента и т. д. Итогом моделирования в данном случае будет не одно единственное значение (например, оптимальная доза препарата), но целый спектр сопутствующих научных рассуждений, расчетов и графиков ее обосновывающих, а в определённых случаях и численных экспериментов или полноценных виртуальных клинических исследований.  

Такой подход требует от специалистов не только понимания математики, но и фундаментальных знаний в области фармакологии и медицины, поэтому над подобными проектами работают кросс-функциональные команды, состоящие из математиков, биологов, врачей-клиницистов, которые оценивают валидность разрабатываемых моделей с различных точек зрения, например контролируют корректность воспроизведения патофизиологических путей на языке математики, проверяют целесообразность допущений, заложенных в структуру модели а также общую адекватность полученных прогнозов.  

Опять же, в противовес традиционному подходу – модели, оперирующие сложными эмпирическими функциями (например, на основе нейросетей), выдают прогноз, который нельзя объяснить или интерпретировать, а можно только ему поверить. Кроме того, такие методы требуют большого объема данных, однако, как мы видим, в доклинических и клинических исследованияx особенно на ранних фазах включается небольшое количество субъектов. На таком ограниченном объеме информации использование сложносочиненных эмпирических математических конструкций может приводить к неожиданным результатам: 

Рис. 3. Если не понимать природу изучаемых явлений и не анализировать полученные результаты с позиции здравого смысла, то прогнозы моделирования могут сильно удивить. Адаптированно  из источника.

Рис. 3. Если не понимать природу изучаемых явлений и не анализировать полученные результаты с позиции здравого смысла, то прогнозы моделирования могут сильно удивить. Адаптированно из источника.

В качестве компромиссного решения в текущий момент активно исследуются гибридные модели, сочетающие как физиологически-обоснованные дифференциальные уравнения, так и нейросетевые фрагменты, которые могут выступить в качестве универсальных аппроксиматоров в случаях, когда отдельные функциональные зависимости нам неизвестны. Однако, несмотря на появляющиеся по данной теме публикации, такие подходы пока являются скорее пилотными. В то же время создание ИИ агентов, направленных на разработку комплексных физиологических моделей с нуля является достаточно нетривиальной задачей, которая привлекает внимание разработчиков (нашего дружного коллектива в том числе ;)). 

При этом стоит сказать, что есть ряд процессов, которые уже могут быть оптимизированы при помощи алгоритмов ИИ. Так, отбор пациентов в клинические исследования является трудозатратным этапом, предполагающим изучение медицинских карт врачом. Данный процесс может занять продолжительное время, снижая скорость проведения клинического исследования и вывод препарата на рынок. Анализ электронных медицинских карт при помощи больших языковых моделей может значительно ускорить процесс за счет идентификации пациентов, подходящих для клинического исследования в соответствии с критериями включения (проекты Synapsis AIInclinico). Кроме того, такой подход может быть использован при подготовке регуляторных документов (платформа CAPTIS), их анализе (бот Kredo_AI_bot), а также рецензировании медицинских текстов (агентная платформа Peer AI). 

Рис. 4. Такое количество документов изучают сотрудники управления по санитарному надзору за качеством пищевых продуктов и медикаментов США при регистрации нового препарата. Немного помощи от ИИ тут очень кстати.  

Рис. 4. Такое количество документов изучают сотрудники управления по санитарному надзору за качеством пищевых продуктов и медикаментов США при регистрации нового препарата. Немного помощи от ИИ тут очень кстати.  

Клиническая практика

Если разработка лекарств – это довольно узкая область, то с практической медициной сталкиваются, пожалуй, все, и цена ошибки здесь возрастает многократно, потому что использование некорректного алгоритма может навредить значительно большему числу пациентов, чем в регулируемом клиническом испытании. 

В 2019 году на съезде европейского общества медицинской онкологии я услышала о программе IBM Watson oncology, и тогда идея проекта меня впечатлила: предполагалось, что алгоритм, обучившийся на медицинских документах одной из ведущих онкоклиник мира, MD Anderson cancer center, может быть использован врачами других медицинских учреждений для назначения терапии пациентам. Однако уже в 2022 году проект был закрыт в связи проблемами этического характера… Так, например, выяснилось, что не все рекомендации модели являются релевантными, ведь обучающая выборка была собрана только в одной клинике, а использовался продукт в различных медицинских центрах со своими особенностями заполнения медицинской документации. Несмотря на незрелость алгоритма, IBM Watson oncology продолжала активно рекламировать свой программный продукт, игнорируя важные аспекты безопасного использования ИИ, что спровоцировало негативное отношение со стороны научного сообщества и повлекло за собой ряд скандалов. Проблемы не обошли стороной и отечественную разработку для диагностики новообразований на основе снимков Botkin AI: в 2023 году Росздравнадзор приостановил применение данной медицинской системы из-за угрозы вреда здоровью пациентов на фоне дефектов функционирования и отсутствия клинического эффекта.

Эти примеры показывают не столько невозможность применения ИИ для диагностики заболеваний, сколько говорят в пользу осторожного отношения к его использованию. Так как диагностика заболеваний и назначение терапии относится к задачам высокого риска, то в соответствии с позицией ключевых регуляторов, таких как Минздрав РФ и FDA, разрабатываемые алгоритмы должны проходить не только технические, но и клинические исследования для оценки эффективности и безопасности, а производители должны уведомлять регуляторные органы обо всех программных сбоях и ошибках

Несмотря на то, что в России 48 медизделий с использованием алгоритмов ИИ уже получили одобрение, их применение скорее позиционируется как помощь в принятии врачебных решений и «второе мнение», а не как полноценная замена врача. Такие программные продукты обладают большим потенциалом в оптимизации диагностики заболеваний, так как позволяют сократить время анализа изображений и снизить риски врачебных ошибок. В качестве примеров можно привести Celsus, «Третье мнение» и AIDiagnostic. Кроме того, различные алгоритмы активно тестируются для прогноза прогрессии заболеваний на основе текущих анализов и функциональных тестов пациента, позволяющих врачам идентифицировать пациентов, которым может понадобиться экстренная помощь

Помимо вышеизложенных задач в клинической практике также присутствуют и рутинные и административные аспекты, автоматизация которых важна для системы здравоохранения. Так, широкое распространение получают различные чат-боты для сбора анамнеза и записи к специалистам и преобразования речи врачей в текст (например MedASR от Google Health AI).  

Заключение

В заключение хотелось бы резюмировать ключевые особенности использования ИИ в разработке лекарств и клинической практике. Во-первых, медицина и фармакология являются довольно консервативными областями ввиду высокой стоимости ошибки, поэтому разрабатываемые алгоритмы ИИ подвергаются тщательному анализу и валидации, и являются скорее помощниками, чем полноценной заменой специалистам (да простит меня Билл Гейтс). При этом в целом технология позволяет автоматизировать рутинные процессы вроде проверки документов и написания кода. Во-вторых, широкомасштабное применение ИИ ограничено количеством данных, а также сложностью их получения и интерпретации – ранние стадии клинических исследований включают небольшое количество пациентов, при этом проведение измерений зачастую является дорогостоящим и наукоемким. Кроме того, тонкости экспериментального дизайна могут значительно снизить обобщаемость алгоритмов и привести к ошибочным результатам. И, конечно, не стоит забывать, что существуют редкие заболевания и нетипичные клинические случаи, для которых релевантность прогнозов ИИ остается под вопросом.  

Однако, несмотря на эти ограничения,  алгоритмы ИИ стремительно эволюционируют и уже используются для автоматизации ряда задач, что может способствовать как снижению стоимости проведения клинических исследований, так и оптимизации существующих методов лечения, поэтому, конечно, я хоть и не уверена, что в обозримом будущем нам удастся найти панацею от всех болезней, но верю, что качество оказания и доступность медицинской помощи будет улучшаться.  

 

Автор: pharma_is_my_karma

Источник

Rambler's Top100