Исследователи выпустили MedRAX — медицинского ИИ-агента для анализа рентгенограмм грудной клетки. MedRAX.. MedRAX. здоровье.. MedRAX. здоровье. ии-агенты.. MedRAX. здоровье. ии-агенты. искусственный интеллект.. MedRAX. здоровье. ии-агенты. искусственный интеллект. Машинное обучение.. MedRAX. здоровье. ии-агенты. искусственный интеллект. Машинное обучение. медицина.. MedRAX. здоровье. ии-агенты. искусственный интеллект. Машинное обучение. медицина. нейросети.. MedRAX. здоровье. ии-агенты. искусственный интеллект. Машинное обучение. медицина. нейросети. рентген.. MedRAX. здоровье. ии-агенты. искусственный интеллект. Машинное обучение. медицина. нейросети. рентген. рентгенограмма.

Исследователи из Канады представили нейросетевого агента MedRAX, который должен помочь врачам анализировать рентгенограммы грудной клетки. Преимущество агента в том, что его специально разрабатывали для медицины, поэтому учли возможность интеграции с уже имеющимися инструментами.

Исследователи выпустили MedRAX — медицинского ИИ-агента для анализа рентгенограмм грудной клетки - 1

Авторы проекта отмечают, что правильная трактовка рентгенограммы помогает врачам выбрать подходящий курс лечения и назначить лекарства. Имеющиеся нейросети хорошо справляются с расшифровкой снимков и обнаружением патологий, но они работают изолированно от изолированно. Это ограничивает их практическую пользу в клинической практике. Получается, что есть эффективные нейросети, но врачи не могут их встроить в список рабочих инструментов.

Архитектура MedRAX

Архитектура MedRAX

Для решения этой проблемы исследователи разработали MedRAX — платформу нейросетевых агентов для анализа рентгенограмм грудной клетки, которую можно интегрировать с уже имеющимися инструментами. MedRAX может разбивать сложные задачи на несколько этапов и рассуждать в процессе принятия решений. При этом пользователь может задавать вопросы по снимку, чтобы нейросеть обратила внимание на конкретные области. 

Пример работы MedRAX
Исследователи выпустили MedRAX — медицинского ИИ-агента для анализа рентгенограмм грудной клетки - 3

MedRAX компетентен в следующих видах вопросов:

  • Обнаружение результатов и формирование первичного вывода. Например, «Есть ли лёгочный узелок в правой верхней доле».

  • Классификация результатов по различным признакам. Например, «По внешнему виду образование доброкачественное или злокачественное».

  • Точное позиционирование результатов относительно строения лёгких. Например, «В каком сегменте бронхолёгочного сегмента находится образование».

  • Сравнение относительно размера и расположения. Например, «Как изменялся размер плеврального выпота по сравнению с предыдущим исследованием».

  • Понимание взаимосвязи результатов. Например, «Коррелирует ли лимфаденопатия средостения с образованием в лёгком».

  • Интерполяция результатов для постановки первичного диагноза. Например, «Какой диагноз может быть, учитывая рентгенограмму».

  • Описание обнаруженных патологий. Например, «Какие края узелка: гладкие, шиповидные или неправильной формы».

  • Объяснение медицинского обоснования результатов. Например, «Почему результаты исследования предполагают инфекционную, а не злокачественную этиологию».

Возможности нейросети MedRAX сравнили с LLaVA-Med (версия LLaVA-13B, дообученная для ответов на медицинские вопросы), CheXagent (нейросеть для интерпретации рентгенограмм), GPT-4o и Llama-3.2-90B Vision. Тесты проводили в популярном бенчмарке CheXbench и в ChestAgentBench — бенчмарке, который разработали сами исследователи. По результатам исследования видно, что MedRAX справляется лучше других нейросетей.

Результаты тестирования

Результаты тестирования

Например, GPT-4o часто ставит неправильный диагноз из-за того, что не учитывает контекст всего снимка. Нейросеть замечает один признак болезни и упускает другие детали. Архитектура поэтапного рассуждения помогает MedRAX давать более точные результаты.

Сравнение MedRAX с GPT-4o

Сравнение MedRAX с GPT-4o

Код проекта опубликовали на GitHub, а текст исследования доступен на портале Arxiv. Также разработчики поделились бенчмарком ChestAgentBench.

Автор: daniilshat

Источник

Rambler's Top100