- BrainTools - https://www.braintools.ru -
Google Research и DeepMind выпустили MedGemma — коллекцию моделей искусственного интеллекта [1] с открытым исходным кодом, созданных специально для использования в медицине.

Семейство MedGemma включает в себя модель 4B, которая может работать с текстом, изображениями или с тем и другим одновременно, а также более крупную версию 27B, которая работает только с текстом и поддерживает мультимодальные форматы. Компания Google представила эту коллекцию на конференции I/O в этом году [2].
MedGemma предназначена для использования в различных областях медицины, включая радиологию, дерматологию, гистопатологию и офтальмологию. По словам представителей Google, эти модели могут служить основой для новых инструментов искусственного интеллекта в здравоохранении и работать как самостоятельно, так и в составе систем на основе агентов.
В техническом отчёте указано [3], что MedGemma обеспечивает значительные улучшения по сравнению с базовыми моделями аналогичного размера. При решении специализированных медицинских задач модели обеспечивают на 10% более высокую точность в мультимодальных вопросах и ответах, на 15,5–18,1% более высокие результаты при классификации рентгеновских снимков и на 10,8% более высокую точность при сложных оценках на основе агентов.
Об этом свидетельствуют результаты тестов. На платформе MedQA, где проверяются вопросы для медицинских экзаменов, модель 4B достигает точности в 64,4% по сравнению с 50,7% у базовой модели. Версия 27B набирает 87,7% по сравнению с 74,9%.
MedGemma также превосходит базовую модель по результатам медицинских тестов. При тестировании на наборе данных MIMIC-CXR, содержащем рентгеновские снимки и отчёты, версия 4B показала макропоказатель F1 88,9 по сравнению с 81,2 у оригинальной модели Gemma 3 4B. Показатель F1 отражает точность при различных заболеваниях.
Для обработки изображений Google представляет MedSigLIP — кодировщик медицинских изображений с 400 миллионами параметров. MedSigLIP основан на SigLIP («Sigmoid Loss for Language Image Pre-training [4]») — системе, предназначенной для связывания изображений с текстом. Медицинская версия расширяет эти возможности, позволяя MedGemma более эффективно интерпретировать медицинские изображения.
MedSigLIP обрабатывает медицинские изображения, а MedGemma 27B интерпретирует клинический текст, что делает их мощной мультимодальной системой для здравоохранения. Кодер работает с разрешением 448 x 448 пикселей, что более эффективно, чем вариант с более высоким разрешением 896 x 896, используемый в MedGemma.
Модель была обучена на более чем 33 миллионах пар «изображение — текст», включая 635 000 примеров из различных областей медицины и 32,6 миллиона фрагментов гистопатологических исследований. Чтобы сохранить способность SigLIP к распознаванию изображений в целом, мы сохранили исходный набор данных, а медицинские данные составили 2% от общего объёма, что позволило кодировщику обрабатывать как общий, так и медицинский контент.
Исследователи показали, как можно настроить MedGemma для решения конкретных медицинских задач. При автоматической генерации рентгеновских снимков показатель RadGraph F1 улучшился с 29,5 до 30,3, что свидетельствует о более точном отображении важной клинической информации. При выявлении пневмоторакса (спадения лёгкого) точность подскочила с 59,7 до 71,5. При гистопатологическом исследовании взвешенный показатель F1 для классификации тканей вырос с 32,8 до 94,5.
В области анализа электронных медицинских карт произошёл значительный прорыв: благодаря обучению [5] с подкреплением [6] количество ошибок при извлечении данных сократилось вдвое, что обещает повышение эффективности работы с данными пациентов.
MedGemma доступна на Hugging Face [7]. Лицензия позволяет проводить исследования, разработки и использовать ИИ в общих целях, но не для прямой медицинской диагностики или лечения без одобрения регулирующих органов. Коммерческое использование разрешено при условии соблюдения ограничений.
В прошлом году компания Google запустила медицинскую модель искусственного интеллекта, созданную на закрытой платформе Gemini [8]. Открытый исходный код MedGemma и возможность настройки могут способствовать более широкому внедрению.
Тем не менее высокие результаты тестирования не всегда применимы в клинической практике. Одно исследование показало [9], что реальная эффективность может снижаться из-за недопонимания или неправильного взаимодействия с пользователем, что подчёркивает разрыв между результатами тестирования и практическими результатами.
Делегируйте часть рутинных задач вместе с BotHub [10]! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [11] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Перевод, источник новости здесь [12].
Автор: mefdayy
Источник [13]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/17189
URLs in this post:
[1] интеллекта: http://www.braintools.ru/article/7605
[2] конференции I/O в этом году: https://developers.google.com/health-ai-developer-foundations/medgemma
[3] В техническом отчёте указано: https://arxiv.org/abs/2507.05201
[4] Sigmoid Loss for Language Image Pre-training: https://arxiv.org/abs/2303.15343
[5] обучению: http://www.braintools.ru/article/5125
[6] подкреплением: http://www.braintools.ru/article/5528
[7] Hugging Face: https://huggingface.co/collections/google/medgemma-666b8c65e4b5dad3c6c2e3b7
[8] медицинскую модель искусственного интеллекта, созданную на закрытой платформе Gemini: https://the-decoder.com/med-gemini-and-meditron-google-and-meta-present-new-llms-for-medicine/
[9] Одно исследование показало: https://the-decoder.com/ais-medical-skills-are-stuck-behind-a-human-bottleneck-according-to-new-oxford-research/
[10] BotHub: https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=GOOGLE_INTRODUCES_MEDGEMMA_A_SET_OF_OPEN-SOURCE_AI_MODELS_FOR_MEDICAL_APPLICATIONS
[11] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7
[12] здесь: https://the-decoder.com/google-unveils-medgemma-an-open-source-ai-model-suite-for-medical-applications/
[13] Источник: https://habr.com/ru/companies/bothub/news/926860/?utm_source=habrahabr&utm_medium=rss&utm_campaign=926860
Нажмите здесь для печати.