Agent Laboratory: как платформа на базе AI помогает учёным проводить исследования

Университет Джонса Хопкинса совместно с компанией AMD создали Agent Laboratory – открытую платформу, которая объединяет креативность человека с рабочими процессами на базе AI.

В отличие от других AI-инструментов, ^[1] которые самостоятельно генерируют исследовательские идеи, Agent Laboratory помогает учёным проводить исследования более продуктивно.

«Мы надеемся, что Agent Laboratory позволит исследователям сосредоточиться на творческих идеях, а не на рутинном программировании и написании текстов, что, в конечном итоге, ускорит научные открытия», — отмечают разработчики.

Agent Laboratory обеспечивает полностью автоматизированный процесс исследования - от поиска литературы до составления отчёта. Несколько агентов AI работают вместе в виртуальной лаборатории, чтобы проводить и документировать научные исследования — Agent Laboratory обеспечивает полностью автоматизированный процесс исследования – от поиска литературы до составления отчёта. Несколько агентов AI работают вместе в виртуальной лаборатории, чтобы проводить и документировать научные исследования

Деятельность виртуальной лаборатории организована в соответствии с общепринятыми академическими принципами. В основе её работы лежит анализ научных публикаций, которые собираются и структурируются с помощью API arXiv. Затем аспиранты и докторанты создают команду для детального планирования исследования, основываясь на изученной литературе. В ходе обсуждений определяют, что необходимо для проверки идей. Далее агент, специализирующийся на машинном обучении ^[2], выполняет технические задачи, используя инструмент mle-solver для разработки и настройки кода.

Специализированные инструменты, такие как mle-solver и paper-solver, автоматизируют сложные исследовательские задачи - от поиска литературы до составления отчётов. — Специализированные инструменты, такие как mle-solver и paper-solver, автоматизируют сложные исследовательские задачи – от поиска литературы до составления отчётов.

Процесс включает три этапа: изучение литературы, проведение экспериментов и написание отчётов, с использованием AI-агентов и распределением ролей.

После завершения экспериментов аспиранты и профессора составляют отчёт. С помощью Paper-solver они создают и редактируют научный ^[3] отчёт, чтобы он стал доступным для понимания.

Исследователи опубликовали пример дипломной работы ^[4] и описали все конкретные подсказки, использовавшиеся в процессе исследования, в приложении к своей статье ^[5]

Рецензенты предпочитают o1-предварительный просмотр При оценке статей, созданных Agent Laboratory, рецензенты заметили, что разные модели AI дают различные результаты. Модель o1-preview ^[6] от OpenAI показала лучшие результаты в плане ясности и достоверности, а o1-mini получила высокие оценки за качество эксперимента.

Человеческие и AI-рецензенты оценивали работы по-разному, причём AI оценивает на 2,3 балла выше, чем люди, особенно в аспектах ясности и представления.

Автоматизированные рецензенты оценили сгенерированные статьи в среднем на 2,3 балла выше, чем рецензенты-люди.

Две таблицы показывают критерии оценки NeurIPS для сравнения автоматизированных и человеческих оценок качества научных работ.

Система также позволяет исследователям работать с AI в режиме соавтора. Такой подход часто даёт более высокие оценки, но иногда за счёт качества эксперимента.

Исследователи выяснили, что Agent Laboratory может создавать статьи недорого – всего за 2,33 доллара за статью с использованием GPT-4o. Среди протестированных моделей GPT-4o обеспечила лучший баланс между производительностью и стоимостью, в то время как o1-preview обеспечивала аналогичный успех, но занимала больше времени и была дороже.

GPT-4o обеспечивает наивысшую общую производительность при меньших затратах, в то время как o1-preview обеспечивает аналогичный уровень успеха при значительно более высоких затратах.

Три таблицы сравнивают затраты, время и процент успешных внедрений AI-моделей в Agent Laboratory на различных этапах.

Команда признаёт ряд ограничений: склонность AI переоценивать свои результаты, ограничения автоматизированных исследований и риск получения неверной информации.

Хотя прогресс в развитии мощных языковых моделей, кажется, замедлился ^[7], исследователи и компании переключают внимание ^[8] на создание ^[9]агентских фреймворков, объединяющих несколько языковых моделей и инструментов, отражающих структуру человеческих организаций, будь то проведение фокус-групп ^[10] или перевод длинных документов ^[11].

Источник ^[12]

Автор: mefdayy

Источник ^[13]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/11174

URLs in this post:

[1] В отличие от других AI-инструментов,: https://the-decoder.com/ai-generated-research-ideas-are-more-novel-but-there-is-a-catch/

[2] обучении: http://www.braintools.ru/article/5125

[3] научный: http://www.braintools.ru/article/7634

[4] опубликовали пример дипломной работы: https://agentlaboratory.github.io/resources/imgs/examplepaper.pdf

[5] приложении к своей статье: https://arxiv.org/pdf/2501.04227

[6] o1-preview: https://the-decoder.com/openais-new-o1-model-thinks-longer-to-give-smarter-answers/

[7] замедлился: https://the-decoder.com/openai-co-founder-predicts-a-new-ai-age-of-discovery-as-llm-scaling-hits-a-wall/

[8] внимание: http://www.braintools.ru/article/7595

[9] создание : https://the-decoder.com/ai-agents-in-2025-will-be-all-about-managing-inflated-expectations/

[10] проведение фокус-групп: https://the-decoder.de/1-000-ki-agenten-simulieren-menschliches-verhalten-in-experimenten-erstaunlich-genau/

[11] перевод длинных документов: https://the-decoder.com/transagents-uses-ai-teamwork-to-tackle-the-complexities-of-literary-translation/

[12] Источник: https://the-decoder.com/ai-agents-team-up-in-agent-laboratory-to-speed-scientific-research/

[13] Источник: https://habr.com/ru/companies/bothub/news/873020/?utm_source=habrahabr&utm_medium=rss&utm_campaign=873020

Нажмите здесь для печати.