- BrainTools - https://www.braintools.ru -
Университет Джонса Хопкинса совместно с компанией AMD создали Agent Laboratory – открытую платформу, которая объединяет креативность человека с рабочими процессами на базе AI.

В отличие от других AI-инструментов, [1] которые самостоятельно генерируют исследовательские идеи, Agent Laboratory помогает учёным проводить исследования более продуктивно.
«Мы надеемся, что Agent Laboratory позволит исследователям сосредоточиться на творческих идеях, а не на рутинном программировании и написании текстов, что, в конечном итоге, ускорит научные открытия», — отмечают разработчики.
Деятельность виртуальной лаборатории организована в соответствии с общепринятыми академическими принципами. В основе её работы лежит анализ научных публикаций, которые собираются и структурируются с помощью API arXiv. Затем аспиранты и докторанты создают команду для детального планирования исследования, основываясь на изученной литературе. В ходе обсуждений определяют, что необходимо для проверки идей. Далее агент, специализирующийся на машинном обучении [2], выполняет технические задачи, используя инструмент mle-solver для разработки и настройки кода.
Процесс включает три этапа: изучение литературы, проведение экспериментов и написание отчётов, с использованием AI-агентов и распределением ролей.
После завершения экспериментов аспиранты и профессора составляют отчёт. С помощью Paper-solver они создают и редактируют научный [3] отчёт, чтобы он стал доступным для понимания.
Исследователи опубликовали пример дипломной работы [4] и описали все конкретные подсказки, использовавшиеся в процессе исследования, в приложении к своей статье [5]
Рецензенты предпочитают o1-предварительный просмотр При оценке статей, созданных Agent Laboratory, рецензенты заметили, что разные модели AI дают различные результаты. Модель o1-preview [6] от OpenAI показала лучшие результаты в плане ясности и достоверности, а o1-mini получила высокие оценки за качество эксперимента.
Человеческие и AI-рецензенты оценивали работы по-разному, причём AI оценивает на 2,3 балла выше, чем люди, особенно в аспектах ясности и представления.
Две таблицы показывают критерии оценки NeurIPS для сравнения автоматизированных и человеческих оценок качества научных работ.
Система также позволяет исследователям работать с AI в режиме соавтора. Такой подход часто даёт более высокие оценки, но иногда за счёт качества эксперимента.
Исследователи выяснили, что Agent Laboratory может создавать статьи недорого – всего за 2,33 доллара за статью с использованием GPT-4o. Среди протестированных моделей GPT-4o обеспечила лучший баланс между производительностью и стоимостью, в то время как o1-preview обеспечивала аналогичный успех, но занимала больше времени и была дороже.
Три таблицы сравнивают затраты, время и процент успешных внедрений AI-моделей в Agent Laboratory на различных этапах.
Команда признаёт ряд ограничений: склонность AI переоценивать свои результаты, ограничения автоматизированных исследований и риск получения неверной информации.
Хотя прогресс в развитии мощных языковых моделей, кажется, замедлился [7], исследователи и компании переключают внимание [8] на создание [9]агентских фреймворков, объединяющих несколько языковых моделей и инструментов, отражающих структуру человеческих организаций, будь то проведение фокус-групп [10] или перевод длинных документов [11].
Источник [12]
Автор: mefdayy
Источник [13]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/11174
URLs in this post:
[1] В отличие от других AI-инструментов,: https://the-decoder.com/ai-generated-research-ideas-are-more-novel-but-there-is-a-catch/
[2] обучении: http://www.braintools.ru/article/5125
[3] научный: http://www.braintools.ru/article/7634
[4] опубликовали пример дипломной работы: https://agentlaboratory.github.io/resources/imgs/examplepaper.pdf
[5] приложении к своей статье: https://arxiv.org/pdf/2501.04227
[6] o1-preview: https://the-decoder.com/openais-new-o1-model-thinks-longer-to-give-smarter-answers/
[7] замедлился: https://the-decoder.com/openai-co-founder-predicts-a-new-ai-age-of-discovery-as-llm-scaling-hits-a-wall/
[8] внимание: http://www.braintools.ru/article/7595
[9] создание : https://the-decoder.com/ai-agents-in-2025-will-be-all-about-managing-inflated-expectations/
[10] проведение фокус-групп: https://the-decoder.de/1-000-ki-agenten-simulieren-menschliches-verhalten-in-experimenten-erstaunlich-genau/
[11] перевод длинных документов: https://the-decoder.com/transagents-uses-ai-teamwork-to-tackle-the-complexities-of-literary-translation/
[12] Источник: https://the-decoder.com/ai-agents-team-up-in-agent-laboratory-to-speed-scientific-research/
[13] Источник: https://habr.com/ru/companies/bothub/news/873020/?utm_source=habrahabr&utm_medium=rss&utm_campaign=873020
Нажмите здесь для печати.