8 уровней агентной инженерии
Способности AI в написании кода растут быстрее, чем наше умение этими способностями пользоваться. Поэтому рост баллов на SWE-bench не коррелирует с метриками продуктивности, которые волнуют инженерных руководителей. Когда команда Anthropic выкатывает продукт вроде Cowork за 10 дней, а другая команда не может довести до ума сломанный POC на тех же моделях, разница в одном: первые закрыли разрыв между возможностями моделей и практикой, вторые — нет.
Почему AI-агенты сбоят и как сделать, чтобы они перестали
Привет, хочу поговорить об AI-агентах. Но не об их преимуществах: все и так уже знают, как они ускоряют разработку и освобождают команду от рутины. Здесь я хочу обсудить риски и новые варианты сбоев, которые появляются вместе с внедрением агентов. В реальности даже один AI-агент способен уронить проект быстрее, чем человеческая ошибка. Галлюцинации, удаление нужных данных, иллюзия компетентности — это лишь часть проблем. Когда агентов несколько и они зависят друг от друга, риск сбоев возрастает. Попробую разобраться, от чего зависят типичные проблемы, и расскажу, как я с ними справляюсь. Что будет в статье:
Исследователи представили самых маленьких в мире полностью программируемых автономных роботов
Исследователи из Университета Пенсильвании и Мичиганского университета создали самых маленьких в мире полностью программируемых автономных роботов. Они выглядят как микроскопические плавающие системы, способные самостоятельно воспринимать окружающую среду и реагировать на неё, а также работать в течение нескольких месяцев.
Рекуперация в небе. Концепт беспилотника, который заряжается от сопротивления воздуха
ВступлениеПредставляемая вашему вниманию публикация выходит в рамках авторского эксперимента, направленного на изучение потенциала человеческо-машинного сотрудничества. Основная гипотеза исследования заключалась в оценке возможности передачи сложных технических концепций аудитории, не владеющей соответствующим языком, исключительно посредством посредничества ИИ-ассистентов. Изначальный текст был переведен ИИ (в немного разных вариантах) на китайский и английский
Исследование TCS и AWS показало, что производители возлагают надежды на ИИ для роста рентабельности
Новое исследование Tata Consultancy Services
Microsoft провела провальное тестирование ИИ-агентов на фальшивой торговой площадке
Исследователи Microsoft представили новую среду моделирования, предназначенную для тестирования агентов на основе искусственного интеллекта. Они показали, что существующие модели агентов могут быть уязвимы для манипуляций.
SK hynix запустила поставки мобильной DRAM с улучшенным теплоотводом
Южнокорейская компания SK hynix Inc. объявила о начале поставок новых мобильных чипов памяти DRAM с повышенной эффективностью теплоотвода. Ключевым нововведением стало применение инновационного материала High-K Epoxy Molding Compound (EMC) с высокой теплопроводностью, который впервые используется в данной отрасли.
MuleSoft и новые стандарты для ИИ-агентов в корпоративных IT-системах
MuleSoft, дочерняя компания Salesforce, внедряет новые стандарты интерфейса агентов (MCP и A2A), призванные обеспечить внедрение автономных ИИ-агентов в корпоративные IT-системы.Salesforce рассматривает
ИИ-агенты — новый повод для беспокойства?
По мнению экспертов Infosecurity Europe, агентный ИИ и инструменты ИИ, которые подключаются друг к другу без человеческого контроля, представляют собой растущие риски безопасности.
Модели рассуждений в ИИ: от предварительного обучения к автономному мышлению
Якуб Пачоцки, возглавляющий разработку передовых моделей в OpenAI, говорит, что способность ИИ самостоятельно генерировать знания знаменует собой поворотный момент для бизнеса и исследований.

