Anthropic выпустила инструмент для проверки ИИ-кода. anthropic.. anthropic. claude code.. anthropic. claude code. code review.. anthropic. claude code. code review. pull request.. anthropic. claude code. code review. pull request. вайб-кодинг.. anthropic. claude code. code review. pull request. вайб-кодинг. запросы на изменения.. anthropic. claude code. code review. pull request. вайб-кодинг. запросы на изменения. Информационная безопасность.. anthropic. claude code. code review. pull request. вайб-кодинг. запросы на изменения. Информационная безопасность. искусственный интеллект.. anthropic. claude code. code review. pull request. вайб-кодинг. запросы на изменения. Информационная безопасность. искусственный интеллект. код-ревью.. anthropic. claude code. code review. pull request. вайб-кодинг. запросы на изменения. Информационная безопасность. искусственный интеллект. код-ревью. проверка кода.. anthropic. claude code. code review. pull request. вайб-кодинг. запросы на изменения. Информационная безопасность. искусственный интеллект. код-ревью. проверка кода. Программирование.. anthropic. claude code. code review. pull request. вайб-кодинг. запросы на изменения. Информационная безопасность. искусственный интеллект. код-ревью. проверка кода. Программирование. Управление разработкой.

Anthropic представила инструмент проверки кода на основе ИИ, предназначенный для выявления ошибок до того, как они попадут в кодовую базу программного обеспечения. Новый продукт под названием Code Review уже запустили в Claude Code.

Anthropic выпустила инструмент для проверки ИИ-кода - 1

В программировании обратная связь имеет решающее значение для раннего выявления ошибок, поддержания согласованности кодовой базы и повышения общего качества программного обеспечения. Распространение вайб-кодинга изменило подход разработчиков, а также привело к появлению новых ошибок, повысило риски безопасности и объём непонятного кода, отмечают в компании.

«Мы наблюдаем значительный рост популярности Claude Code, особенно в корпоративном секторе, и один из вопросов, который нам постоянно задают руководители предприятий: теперь, когда Claude Code создает множество запросов на слияние (pull requests), как мне убедиться, что они эффективно проверяются?» — отметила руководитель отдела продуктов Anthropic Кэт Ву.

Разработчики используют pull requests для отправки изменений кода на проверку перед тем, как они попадут в программное обеспечение. Ву сказала, что Claude Code значительно увеличил объём выпускаемого кода, а это привело к увеличению количества проверок PR, и это создавало узкое место в процессе выпуска кода.

Code Review сначала будет доступен для клиентов Claude for Teams и Claude for Enterprise в рамках предварительной исследовательской версии. «Этот продукт ориентирован в первую очередь на крупных корпоративных пользователей, таких как Uber, Salesforce, Accenture, которые уже используют Claude Code и теперь хотят получить помощь в обработке огромного количества запросов на слияние (pull requests), которые он генерирует», — сказала Ву.

Она добавила, что руководители разработчиков могут включить проверку кода по умолчанию для каждого инженера в команде. После включения она интегрируется с GitHub и автоматически анализирует запросы на слияние, оставляя комментарии непосредственно в коде, объясняя потенциальные проблемы и предлагая решения.

По словам Ву, основное внимание уделяется исправлению логических ошибок, а не стилистических.

«Это действительно важно, потому что многие разработчики уже сталкивались с автоматизированной обратной связью от ИИ, и их раздражает, когда она не сразу применима на практике. Мы решили сосредоточиться исключительно на логических ошибках. Таким образом, мы выявляем наиболее приоритетные проблемы, которые необходимо исправить», — пояснила менеджер.

ИИ пошагово объясняет свои рассуждения, описывая, в чём, по его мнению, заключается проблема, почему она может вызвать ошибки и как её можно исправить. Система будет помечать проблемы с помощью цветовых индикаторов: красный — наиболее серьёзные, жёлтый — потенциальные проблемы, требующие проверки, и фиолетовый — проблемы, связанные с уже существующим кодом или более ранними ошибками.

Ву сказала, что в процессе несколько агентов работают параллельно, причём каждый изучает кодовую базу с разных точек зрения или в разных аспектах. Финальный агент агрегирует и ранжирует результаты, удаляя дубликаты и определяя приоритетность наиболее важных проблем.

Инструмент обеспечивает поверхностный анализ безопасности, а руководители инженерных групп могут настраивать дополнительные проверки на основе внутренних передовых методов. Ву сказала, что недавно запущенный компанией Anthropic инструмент Claude Code Security обеспечивает более глубокий анализ безопасности.

Многоагентная архитектура означает, что это может быть ресурсоемкий продукт, сказала Ву. Как и в других сервисах ИИ, ценообразование основано на токенах, и стоимость варьируется в зависимости от сложности кода — хотя менеджер оценила стоимость каждой проверки в среднем в $15–25. Она добавила, что это премиальный и необходимый сервис, поскольку инструменты ИИ генерируют всё больше и больше кода.

«Проверка кода — это то, что пользуется невероятным спросом на рынке. По мере того, как инженеры разрабатывают приложения с помощью Claude Code, они видят, как снижается сложность создания новых функций, и как значительно возрастает спрос на проверку кода. Поэтому мы надеемся, что благодаря этому мы позволим предприятиям разрабатывать приложения быстрее, чем когда-либо прежде, и с гораздо меньшим количеством ошибок, чем когда-либо прежде», — заключила Ву. 

Между тем OpenAI объявила о запуске Codex Security — нового ИИ-агента для анализа безопасности программного кода. Он способен находить уязвимости в проектах, проверять их и предлагать исправления. Codex Security анализирует репозитории и формирует контекстную модель угроз для конкретного проекта. Затем система ищет потенциальные уязвимости, оценивает их реальное влияние на систему и, при необходимости, проверяет найденные проблемы в изолированной среде. Сейчас продукт доступен в исследовательском режиме для пользователей ChatGPT Enterprise, Business и Edu.

Автор: maybe_elf

Источник

Rambler's Top100