veai.
GLM 5.1 vs. DeepSeek V3.2: сравниваем топовые китайские модели
В Veai мы регулярно тестируем и сравниваем модели, которые доступны у нас в плагине. Каждая модель, которую мы добавляем проходит через наш собственный бенчмарк, прежде чем попасть в продакшн. Недавно тестированию подверглись GLM 5.1 и DeepSeek V3.2. Делимся результатами.
Вышел Claude Opus 4.7. Модель уже доступна в Veai для JetBrains IDE
Anthropic выпустили Claude Opus 4.7. Новая модель сосредоточена на агентных и инженерных задачах. Cursor зафиксировал рост с 58% до 70% на своём бенчмарке, CodeRabbit — улучшение recall на 10% при стабильной точности, Rakuten — трёхкратный рост решённых production-задач.
Вайбдебаггинг — уже реальность? Мы дали ИИ-агенту отладчик и проверили
Привет, Хабр!В конце прошлого года Cursor выпустил Debug Mode — режим, в котором агент может собирать логи из рантайма, чтобы лучше понимать причины багов. Судя по
На стыке AI и науки: Летняя школа Veai для студентов
День студента — отличный повод поговорить не только о сессиях и вечеринках, но и о том, зачем вообще учиться.

