veai.

GLM 5.1 vs. DeepSeek V3.2: сравниваем топовые китайские модели

В Veai мы регулярно тестируем и сравниваем модели, которые доступны у нас в плагине. Каждая модель, которую мы добавляем проходит через наш собственный бенчмарк, прежде чем попасть в продакшн. Недавно тестированию подверглись GLM 5.1 и DeepSeek V3.2. Делимся результатами.

продолжить чтение

Вышел Claude Opus 4.7. Модель уже доступна в Veai для JetBrains IDE

Anthropic выпустили Claude Opus 4.7. Новая модель сосредоточена на агентных и инженерных задачах. Cursor зафиксировал рост с 58% до 70% на своём бенчмарке, CodeRabbit — улучшение recall на 10% при стабильной точности, Rakuten — трёхкратный рост решённых production-задач.

продолжить чтение

Вайбдебаггинг — уже реальность? Мы дали ИИ-агенту отладчик и проверили

Привет, Хабр!В конце прошлого года Cursor выпустил Debug Mode — режим, в котором агент может собирать логи из рантайма, чтобы лучше понимать причины багов. Судя по

продолжить чтение

На стыке AI и науки: Летняя школа Veai для студентов

День студента — отличный повод поговорить не только о сессиях и вечеринках, но и о том, зачем вообще учиться.

продолжить чтение