Сравниваем LLM: 11 тестов для Opus 4.8, GPT 5.5 и Gemini 3.1 Pro
Меньше месяца назад Anthropic выпустила модель Claude Opus 4.8. Как обычно, заявили много новых плюшек, вроде улучшенного кодинга и режима Fast Mode. Нам это показалось отличным поводом, чтобы устроить ее сравнение с двумя другими тяжеловесами рынка от Google и OpenAI.
Как мы превратили 700 студентов‑гуманитариев в продуктовые команды и получили 51 MVP за 8 недель
Что произойдёт, если обучать гуманитариев как стартапы: результаты эксперимента на 700 студентах
Как посчитать, приносит ИИ пользу или нет?
До сих пор оценка эффективности нейросетей и ML-моделей в бизнесе часто напоминала гадание. Команды хвастались «высокой точностью модели», а финдиректора разводили руками, не понимая, где реальные деньги.
Уважаемые ИИ-компании, дум-троллинг пора прекращать
Автор: Кэл Ньюпорт - профессор компьютерных наук Джорджтаунского университета и автор книги "В работу с головой" (Deep Work).Оригинальная статья на английском:https://www.nytimes.com/2026/06/17/opinion/ai-dangerous-openai-anthropic.html
Как мы собрали рок‑группу, не уходя из ИТ: опыт пяти лет
Лирическое вступление Остается час до окончания обычного рабочего дня в ИТ‑офисе. Работники организации смотрят в мониторы. Бегают задачи. Горят дедлайны. Кто‑то пишет код, кто‑то ищет баги. И в этой обычной, предсказуемой вселенной, есть пять человек, которые вдруг, получив сообщение в закрытом чате, — улыбаются. Они мысленно уже не здесь. Они уже на репетиции.Да, это мы, мы — рок‑группа.
AI Hardcore Set: MCP, агенты и безопасность GenAI — офлайн-встреча в Авито
11 июля в московском офисе Авито (Лесная, 7) пройдёт AI Hardcore Set — встреча для тех, кто уже работает с MCP и агентами в проде, а не только читает об этом.Четыре доклада без записи — про Spec-Driven Development, разработку и тестирование MCP для аналитических агентов, дизайн инструментов, которые модели понимают правильно, и практическую безопасность агентов по OWASP. После докладов — «Своя игра» и нетворкинг на террасе до 18:00.Основная программа: 12:00–15:30. Места ограничены, нужна регистрация. Не забудьте паспорт — он потребуется на входе.→
Snap выделяет команду разработчиков ИИ‑видео в отдельную компанию Dotmo из‑за высоких затрат
Snap выделит внутреннюю команду по разработке ИИ‑видео в отдельную компанию Dotmo. Причиной такого разделения стала высокая стоимость ведения подобных проектов внутри корпоративной структуры.Dotmo формально будет отдельной компанией, однако сохранит тесные связи с материнской структурой. Компания получит от Snap лицензию на использование технологий компании для создания интерактивных игровых и развлекательных продуктов.
Когда чат-бот продаёт Chevrolet за доллар: как тестировать и мониторить LLM-приложения
Генеративные модели разблокировали огромное количество новых продуктов и новых фич в уже существующих. Поиграться с ними успел, кажется, каждый. И сценарий почти всегда повторяется: команда быстро собирает прототип на внешнем API, выкатывает его в продакшен, продукт начинает приносить ценность, а вместе с ценностью приходит и тревога. Работает ли всё так, как мы ожидали? В этот момент хочется уже не угадывать, а измерять.Эта статья про то, как измерять. Точнее, про то, как тестировать и мониторить адаптивные LLM-системы в продакшене и до него, чтобы убедиться: ассистент ведёт себя так, как задумано.Что именно мы оцениваем
