BrainTools - Методики для развития мозга - страница 32

Сравниваем LLM: 11 тестов для Opus 4.8, GPT 5.5 и Gemini 3.1 Pro

Меньше месяца назад Anthropic выпустила модель Claude Opus 4.8. Как обычно, заявили много новых плюшек, вроде улучшенного кодинга и режима Fast Mode. Нам это показалось отличным поводом, чтобы устроить ее сравнение с двумя другими тяжеловесами рынка от Google и OpenAI.

продолжить чтение

В программе Петербургского цифрового хаба будет сессия об искусственном интеллекте в 1С

продолжить чтение

Как мы превратили 700 студентов‑гуманитариев в продуктовые команды и получили 51 MVP за 8 недель

Что произойдёт, если обучать гуманитариев как стартапы: результаты эксперимента на 700 студентах

продолжить чтение

Как посчитать, приносит ИИ пользу или нет?

До сих пор оценка эффективности нейросетей и ML-моделей в бизнесе часто напоминала гадание. Команды хвастались «высокой точностью модели», а финдиректора разводили руками, не понимая, где реальные деньги.

продолжить чтение

Чтение на выходные: «Мыслящие машины Дженсена Хуанга: История Nvidia и мировой ИИ-революции» Стивена Витта

продолжить чтение

Уважаемые ИИ-компании, дум-троллинг пора прекращать

Автор: Кэл Ньюпорт - профессор компьютерных наук Джорджтаунского университета и автор книги "В работу с головой" (Deep Work).Оригинальная статья на английском:https://www.nytimes.com/2026/06/17/opinion/ai-dangerous-openai-anthropic.html

продолжить чтение

Как мы собрали рок‑группу, не уходя из ИТ: опыт пяти лет

Лирическое вступление Остается час до окончания обычного рабочего дня в ИТ‑офисе. Работники организации смотрят в мониторы. Бегают задачи. Горят дедлайны. Кто‑то пишет код, кто‑то ищет баги. И в этой обычной, предсказуемой вселенной, есть пять человек, которые вдруг, получив сообщение в закрытом чате, — улыбаются. Они мысленно уже не здесь. Они уже на репетиции.Да, это мы, мы — рок‑группа.

продолжить чтение

AI Hardcore Set: MCP, агенты и безопасность GenAI — офлайн-встреча в Авито

11 июля в московском офисе Авито (Лесная, 7) пройдёт AI Hardcore Set — встреча для тех, кто уже работает с MCP и агентами в проде, а не только читает об этом.Четыре доклада без записи — про Spec-Driven Development, разработку и тестирование MCP для аналитических агентов, дизайн инструментов, которые модели понимают правильно, и практическую безопасность агентов по OWASP. После докладов — «Своя игра» и нетворкинг на террасе до 18:00.Основная программа: 12:00–15:30. Места ограничены, нужна регистрация. Не забудьте паспорт — он потребуется на входе.→

продолжить чтение

Snap выделяет команду разработчиков ИИ‑видео в отдельную компанию Dotmo из‑за высоких затрат

Snap выделит внутреннюю команду по разработке ИИ‑видео в отдельную компанию Dotmo. Причиной такого разделения стала высокая стоимость ведения подобных проектов внутри корпоративной структуры.Dotmo формально будет отдельной компанией, однако сохранит тесные связи с материнской структурой. Компания получит от Snap лицензию на использование технологий компании для создания интерактивных игровых и развлекательных продуктов. 

продолжить чтение

Когда чат-бот продаёт Chevrolet за доллар: как тестировать и мониторить LLM-приложения

Генеративные модели разблокировали огромное количество новых продуктов и новых фич в уже существующих. Поиграться с ними успел, кажется, каждый. И сценарий почти всегда повторяется: команда быстро собирает прототип на внешнем API, выкатывает его в продакшен, продукт начинает приносить ценность, а вместе с ценностью приходит и тревога. Работает ли всё так, как мы ожидали? В этот момент хочется уже не угадывать, а измерять.Эта статья про то, как измерять. Точнее, про то, как тестировать и мониторить адаптивные LLM-системы в продакшене и до него, чтобы убедиться: ассистент ведёт себя так, как задумано.Что именно мы оцениваем

продолжить чтение