Блог компании OTUS. - страница 3

Архитектура AI-сервисов: почему монолит убивает latency и GPU

Всем привет, меня зовут Сергей Прощаев, и в этой статье я расскажу про реальную архитектуру ИИ-сервисов, которые выдерживают high-load и отвечают за десятки миллисекунд. Я Tech Lead и руководитель направления Java | Kotlin разработки в FinTech & E-commerce, а ещё преподаю на курсах разработки и архитектуры в OTUS. За моими плечами — несколько проектов, где мы встраивали генеративные модели в прод, и каждый раз одно и то же: на нагрузочном тестировании всё летает, а в проде — латенси скачет, GPU греются, бюджет тает. На недавнем открытом уроке курса «ИИ-архитектор»

продолжить чтение

RAG для тех, кто разочаровался: почему retrieval ломается и как это починить

Вы собрали RAG-пайплайн: загрузили документы, нарезали на чанки, сгенерировали эмбеддинги, подключили векторную базу. Задаёте вопрос — модель отвечает уверенно и подробно. Показываете заказчику, тот в восторге. Потом начинается тестирование на реальных вопросах, и оказывается, что на половину из них система отвечает мимо: то находит не тот документ, то находит правильный, но не тот кусок, то вообще ничего релевантного не достаёт и модель уверенно галлюцинирует.

продолжить чтение

Каким должен быть язык программирования, чтобы с ним хорошо работали AI-агенты

В прошлом году я впервые задумался о том, как может выглядеть будущее языков программирования теперь, когда агентная разработка становится все более заметным явлением. Сначала мне казалось, что огромный корпус уже существующего кода закрепит нынешние языки на своих местах, но теперь я начинаю думать, что верно обратное.

продолжить чтение

SciGraph: как я учил ИИ читать научные статьи не только по словам, но и по связям

Привет, Хабр. Эта статья про систему, которая читает папку научных статей и помогает разбираться в них как в связанном корпусе, а не как в наборе отдельных PDF. Материал написан на базе выпускного проекта студента курса NLP Advanced. Исходный код проекта: Идея простая: если в статье есть авторы, методы, датасеты, цитирования и утверждения, то их можно превратить в граф. Тогда вопрос «какие работы привели к появлению DETR?» становится не просто поиском похожих фраз, а проходом по связям между работами.

продолжить чтение

Безопасность GitHub Actions: модель угроз, атаки и меры защиты. Часть 1

В этой статье речь пойдет о том, как понять и защитить рабочие процессы в GitHub Actions: от модели угроз до механизмов контроля безопасности.В марте 2025 года был скомпрометирован популярный GitHub Action tj-actions/changed-files — по данным GitHub Advisory Database, инцидент затронул более 23 000 репозиториев. Атакующие изменили теги версий так, чтобы они указывали на вредоносный commit, который выводил CI/CD-секреты в логи GitHub Actions.В декабре 2024 года проект ultralytics пережил

продолжить чтение

Открытые уроки OTUS 18–28 мая: ИИ, Go, Kubernetes, ML, QA, архитектура и безопасность

Собрали открытые уроки OTUS на ближайшие две недели. В расписании — разработка, инфраструктура, машинное обучение, ИИ‑инструменты, аналитика, тестирование, информационная безопасность, продуктовый подход и управление командами.Уроки бесплатные и проходят в рамках онлайн‑курсов OTUS. Можно познакомиться с темой, посмотреть на формат обучения и задать вопросы преподавателям‑практикам.18 мая

продолжить чтение

Могут ли LLM находить flaky‑тесты по одному только коду теста? Разбор одного исследования

Недавно прочитала исследование про flaky тесты, и оно оказалось интереснее, чем я ожидала. Вопрос у авторов был довольно простой. Можно ли показать модели только код теста и попросить определить, flaky он или нет?

продолжить чтение

AI Governance по‑инженерному: что должен знать архитектор

Всем привет, меня зовут Сергей Прощаев. Я Tech Lead и руководитель направления Java / Kotlin разработки в FinTech, а ещё преподаю на курсах разработки и архитектуры в OTUS. В этой статье хочу поговорить про

продолжить чтение

Внедрение ИИ‑агента в бизнес‑процесс за один день: от развертывания до прототипа

Меня зовут Андрей Коптелов, я долгие годы работаю с бизнес‑процессами и корпоративной архитектурой, теперь волею судеб мне приходится погружаться в тему искусственного интеллекта. По мере возможностей пытаюсь делиться своим скромным опытом в этой теме.Представьте: вам поручили «внедрить искусственный интеллект (ИИ)», но без бюджета, и с требованием сохранить данные внутри периметра организации. Результат нужен вчера. Ваши подчиненные не умеют программировать, и используют большие языковые модели только в режиме чата.Результат

продолжить чтение

ИИ для продажников: что реально работает в 2026 году и на чём все теряют время

В каждой второй компании руководитель продаж слышал, что «надо внедрять ИИ». Кто‑то купил подписку на ChatGPT для отдела, кто‑то подключил «ИИ‑ассистента» в CRM, кто‑то попробовал генерировать письма через Jasper или Copy.ai. Через месяц половина менеджеров перестала этим пользоваться, потому что «оно пишет как робот», «тратит время на промпты вместо звонков» или «ответ вроде красивый, но клиенту такое не отправишь».Проблема в том, что его пытаются использовать для задач, где он не нужен, и не используют там, где он реально экономит часы. Подготовка к звонку: 20 минут → 3 минуты

продолжить чтение

123456...10...16