Машинное обучение.

Аудио-токенизатор KVAE-Audio от Сбера

Привет, Хабр. Мы уже показывали токенизаторы для изображений и видео, рассказывали про обновление видеомоделей KVAE-2.0, а теперь закрываем третью модальность — публикуем KVAE-Audio

продолжить чтение

Почему я перестал слать каждый вопрос в LLM: архитектура предсказуемого конвейера

О проекте. Я разрабатываю систему ИИ-поддержки первой линии — «Финлоджик. Контур Поддержки» (FinlogiQ AI Support). Бот принимает обращения через веб-чат и Telegram, понимает суть вопроса, ищет ответ в базе знаний и передаёт сложные случаи живому оператору. Делаю один: начиналось как заказная разработка под клиента, затем выросло в самостоятельный продукт. Это первая статья из цикла о внутреннем устройстве системы.Пара терминов: LLM (large language model) — большая языковая модель, нейросеть вроде YandexGPT или DeepSeek; RAG

продолжить чтение

Как мы строим корпоративную экзаменационную платформу с AI: архитектура, дубли, мульти-tenant и продовые шишки

Привет, Хабр.Хочу рассказать про наш проект Exam AI

продолжить чтение

Поговорим о градиентном бустинге

Привет, Хабр! Меня зовут Андрей Бирюков. Я — независимый эксперт в области ИТ и ИБ, преподаю в учебных центрах и пишу статьи и книги. В современном машинном обучении градиентный бустинг занимает уникальное положение. На табличных данных он часто превосходит более сложные архитектуры, оставаясь при этом алгоритмом, чья внутренняя логика поддается математически строгой интерпретации. Его принцип — последовательное исправление ошибок, то есть превращение ансамбля слабых моделей в мощный предсказательный инструмент.Бустинг как последовательная компенсация ошибок

продолжить чтение

Когда ИИ не знает – но делает вид, что знает: ударим энтропией по LLM

Представьте: вы спрашиваете умного коллегу о дедлайне проекта, а он отвечает уверенно и детально – но на самом деле придумывает всё на ходу. Именно это постоянно делают большие языковые модели. Они не «знают», что не знают. И это не баг конкретной реализации – это фундаментальное свойство архитектуры.

продолжить чтение

Минюст до конца 2026 года планирует запустить чат‑бот для бесплатной юрпомощи

Минюст России планирует в 2026 году запустить чат‑бота, который без участия человека будет оказывать гражданам бесплатную юридическую помощь. Об этом сообщил ТАСС заместитель министра юстиции РФ Максим Бесхмельницын. По его словам, это станет следующим шагом в развитии федеральной государственной информационной системе «Правовая помощь», которую запустили в сентябре 2025 года.

продолжить чтение

Как принудительно привязать ИИ к фактам и убить галлюцинации

Привет, Хабр! Меня зовут Андрей Бирюков. Я — независимый эксперт в области ИТ и ИБ, преподаю в учебных центрах и пишу статьи и книги.Если вы ловите себя на мысли: «Мне нравится ответ ИИ, но я всё равно должен перепроверить каждый абзац» — значит, вы используете его как генератор красивых слов, а не как инструмент. Галлюцинации возникают не потому, что ИИ глупый. Они возникают потому, что архитектура генерации текста (авторегрессия) подталкивает модель выбирать статистически вероятное следующее слово, а не фактически верное.

продолжить чтение

Как мы построили сервис компьютерного зрения на базе внешних VLM для контроля выкладки и ценников: опыт Fix Price

Привет, Хабр! Меня зовут Кристина Истратова и я руковожу центром аналитики данных в Fix Price. В нашей Сети более 8 000 магазинов, а в каждом из них — множество   товаров. Думаю, все из нас знают, как покупатели реагируют на отсутствие ценника или неверную цену на нем, какие чувства вызывает пустая полка, где нет товара, за которым приходишь в магазин.

продолжить чтение

Как одна операция из линейной алгебры захватила мир ИИ

Всё началось довольно тихо — без шоу-программ и футуристичных роботов на сцене. В 2017-м исследователи Google опубликовали статью с до смешного скромным названием: Attention is All You Need. Тогда мало кто понял, что именно в этот момент случилось новое «деление эпох»: теперь у ИИ было чёткое «до» и «после».Сегодня почти весь генеративный ИИ — от ChatGPT до Midjourney, от Gemini до Claude — внутри себя основан на трансформерах. А фундамент всей этой революции оказался… ну прямо скажем, совсем не похожим на научную фантастику. Просто скалярное произведение двух векторов — действие из школьной линейной алгебры

продолжить чтение

Первый промт-инженер компьютерных душ: как Алан Тьюринг предлагал воспитывать ИИ

продолжить чтение