Машинное обучение. - страница 9

Система авто-оценки качества вебинаров на Claude Code за неделю

TL;DRМетодисты вручную пересматривали вебинары - не масштабируется. Собрал конвейер: видео → локальная расшифровка (whisper.cpp на Apple M4) → LLM-судья по рубрике с цитатами → SQLite → письмо и дашборд. Боевое ядро заработало примерно за неделю.Главное в LLM-судье - не промпт, а методика: рубрика как данные (YAML, который правят методисты), калибровка под живых экспертов и честность про пределы текста.Claude Code тут - быстрый дисциплинированный джун: ускоряет «как написать» в разы, но надежность, идемпотентность и гардрейлы надо прямо навязывать.

продолжить чтение

LLM-судья для нейроразбора резюме на hh

Создать LLM-судью легко. Гораздо сложнее сделать так, чтобы его оценкам можно было доверять.Мы убедились в этом на практике при разработке нейроразбора резюме для ИИ-помощника hh.ru

продолжить чтение

RAG не только для вопросов и ответов: почему он естественно подходит для рекомендаций

Retrieval-Augmented Generation (RAG) чаще всего рассматривается в контексте вопросно-ответных систем и чат-ботов поверх базы знаний. Большинство публикаций и руководств по RAG посвящено схеме «вопрос – ответ с опорой на документы». Однако внутренняя механика RAG – семантический поиск в сочетании с генерацией ответа на основе найденного – хорошо ложится и на другую задачу, которую традиционно решают иными методами: на рекомендации.

продолжить чтение

Делаем фреймворк Meta-Spider на основе мета-внимания

Spider-GwenЭто прямое продолжение статьи "meta-attention is all you need". Рекомендую ее прочитать перед тем как продолжить, но это необязательно, экскурс в архитектуру мы проведем.

продолжить чтение

Когда модели стоит «думать», а когда нет: проверил на своём агенте

продолжить чтение

Я запускаю второй открытый бета-тест

В феврале я публиковал первую статью про Yttri: что это за приложение, зачем я его делаю и почему мне не хватало Obsidian, Notion, почтового клиента, таск-трекера и AI-чата по отдельности.

продолжить чтение

Защита конфиденциальных данных в облачных LLM

Как ни крути, LLM — основа ИИ-трансформации. Начать с облачных LLM — самый простой и недорогой шаг. Простота и доступность делают их идеальными для начального обучения и прототипирования. Проблема: сотрудники «сливают» в облака чувствительные данные, которые можно грубо разделить на персональные данные и коммерческую тайну.Про персональные данные и ответственность за их утечку расскажу в отдельной статье. Ниже соображения как можно проводить ИИ-трансформацию и обеспечить безопасность работы с конфиденциальными данными.

продолжить чтение

Архитектура обмана. Как технически устроены фермы накрутки отзывов в 2026 году?

продолжить чтение

Красота математики и ML (part 1-2): алгоритм MinHash

Вернулся к одному из своих исследований в области векторизации текста. Возможно, расскажу о нём позже, а пока, в поисках ответа на вопрос насколько моё исследование повторяет уже существующие разработки, изучил два интересных алгоритма.SimHash: про то, как векторизовать текст в плотный вектор из нулей и единиц.MinHash: про то, как транслировать разряжённый (sparse) бинарный вектор в компактный отпечаток, состоящий из целых чисел.Кроме того, что оба алгоритма работают с бинарными векторами, у них есть еще одна общая черта. Они оба гениальны в своей простоте и потому потрясающе красивы!

продолжить чтение

Retrieval в 2026: как RAG переехал с энкодеров на LLM (и что с этим делать в своём проекте)

продолжить чтение