nlp.

Собираем систему мониторинга ответов LLM на коленке

Наверняка вы сталкивались с ситуациями, когда модель начинает вести себя в проде не так, как задумывалось: например, ведётся на провокации пользователя или даёт некорректные ответы. Зачастую такие ошибки безобидны, но случаются и не очень приятные ситуации. А если речь идёт о чат-боте, который отвечает на вопросы в юридической или медицинской сфере — практически любая ошибка может быть критичной. Итак, мы плавно подошли к тому, что нужно каким-то образом валидировать ответы LLM. Давайте разберёмся, как это делать.

продолжить чтение

Оставлено в

SteosMorphy: опенсорс замена давно умершему PyMorphy2

ВведениеНа данный момент PyMorphy2 - самая популярная библиотека для обработки слов в русском языке. Благодаря ей (как раньше, так и сейчас) строились и продолжают строиться различные NLP решения. Однако последний коммит в репозиторий этой библиотеки был сделан более 5 лет назад, а установка этой библиотеки на Python версии 3.11+ вызывает трудности, что делает использование данной библиотеки в нынешнее время максимально затруднительным.Мы в Mind Simulation решили начать свой путь в Open Source, и решили начать его именно с того, чтобы представить миру разработчиков NLP свой аналог PyMorphy под названием SteosMorphy.

продолжить чтение

Оставлено в

Text2SQL в аналитике: как мы научили ИИ понимать бизнес-запросы без посредников

Привет! Меня зовут Михаил Куляскин, я инженер по машинному обучению в команде продуктивизации ИИ в X5 Tech. Недавно я выступал с докладом на крупной конференции CodeFest

продолжить чтение

Оставлено в

Трансформация рабочих процессов с помощью нейросетей

Привет, Хабр!Ранее в блоге компании АСКОН я уже делился подборкой инструментов, которые использую в своей повседневной работе. Сегодня хочу продолжить эту тему и рассказать, как нейросети поменяли мой рабочий процесс, какие задачи они помогают решать, и почему вам не обязательно быть ML-инженером, чтобы эффективно использовать ИИ на практике. А кроме того расскажу, как с помощью нейросетей добавляют полезный функционал в инженерное программное обеспечение.

продолжить чтение

Оставлено в

End-to-end вместо трёх костылей: как мы обошли OCR и выиграли по скорости и точности

Привет, чемпионы!

продолжить чтение

Оставлено в

Часть 5. Обзор техник оценки качества систем RAG

Предисловие переводчикаПродолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (ссылка на первую часть — здесь, на вторую часть — здесь, третью часть — здесь, четвёртую часть — здесь). Перевод этой части мы выполняли в тандеме с коллегой — Мариной Хазиевой. К некоторым терминам, как и в прошлых частях, добавлены переводы и пояснения для удобства начинающих ИТ-переводчиков.

продолжить чтение

Оставлено в

Как разработать корпоративного кодового ассистента на основе LLM: от идеи до прототипа

продолжить чтение

Оставлено в

Что такое эмбеддинги и как с ними работать. Вводная для начинающих

Всем привет! Меня зовут Максимов Максим, я — NLP‑инженер в компании red_mad_robot. В этой статье я хотел бы рассказать о подходах в работе с векторными представлениями данных, а именно — эмбеддингами. Сегодня в меню: Что такое эмбеддинг? Освежим свои знания, и вспомним что это такое формально.Из чего можно получить эмбеддинги? Рассмотрим популярные форматы данных, которые мы можем представить в векторном виде. Также рассмотрим способы, которым мы можем преобразовать эти данные в эмбеддинг.

продолжить чтение

Оставлено в

Секреты LLM по API: динамическая анонимизация данных для российского бизнеса

Привет, Хабр! Мы — Мария Старцева и Катерина Пославская из команды R&D в Just AI.

продолжить чтение

Оставлено в

Обновленный курс Natural Language Processing

Сообщество Open Data Science и компания MWS AI в партнерстве с МФТИ и ИТМО вновь запускают бесплатный курс по обработке естественного языка. Стартуем 16 сентября – подробности и регистрация. Всем привет! 16 сентября я в очередной раз

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

nlp.

Собираем систему мониторинга ответов LLM на коленке

SteosMorphy: опенсорс замена давно умершему PyMorphy2

Text2SQL в аналитике: как мы научили ИИ понимать бизнес-запросы без посредников

Трансформация рабочих процессов с помощью нейросетей

End-to-end вместо трёх костылей: как мы обошли OCR и выиграли по скорости и точности

Часть 5. Обзор техник оценки качества систем RAG

Как разработать корпоративного кодового ассистента на основе LLM: от идеи до прототипа

Что такое эмбеддинги и как с ними работать. Вводная для начинающих

Секреты LLM по API: динамическая анонимизация данных для российского бизнеса

Обновленный курс Natural Language Processing

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

nlp.