nlp. - страница 5

nlp.

«Нет, я не Байрон, я модель». Превращаем прозу в поэзию с нейросетью — мой кейс

Привет всем! Меня зовут Марина, я учусь на втором курсе магистратуры ВШЭ и МТС «

продолжить чтение

Собираем систему мониторинга ответов LLM на коленке

Наверняка вы сталкивались с ситуациями, когда модель начинает вести себя в проде не так, как задумывалось: например, ведётся на провокации пользователя или даёт некорректные ответы. Зачастую такие ошибки безобидны, но случаются и не очень приятные ситуации. А если речь идёт о чат-боте, который отвечает на вопросы в юридической или медицинской сфере — практически любая ошибка может быть критичной. Итак, мы плавно подошли к тому, что нужно каким-то образом валидировать ответы LLM. Давайте разберёмся, как это делать.  

продолжить чтение

SteosMorphy: опенсорс замена давно умершему PyMorphy2

ВведениеНа данный момент PyMorphy2 - самая популярная библиотека для обработки слов в русском языке. Благодаря ей (как раньше, так и сейчас) строились и продолжают строиться различные NLP решения. Однако последний коммит  в репозиторий этой библиотеки был сделан более 5 лет назад, а установка этой библиотеки на Python версии 3.11+ вызывает трудности, что делает использование данной библиотеки в нынешнее время максимально затруднительным.Мы в Mind Simulation решили начать свой путь в Open Source, и решили начать его именно с того, чтобы представить миру разработчиков NLP свой аналог PyMorphy под названием SteosMorphy.

продолжить чтение

Text2SQL в аналитике: как мы научили ИИ понимать бизнес-запросы без посредников

Привет! Меня зовут Михаил Куляскин, я инженер по машинному обучению в команде продуктивизации ИИ в X5 Tech. Недавно я выступал с докладом на крупной конференции CodeFest

продолжить чтение

Трансформация рабочих процессов с помощью нейросетей

Привет, Хабр!Ранее в блоге компании АСКОН я уже делился подборкой инструментов, которые использую в своей повседневной работе. Сегодня хочу продолжить эту тему и рассказать, как нейросети поменяли мой рабочий процесс, какие задачи они помогают решать, и почему вам не обязательно быть ML-инженером, чтобы эффективно использовать ИИ на практике. А кроме того расскажу, как с помощью нейросетей добавляют полезный функционал в инженерное программное обеспечение.

продолжить чтение

End-to-end вместо трёх костылей: как мы обошли OCR и выиграли по скорости и точности

Привет, чемпионы!

продолжить чтение

Часть 5. Обзор техник оценки качества систем RAG

Предисловие переводчикаПродолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (ссылка на первую часть — здесь, на вторую часть — здесь, третью часть — здесь, четвёртую часть — здесь). Перевод этой части мы выполняли в тандеме с коллегой — Мариной Хазиевой. К некоторым терминам, как и в прошлых частях, добавлены переводы и пояснения для удобства начинающих ИТ-переводчиков.

продолжить чтение

Как разработать корпоративного кодового ассистента на основе LLM: от идеи до прототипа

продолжить чтение

Что такое эмбеддинги и как с ними работать. Вводная для начинающих

Всем привет! Меня зовут Максимов Максим, я — NLP‑инженер в компании red_mad_robot. В этой статье я хотел бы рассказать о подходах в работе с векторными представлениями данных, а именно — эмбеддингами. Сегодня в меню: Что такое эмбеддинг? Освежим свои знания, и вспомним что это такое формально.Из чего можно получить эмбеддинги? Рассмотрим популярные форматы данных, которые мы можем представить в векторном виде. Также рассмотрим способы, которым мы можем преобразовать эти данные в эмбеддинг.

продолжить чтение

Секреты LLM по API: динамическая анонимизация данных для российского бизнеса

Привет, Хабр! Мы — Мария Старцева и Катерина Пославская из команды R&D в Just AI.

продолжить чтение

1...345678...14
Rambler's Top100