llm-приложения. - страница 2

Как я автоматизировал поиск работы на LinkedIn при помощи LLM

Эта статья по сути является продолжением моей прошлогодней статьи, в которой я автоматизировал отклики на hh.ru. Кстати, если кому это интересн, тот проект до сих пор живой, недавно проверял :)

продолжить чтение

Как создать AI-агента и дать ему инструменты

AI‑агенты сейчас на пике хайпа, поэтому давайте разберёмся, что это за новый зверь и как его готовить.Тема применения сервисов GenAI сейчас на хайпе, на конференциях по этой теме всегда аншлаг, а подавляющее большинство пользователей «играется» с текстовыми запросами в бесплатных сервисах, восторгаясь полученными результатами.В этой статье хочу пойти дальше и определиться с понятием AI‑агентов и показать пример создания AI‑агента с помощью системы n8n.io и популярных сервисов GenAI.Понятие AI-агента

продолжить чтение

Рецепт vLLM с мистралем. Часть 1

На первом этапе нашей заготовки модели мы займемся ее 4-х битным квантованием, а во второй части будем использовать vLLM для запуска парралельных запросов к ней.Поехали!

продолжить чтение

Переводим fb2 книжки, с нейронками, для себя

Получилось так что я купил книжку на английском, в Австралии (автор оттуда и там она дешевле в 3 раза чем у Гугла), но прочитать не смог, очень богатый мир , много странных слов, начал терять контекст истории, читал по 2 страницы в день. Затем на ТГ канале Акимова попалась ссылка на прототип агента по переводу текста , со сслыками в итоге на научные работы и т.д., обрадовавшись полез на гитхаб искать форки и конечно готовую софтину , но почему то она не случилась. спустя два года появились платные сервисы, но не опенсорсная поделка, и я решил собрать хотя бы MVP чтобы проверить идею самостоятельно, потом написать

продолжить чтение

Эволюция чат-ботов на базе LLM: от GPT-2 до многоагентных систем

Примерно полгода назад, когда я присоединился к команде AI, я начал более близкое знакомство с системами, построенными на базе LLM. Наши прототипы различных решений на LLM заставили меня задуматься о том, как они развиваются. И я понял, что развитие этих систем в целом повторяет эволюцию чат-ботов. Здесь я хочу простым языком рассказать, как развивались чат-боты, их возможности и как они работают сейчас.1. Первые LLM: генерация текста на основе вероятностей (2018–2019)

продолжить чтение

Как и зачем мы в YADRO сделали свою MLOps-платформу

В нашей компании есть много проектов, связанных с AI. Всем им нужны ресурсы для работы с моделями на GPU. «Хотим, чтобы только у нас был доступ к оборудованию», — это лишь одно из требований инженеров из AI-дивизиона, а еще нужно оптимизировать использование GPU-ресурсов, вести их учет и быстро готовить оборудование к передаче другой команде.Привет, Хабр! Меня зовут Вадим Извеков, я руководитель группы сопровождения платформы машинного обучения в YADRO

продолжить чтение

Теперь ChatGPT-5 будет придумывать запросы за вас

Похоже, OpenAI решила, что пользователи всё равно думают слишком много — и выкатили инструмент, который будет думать за вас. Речь о генераторе промптов, который сам составит запрос для ChatGPT так, чтобы модель не впала в галлюцинации и не ответила ерунду.

продолжить чтение

Локальный чатбот без ограничений: гайд по LM Studio и открытым LLM

продолжить чтение

Автоматическая поддержка пользователей на парах Вопрос-Ответ

Автоматическая поддержка пользователей становится все более и более популярной.В данной статье речь пойдет не столько о преимуществах автоматической поддержки, сколько о том, как ее организовать.Довольно часто распространена ситуация, когда на сайте есть раздел FAQ со списком вопросов. Но сейчас пользователю уже не хочется искать свой вопрос по разделу, тем более если это раздел с меню в несколько уровней, пользователь хочет просто задать вопрос - голосом или текстом. На этот случай и рассматриваем автоматическую поддержку пользователей.

продолжить чтение

Разбираемся с суффиксами квантования LLM: что на самом деле значат Q4_K_M, Q6_K и Q8_0

Привет!

продолжить чтение

Rambler's Top100