llm.
Практический кейс: как применять ML и GPT для поиска дубликатов в базе данных
Привет! Я Давид Акопян, занимаюсь интеграциями ML, GPT и консалтингом. Сейчас работаю тимлидом продуктовой аналитики в Авито. Ранее был опыт в:EY операционном консалтинге в сфере ретейла. Консультировал такие компании как Магнит, Детский Мир, Аскона, МВидео, НЛМК;E-groccery-стартапе;был тимлидом аналитики обычной и экспресс-доставки Яндекс.Маркета; а еще пробовал себя в различных проектах во фрилансе.
PPTAgent: Генерация и оценка презентаций, выходящая за рамки преобразования текста в слайды
АннотацияАвтоматическая генерация презентаций из документов представляет собой сложную задачу, требующую баланса между качеством контента, визуальным дизайном и структурной связностью. Существующие методы в основном сосредоточены на улучшении и оценке качества контента изолированно, часто упуская из виду визуальный дизайн и структурную связность, что ограничивает их практическую применимость. Для решения этих ограничений мы предлагаем PPTAgent, который комплексно улучшает генерацию презентаций за счет двухэтапного подхода, основанного на редактировании, вдохновленного рабочими процессами человека.
Повторяющиеся команды «напиши код лучше» могут ускорить код, сгенерированный AI, в 100 раз
Простая просьба «напиши код лучше» помогла Sonnet 3.5 создать код, работающий в 100 раз быстрее, чем его первая версия, при этом добавив неожиданные функции, обычно встречающиеся в корпоративном программном обеспечении.Старший научный сотрудник BuzzFeed Макс Вульф недавно провел эксперимент: что происходит, когда вы неоднократно просите Claude 3.5 «напиши код лучше»? Результаты оказались неожиданными — не только с точки зрения прироста производительности, но и в том, что LLM решил, что означает «лучший».
Как в РФ получить доступ к 5 бесплатным и 25 платным нейросетям LLM без VPN и с оплатой за рубли?
В последние годы большие языковые модели LLM стали неотъемлемой частью многих бизнес-процессов и приложений. Они позволяют автоматизировать взаимодействие с клиентами, генерировать контент и выполнять множество других задач. В этой статье мы рассмотрим, как российские пользователи могут получить доступ к различным языковым моделям (LLM) через сервис ProTalk, включая как бесплатные, так и платные варианты.Бесплатные LLM моделиProTalk предоставляет доступ к следующим бесплатным моделям:1. Microsoft 3.5 Phi mini FreeБазовая модель для простых задачНе требует API ключаПодходит для тестирования2.
Используем языковые модели в AI-агентах. Часть 1. Введение в LangChain
Привет, Хабр!В одной из прошлых статей я рассказывал про дообучение языковых моделей, сегодня же я хочу поговорить про практическое использование LLM и создание AI-агентов. Но прежде, чем приступать к этому, необходимо изучить основные компоненты.Что такое LangChain?LanhChain - фреймворк, предоставляющий обширный и удобный функционал по использованию LLM, он служит для разработки приложений на основе больших языковых моделей, создания агентов, взаимодействия с векторными хранилищами и т.д.УстановкаДля установки необходимо выполнить:pip install langchain1. Интерфейс RunnableИнтерфейс
Алгоритмы спекулятивного инференса LLM
ВведениеЗа последние годы качество LLM моделей сильно выросло, методы квантизации стали лучше, а видеокарты мощнее. Тем не менее качество генерации все еще напрямую зависит от размера весов и, как следствие, вычислительной сложности. Кроме того, генерация текста авторегрессионна - токен за токеном по одному, потому ее сложность зависит от размера контекста и количества генерируемых токенов.Но генерация текста не всегда имеет однородную сложность, так же как мы во многом мыслим идеями, а слова произносим “на автомате”. В статье обсудим алгоритмы, позволяющие использовать эту неоднородность для ускорения.
Почему OpenAI откладывает релиз ChatGPT-5? Все дело в недостатке данных
Новый проект OpenAI в области искусственного интеллекта, получивший кодовое название Orion, столкнулся с множеством проблем. Он отстает от графика и требует огромных затрат. Неясно, когда и будет ли он работать. Возможно, в мире недостаточно данных, чтобы сделать его достаточно умным.Дисклеймер: это вольный перевод
Опыт интеграции LLM и классического ML в пет-проект про поиск домашних животных
AI-решения сейчас повсеместно, но всё ещё есть места, где их нет. Например в вашем пет-проекте (возможно).В статье я поделюсь опытом, как легко интегрировать LLM и сразу получить от этого пользу, встраивая результаты от LLM в дальнейший пайплайн и закладывая фундамент под дальнейшее развитие.
Основы и продвинутые техники RAG
Привет, Хабр! В этом посте мы поговорим подробно про RAG на каждом его этапе, его текущее развитие на момент написания статьи и про другие модификации. В прошлой статье я писал про промптинг, советую глянуть 👀Интро

