llm.
Ставка ИИ на $305 миллионов: модели логического вывода увеличивают спрос на графические процессоры
Когда DeepSeek-R1 только вышел на рынок, в отрасли преобладал страх, что сложные вычисления можно будет производить с использованием менее сложной инфраструктуры.
Инновационный подход NYU Langone Health к медицинскому образованию с использованием искусственного интеллекта
Записи данных о пациентах могут быть запутанными, а иногда и неполными, а это значит, что у врачей не всегда есть под рукой вся необходимая информация. К этому следует добавить тот факт, что медицинские работники не могут уследить за потоком тематических исследований, научных работ, испытаний и других передовых разработок, появляющихся в отрасли.
Разобучаем языковые модели: как заставить ИИ забыть только определенные знания
Привет, Хабр! Сегодня я расскажу о новом подходе в области «разобучения» (unlearning) больших языковых моделей – методе ReLearn
Большой обзор больших языковых моделей
Большая языковая модель — что это такое?LLM (Large Language Model, большая языковая модель) — это тип модели машинного обучения (или тип модели глубокого обучения), основанный на больших объёмах данных, который может выполнять любые задачи по обработке естественного языка (Natural Language Processing, NLP).Более простыми словами это нейронная сеть с крайне большим количеством изменяемых параметров, которая позволяет решать задачи по обработке и генерации текста. Чаще всего реализована в виде диалогового агента, с которым можно общаться в разговорной форме.NLP
Проверка на сгенерированный контент — опасность для академической сферы
В чем проблема?Я думаю, что всем уже очевидно, что развитие технологий в области генерации текста существенно повлияло на образовательный процесс. Не секрет, что большинство студентов активно используют LLM для создания письменных работ. По итогам опроса в мае 2024 года более половины студентов признались в использовании ИИ при подготовке дипломных работ. По моим личным ощущениям как практикующего преподавателя, процент может быть существенно выше, ближе к 100.
Нет, ваша генеративная модель меня не заменит
ВведениеЗа последние три недели я устранил пару проблем с производительностью, что потенциально сэкономило компании несколько сотен тысяч долларов (я подрядчик, поэтому, к сожалению, не получаю никаких премий).
Как мы прикрутили RAG для интент-классификации, или Трудности перевода на LLM-ский
И не опять, а снова — про этот ваш RAG. Многие продуктовые команды сейчас пробуют приспособить его для своих задач — и мы, команда Speech&Text в компании Домклик, не избежали этой участи. Но не (только) потому, что это модно и молодёжно — попробовать RAG‑подход нас побудила необходимость решить определённые насущные проблемы. Что же это за проблемы, как мы встраивали RAG и что из этого получилось? Если интересно узнать, то милости просим в текст :)
Почему AI-модели не могут конкурировать с фрилансерами-разработчиками: анализ OpenAI
Модели больших языков (LLMs) уже изменили разработку программного обеспечения, однако компаниям стоит дважды подумать, прежде чем полностью заменять человеческих разработчиков программного обеспечения на LLM, несмотря на утверждение генерального директора OpenAI Сэма Альтмана о том, что модели могут заменить «низкоуровневых» инженеров.
Интеграция AI с поисковыми системами: почему Deep Research — это прорыв
Корпоративным компаниям стоит обратить внимание на Deep Research от OpenAI. Это мощный продукт, основанный на новых возможностях, и настолько хорош, что может оставить многих людей без работы. Deep Research
Устройство Re-Act ИИ агента
Что такое Re-Act? Re-Act (Reason + Act) – это парадигма, предлагающая объединить рассуждение и выполнение действий в работе языковой модели (ReAct: Synergizing Reasoning and Acting in Language Models).В отличие от других подходов построения агентов, где модель либо только рассуждает, либо выполняет только действия, либо сразу выдаёт ответ, Re-Act заставляет модель чередовать логические рассуждения с вызовами пользовательских функций (или инструментов - Tools)

