llm. - страница 122

llm.

Как масштабирование во время тестирования раскрывает скрытые способности к рассуждению в небольших языковых моделях

Согласно новому исследованию Шанхайской лаборатории искусственного интеллекта, очень маленькие языковые модели (SLM) могут превзойти ведущие большие языковые модели (LLM) в задачах рассуждения. Авторы показывают, что при наличии правильных инструментов и методов масштабирования во время тестирования SLM с 1 миллиардом параметров может превзойти LLM 405B в сложных математических тестах.

продолжить чтение

Ставка ИИ на $305 миллионов: модели логического вывода увеличивают спрос на графические процессоры

Когда DeepSeek-R1 только вышел на рынок, в отрасли преобладал страх, что сложные вычисления можно будет производить с использованием менее сложной инфраструктуры.

продолжить чтение

Инновационный подход NYU Langone Health к медицинскому образованию с использованием искусственного интеллекта

Записи данных о пациентах могут быть запутанными, а иногда и неполными, а это значит, что у врачей не всегда есть под рукой вся необходимая информация. К этому следует добавить тот факт, что медицинские работники не могут уследить за потоком тематических исследований, научных работ, испытаний и других передовых разработок, появляющихся в отрасли.

продолжить чтение

Разобучаем языковые модели: как заставить ИИ забыть только определенные знания

Привет, Хабр! Сегодня я расскажу о новом подходе в области «разобучения» (unlearning) больших языковых моделей – методе ReLearn

продолжить чтение

Большой обзор больших языковых моделей

Большая языковая модель — что это такое?LLM (Large Language Model, большая языковая модель) — это тип модели машинного обучения (или тип модели глубокого обучения), основанный на больших объёмах данных, который может выполнять любые задачи по обработке естественного языка (Natural Language Processing, NLP).Более простыми словами это нейронная сеть с крайне большим количеством изменяемых параметров, которая позволяет решать задачи по обработке и генерации текста. Чаще всего реализована в виде диалогового агента, с которым можно общаться в разговорной форме.NLP

продолжить чтение

Проверка на сгенерированный контент — опасность для академической сферы

В чем проблема?Я думаю, что всем уже очевидно, что развитие технологий в области генерации текста существенно повлияло на образовательный процесс. Не секрет, что большинство студентов активно используют LLM для создания письменных работ. По итогам опроса в мае 2024 года более половины студентов признались в использовании ИИ при подготовке дипломных работ. По моим личным ощущениям как практикующего преподавателя, процент может быть существенно выше, ближе к 100.

продолжить чтение

Нет, ваша генеративная модель меня не заменит

ВведениеЗа последние три недели я устранил пару проблем с производительностью, что потенциально сэкономило компании несколько сотен тысяч долларов (я подрядчик, поэтому, к сожалению, не получаю никаких премий).

продолжить чтение

Как мы прикрутили RAG для интент-классификации, или Трудности перевода на LLM-ский

И не опять, а снова — про этот ваш RAG. Многие продуктовые команды сейчас пробуют приспособить его для своих задач — и мы, команда Speech&Text в компании Домклик, не избежали этой участи. Но не (только) потому, что это модно и молодёжно — попробовать RAG‑подход нас побудила необходимость решить определённые насущные проблемы. Что же это за проблемы, как мы встраивали RAG и что из этого получилось? Если интересно узнать, то милости просим в текст :)

продолжить чтение

Почему AI-модели не могут конкурировать с фрилансерами-разработчиками: анализ OpenAI

Модели больших языков (LLMs) уже изменили разработку программного обеспечения, однако компаниям стоит дважды подумать, прежде чем полностью заменять человеческих разработчиков программного обеспечения на LLM, несмотря на утверждение генерального директора OpenAI Сэма Альтмана о том, что модели могут заменить «низкоуровневых» инженеров.

продолжить чтение

Интеграция AI с поисковыми системами: почему Deep Research — это прорыв

Корпоративным компаниям стоит обратить внимание на Deep Research от OpenAI. Это мощный продукт, основанный на новых возможностях, и настолько хорош, что может оставить многих людей без работы. Deep Research

продолжить чтение

Rambler's Top100