языковые модели. - страница 9

История развития языковых моделей: ч. 1, от цепей Маркова до ELIZA

История развития языковых моделей: ч. 1, от цепей Маркова до ELIZAДоброго времени суток, «Хабр»!

продолжить чтение

Создаем свой RAG: введение в LangGraph

Привет, Хабр!В последние годы все чаще dстали появляться системы RAG(Retrieval Augmented Generation или "генерация с дополненной выборкой"). Их применяют в областях, где необходима работа со специализированной  информацией/документацией и высокая точность генерации с минимальным количеством фактических ошибок. Возможно, вы уже пользовались такими системы, когда обращались в службу клиентской поддержки или юридические/медицинские организации. В одной статье сложно охватить все аспекты RAG, поэтому в первой части я расскажу про LangGraph 

продолжить чтение

Ложь искусственного интеллекта

"Everybody lies"— доктор Грегори Хаус, "Доктор Хаус".Реакция Grok, когда все же доказали, что он лжет.Введение

продолжить чтение

Microsoft выпустила Phi-4 — семейство компактных рассуждающих языковых моделей с открытым исходным кодом

Microsoft представила семейство компактных рассуждающих языковых моделей Phi-4.  Продвинутая версия в некоторых бенчмарках превосходит DeepSeek-R1, GPT o1 и Claude-3.7-Sonnet. Код моделей и веса доступны на Hugging Face.

продолжить чтение

ChatGPT теперь говорит на праиндоевропейском (и перевёл на праиндоевропейский моё стихотворение)

Пользователь Reddit с ником Low-Needleworker-139 неделю назад объявил в сабреддите r/IndoEuropean, что создал на базе ChatGPT свою пользовательскую языковую модель, которую обучил на имеющемся корпусе реконструкций праиндоевропейского языка. Этот пользовательский чатбот получил название Déiwos-Lókwos GPT.

продолжить чтение

Космолама: Meta* и Booz Allen Hamilton запустили языковую модель Llama на МКС

Журналисты издания CNBC сообщили, что американские компании Meta* и Booz Allen Hamilton развернули большую языковую модель Llama 3.2 на Международной космической станции. Ожидается, что нейросеть будет помогать космонавтам в ежедневных задачах и научных экспериментах.Booz Allen Hamilton — американская компания, которая в 2024 году доставила на МКС необходимое оборудование для локального запуска нейросетей. Благодаря партнёрству с Meta* на оборудовании запустили Space Llama — дообученную и оптимизированную версию языковой модели Llama 3.2.

продолжить чтение

Часть 3. Обзор технологий RAG для LLM: оптимизация извлеченных данных

Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (ссылка на первую часть — здесь, на вторую часть — здесь) Во этой, третьей части авторы совсем кратенько разбирают технологии оптимизации извлеченных данных.После этапа поиска информации не рекомендуется напрямую передавать все полученные данные в LLM для генерации ответов. Оптимизацию предлагается проводить в двух направлениях: корректировка извлечённого контента и

продолжить чтение

Новые языковые модели от OpenAI оставляют скрытые водяные знаки в сгенерированном тексте

Разработчики платформы для управления политикой использования нейросетей в учебных заведениях рассказали в блоге, что новые модели OpenAI оставляют в сгенерированном тексте водяные знаки. Популярные редакторы документов не показывают их.

продолжить чтение

Часть 2. Обзор технологий RAG для LLM: поиск и извлечение информации

Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (первую часть см. здесь) Во второй части авторы разбирают технологии оптимизации поиска и извлечения данных. Поскольку материал я готовил в первую очередь для начинающих ИТ-переводчиков, сложные и специальные термины я сопровождал английским переводом и краткими пояснениями в инфобоксах (появляются по наведению курсора). Картинок не было, не обессудьте.

продолжить чтение

Исследователи представили бенчмарк, в котором языковые модели проходят классические игры

Исследователи Принстонского университета представили Video Game Bench — бенчмарк, в котором языковые модели проходят классические игры для MS-DOS и Game Boy. Код бенчмарка открыт и опубликован на GitHub.

продолжить чтение

Rambler's Top100