Microsoft выпустила Phi-4 — семейство компактных рассуждающих языковых моделей с открытым исходным кодом
Microsoft представила семейство компактных рассуждающих языковых моделей Phi-4. Продвинутая версия в некоторых бенчмарках превосходит DeepSeek-R1, GPT o1 и Claude-3.7-Sonnet. Код моделей и веса доступны на Hugging Face.
ChatGPT теперь говорит на праиндоевропейском (и перевёл на праиндоевропейский моё стихотворение)
Пользователь Reddit с ником Low-Needleworker-139 неделю назад объявил в сабреддите r/IndoEuropean, что создал на базе ChatGPT свою пользовательскую языковую модель, которую обучил на имеющемся корпусе реконструкций праиндоевропейского языка. Этот пользовательский чатбот получил название Déiwos-Lókwos GPT.
Часть 3. Обзор технологий RAG для LLM: оптимизация извлеченных данных
Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (ссылка на первую часть — здесь, на вторую часть — здесь) Во этой, третьей части авторы совсем кратенько разбирают технологии оптимизации извлеченных данных.После этапа поиска информации не рекомендуется напрямую передавать все полученные данные в LLM для генерации ответов. Оптимизацию предлагается проводить в двух направлениях: корректировка извлечённого контента и
Новые языковые модели от OpenAI оставляют скрытые водяные знаки в сгенерированном тексте
Разработчики платформы для управления политикой использования нейросетей в учебных заведениях рассказали в блоге, что новые модели OpenAI оставляют в сгенерированном тексте водяные знаки. Популярные редакторы документов не показывают их.
Часть 2. Обзор технологий RAG для LLM: поиск и извлечение информации
Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (первую часть см. здесь) Во второй части авторы разбирают технологии оптимизации поиска и извлечения данных. Поскольку материал я готовил в первую очередь для начинающих ИТ-переводчиков, сложные и специальные термины я сопровождал английским переводом и краткими пояснениями в инфобоксах (появляются по наведению курсора). Картинок не было, не обессудьте.
Исследователи представили бенчмарк, в котором языковые модели проходят классические игры
Исследователи Принстонского университета представили Video Game Bench — бенчмарк, в котором языковые модели проходят классические игры для MS-DOS и Game Boy. Код бенчмарка открыт и опубликован на GitHub.
Оценка развития человечества на 1000 лет по версии DeepSeek и рефлексия
Я знаю сейчас очень популярно хейтить статьи сгенерированные LLM. Но как по мне это огромное поле для исследований. Ведь с точки зрения технологий это фактически новый вид баз данных, которые определенным образом обобщают тот опыт который в них закладывается разработчиками. И так меньше флуда больше пользы...Задал я тут вопрос Дипсику.Как ты оцениваешь динамику популяции человечества в следующие 1000 лет. разбери этот вопрос по вехам, каждая по 250 лет. Ответ:
Как запустить языковую модель без цензуры, не имея видеокарты и мощного компьютера
Думаю, все сталкивались с тем, что языковая модель отказывается отвечать на какие-то вопросы. К счастью, в интернете есть опубликованные так называемые abliterated модели, которые не имеют цензуры и отвечают на любые

