большие языковые модели.

Почему «вайб-физика» — это пример чистейшего ИИ-шлака

Если вы попробуете обсуждать с большими языковыми моделями (LLM) прорывные новые идеи в области теоретической физики, то знайте — это занятие совершенно бесполезное. Объясню, почему.

продолжить чтение

Оставлено в

Итоги LLM в 2025 году: прогресс, проблемы и прогнозы

Один из лучших обозревателей в мире LLM выпустил масштабный разбор всего самого важного, что случилось с языковыми моделями в 2025 году. Я перевел, чтобы как можно больше людей прочитало этот фундаментальный труд. Дальше — слово автору.На исходе 2025 года предлагаю оглянуться на ключевые достижения в области больших языковых моделей (LLM) и проанализировать оставшиеся ограничения и нерешенные проблемы, а также высказать несколько соображений о дальнейшем развитии событий.

продолжить чтение

Оставлено в

Hello World от ИИ-агентов: как обстоят дела с интересом к технологии в мире

ИИ-агенты ворвались в чарты и обсуждения по всему миру, к ним прикован интерес, в них вливают миллиарды и интегрируют в продукты и платформы. Но долго ли это продлится?

продолжить чтение

Оставлено в

Ждёт ли OpenAI спасения от государства?

В последние недели на рынках усилилась тревога по поводу устойчивости бума искусственного интеллекта. Отчасти её подогрела та мысль, которую допустила

продолжить чтение

Оставлено в

GigaMemory на AI Journey Contest 2025: итоги

Приветствуем всех! С вами снова ML-команда RnD для B2C SberAI. Этой осенью в рамках AI Journey Contest 2025 мы представили задачу GigaMemory: global memory for LLM. Её цель — создание автономного модуля долговременной памяти для языковых моделей, способного накапливать и использовать знания о конкретном пользователе, по сути наделяя ИИ способностью «помнить» своего собеседника.Пришло время объявить результаты! Но для начала — кратко напомним детали соревнования.

продолжить чтение

Оставлено в

Агенты Купер, Смит или Джеймс Бонд: какие виды ИИ-агентов бывают и какой подходит тебе

продолжить чтение

Оставлено в

Логический компас для искусственного интеллекта

продолжить чтение

Оставлено в

Технический обзор моделей DeepSeek от V3 до V3.2

Три самые постоянные вещи в мире — оливье с мандаринами на Новый год, желание начать новую жизнь с понедельника и то, что если выходит статья Себастьяна Рашки, то я делаю ее качественный перевод на русский. Эта технически глубокая статья известного исследователя LLM о том, как эволюционировали флагманские модели с открытыми весами от DeepSeek и обзор DeepSeek V3.2.

продолжить чтение

Оставлено в

OpenAI обучила модели «признаваться» в плохом поведении

OpenAI тестирует ещё один способ раскрыть сложные процессы, происходящие в больших языковых моделях. Исследователи компании экспериментируют с манипуляциями LLM, чтобы те объясняли, как выполнили задачу, и признавались в нежелательном поведении.

продолжить чтение

Оставлено в

«Закон уплотнения» LLM: плотность способностей удваивается каждые 3,5 месяца

TL;DRПредлагается «закон уплотнения» для больших языковых моделей: максимальная плотность способностей удваивается примерно каждые 3,5 месяца. То есть всё больше качества удаётся выжать из каждого параметра модели.Вводится метрика плотности способностей: считается, сколько параметров потребовалось бы референсной модели, чтобы показать такое же качество, и это число сравнивается с реальным количеством параметров. Так видно, какие модели обучены «экономно», а какие — расточительно.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

большие языковые модели.

Почему «вайб-физика» — это пример чистейшего ИИ-шлака

Итоги LLM в 2025 году: прогресс, проблемы и прогнозы

Hello World от ИИ-агентов: как обстоят дела с интересом к технологии в мире

Ждёт ли OpenAI спасения от государства?

GigaMemory на AI Journey Contest 2025: итоги

Агенты Купер, Смит или Джеймс Бонд: какие виды ИИ-агентов бывают и какой подходит тебе

Логический компас для искусственного интеллекта

Технический обзор моделей DeepSeek от V3 до V3.2

OpenAI обучила модели «признаваться» в плохом поведении

«Закон уплотнения» LLM: плотность способностей удваивается каждые 3,5 месяца

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

большие языковые модели.