плотность способностей.

«Закон уплотнения» LLM: плотность способностей удваивается каждые 3,5 месяца

TL;DRПредлагается «закон уплотнения» для больших языковых моделей: максимальная плотность способностей удваивается примерно каждые 3,5 месяца. То есть всё больше качества удаётся выжать из каждого параметра модели.Вводится метрика плотности способностей: считается, сколько параметров потребовалось бы референсной модели, чтобы показать такое же качество, и это число сравнивается с реальным количеством параметров. Так видно, какие модели обучены «экономно», а какие — расточительно.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

плотность способностей.

«Закон уплотнения» LLM: плотность способностей удваивается каждые 3,5 месяца

Меню навигации

Рекомендуем

На главную

Главное

Рубрики

Методики

Информация

Из архивов

плотность способностей.

«Закон уплотнения» LLM: плотность способностей удваивается каждые 3,5 месяца