числа с плавающей точкой.

Квантизация с нуля: как запустить 160ГБ LLM на ноутбуке и не потерять в качестве

Qwen-3-Coder-Next — модель с 80 миллиардами параметров и весом 159,4 ГБ. Примерно столько RAM потребовалось бы для её запуска, и это ещё без учёта длинного контекстного окна. И эта модель не считается большой моделью! По слухам, у frontier-моделей более триллиона параметров, для которых понадобилось бы минимум 2 ТБ оперативной памяти. Последний раз я видел столько RAM в одной машине — никогда.

продолжить чтение

Оставлено в

Об ошибках округления и способах борьбы с ними

Современные алгоритмы машинного обучения и искусственного интеллекта обсчитывают огромные массивы чисел, интенсивно используя параллельные аппаратные ускорители. Одним из побочных эффектов параллельных вычислений является то, что порядок, в котором обрабатываются элементы данных, неочевиден и часто плохо предсказуем.Многие алгоритмы быстрых вычислений, к примеру, матричного умножения, намеренно "портят", изменяют порядок действий, за счет этого добиваясь существенного сокращения количества необходимых операций.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

числа с плавающей точкой.

Квантизация с нуля: как запустить 160ГБ LLM на ноутбуке и не потерять в качестве

Об ошибках округления и способах борьбы с ними

Меню навигации

Рекомендуем

На главную

Главное

Рубрики

Методики

Информация

Из архивов

числа с плавающей точкой.

Квантизация с нуля: как запустить 160ГБ LLM на ноутбуке и не потерять в качестве

Об ошибках округления и способах борьбы с ними