Tsinghua University представили модель, которая масштабирует контекст через визуально-текстовую компрессию. Блог компании BotHub.. Блог компании BotHub. Будущее здесь.. Блог компании BotHub. Будущее здесь. ИИ.. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект.. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение.. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение. машинное+обучение.. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение. машинное+обучение. научно-популярное.. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение. машинное+обучение. научно-популярное. нейросети.
Tsinghua University представили модель, которая масштабирует контекст через визуально-текстовую компрессию - 1

Исследователи из Tsinghua University представили Glyph — экспериментальную модель, которая масштабирует контекст не за счёт роста параметров, а через визуально-текстовую компрессию. Идея проста и при этом гениальна. Длинный текст преобразуется в изображение, которое потом обрабатывается мультимодальной моделью.

Tsinghua University представили модель, которая масштабирует контекст через визуально-текстовую компрессию - 2

Glyph использует LLM-управляемый генетический алгоритм, подбирающий оптимальные параметры отображения (шрифт, плотность строк, компоновку и цветовую схему). Цель в том, чтобы сохранить максимум смысла при минимальном объёме данных. Такой подход снижает вычислительные затраты в разы, но почти не влияет на качество вывода.

Tsinghua University представили модель, которая масштабирует контекст через визуально-текстовую компрессию - 3

На тестах с длинным контекстом Glyph показывает результаты, сопоставимые с Qwen3-8B, а при экстремальном сжатии позволяет vision-language модели с контекстом 128K эффективно решать задачи, эквивалентные миллиону и более токенов в обычных языковых моделях.

Tsinghua University представили модель, которая масштабирует контекст через визуально-текстовую компрессию - 4

По сути, Glyph превращает обработку длинных контекстов из чисто текстовой задачи в мультимодальную. Это может стать новым направлением в развитии больших моделей, где память и визуальная структура текста объединяются в единую когнитивную систему.


Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News.

Автор: cognitronn

Источник

Rambler's Top100