Alibaba выпустила модель Qwen с открытым исходным кодом, которая обрабатывает 1 миллион входных токенов
Команда Qwen от Alibaba только что добавила в семейство Qwen2.5 два новых элемента: Qwen2.5-7B-Instruct-1M и Qwen2.5-14B-Instruct-1M. Эти модели с открытым исходным кодом способны обрабатывать контекстные окна длиной до миллиона токенов, что делает их уникальными среди общедоступных моделей с подобными возможностями.
Китайские разработчики ИИ стремительно догоняют Западные решения. Колонка The Wall Street Journal
Основатель Moonshot AI Ян Чжилинь заявил, что компания фокусируется на обучении с подкреплением, которое имитирует рассуждения человека

