Машинное обучение. - страница 5

Mail запустил ИИ чат-бот для пользователей

продолжить чтение

GigaChat-3.1: Большое обновление больших моделей

Салют, хабр!В ноябре мы выложили в open source preview-версии GigaChat-3-Ultra (702B MoE) и GigaChat-3-Lightning (10B MoE). С тех пор мы провели большую работу над нашими моделями, и сегодня выпускаем обновлённые GigaChat-3.1-Ultra и GigaChat-3.1-Lightning. По нашим замерам, Ultra обходит non-reasoning Qwen3-235B-A22B и DeepSeek-V3-0324 в математике и general reasoning, а Lightning на аренах с судьёй GPT-4.1 играет на уровне GPT-4o — при 1,8 млрд активных параметров. Модели, как и раньше, лежат на HuggingFace и GitVerse под MIT.

продолжить чтение

Selectel запустил бесплатный курс по работе с ML-моделями

Привет, Хабр! Если вы планируете начать работу с ML-моделями, рекомендуем пройти бесплатный мини-курс Академии Selectel

продолжить чтение

70% новых статей по программной инженерии на ArXiv связаны с LLM

Данные о статьях, опубликованных с 2022 года на сервисе препринтов ArXiv, показывают, что в области программной инженерии лидирует тема LLM (больших языковых моделей). На них приходится 70% новых материалов.

продолжить чтение

Конец эпохи вероятностного ИИ: почему гонка за GPU от Nvidia — это архитектурный тупик

Индустрия генеративного искусственного интеллекта больна

продолжить чтение

Тестирование ML-систем: сложности, факапы и рабочие практики

Привет! Сегодня хочу поделиться опытом тестирования на ML-проекте. По моему опыту, о машинном обучении говорят много, а вот о его тестировании — заметно реже. На истину в последней инстанции не претендую, но надеюсь быть полезным. Если у вас был опыт тестирования ML – буду рад обсудить в комментариях!На всякий случай напомню: меня зовут Максим Белопросов, я QA Team Lead в компании 1221Systems и один из ответственных за направление автоматизированного тестирования.В этой статье я хочу рассказать:

продолжить чтение

Cursor показал 5 графиков, которые хоронят все публичные ИИ-бенчмарки для кода. Разбираемся

продолжить чтение

Cursor признал: да, мы взяли за основу китайскую Kimi, а не создали Composer 2 с нуля

На этой неделе Cursor, разрабатывающая ИИ-инструменты кодинга, представила модель Composer 2, которую в своём анонсе

продолжить чтение

Хуанг заявил, что AGI достигнут — но построить NVIDIA ему не по плечу

Глава NVIDIA Дженсен Хуанг в свежем выпуске подкаста Lex Fridman (#494)

продолжить чтение

Qwen 3.5 с 397 млрд параметров запустили на iPhone 17 Pro: для этого понадобился внешний SSD

Разработчик под никнеймом Anemll запустил языковую модель Qwen 3.5 с 397 млрд параметров на iPhone 17 Pro. Веса модели подгружали с внешнего SSD, а скорость генерации ответов составила всего 0,6 токенов. Авторы проекта признают, что решение не годится для нормального использования, а лишь демонстрирует возможности.

продолжить чтение

1...345678...2030...394
Rambler's Top100