Фундаментальный разбор: эволюция архитектур нейросетей от перцептрона до трансформера
Доброго времени суток, «Хабр»!Устал я делать разного рода сравнения и составлять топы среди недавно вышедших моделей. Восемь месяцев назад вышла моя статья, рассказывающая о пути, который нейросети проделали от цепей Маркова до современных языковых моделей. Размышляя над старыми материалами, я подумал: а почему бы снова не углубиться в историю и не рассмотреть развитие архитектур моделей?Присаживайтесь поудобнее, а я начинаю свой рассказ, в котором пройду путь от перцептрона до современного трансформера.
Stanford Report назвал 11 важных инноваций 2025 года
Стэнфордский университет собрал заметные инновации 2025 года, которые варьируются от микроскопических роботов внутри сосудов до гигантского телескопа, смотрящего на края Вселенной.1. Миллиспиннер
Xiaomi выпустила MiMo-V2-Flash 309B, модель достигла абсолютного верха в агентном бенчмарке
Китайский гигант Xiaomi представил MiMo‑V2-Flash — большую языковую модель с открытыми весами, которая претендует на лидерские позиции в конкретных дисциплинах.
Nvidia хочет создать универсального ИИ-агента с помощью NitroGen
Компания Nvidia выпустила новую модель для ИИ-агентов, ориентированных на игры.
Почему 95% ИИ-проектов проваливаются? Ответ кроется в той же причине, что и наркомания
Фото: and machines, Unsplash
Google выпускает FunctionGemma, позволяющую смартфонам воспринимать команды от ИИ
Компания Google выпустила FunctionGemma, специализированную версию компактной языковой модели Gemma 3 270M. Созданная на основе

