Крах (?) NVIDIA: как DeepSeek встряхнул рынок AI
Акции NVIDIA рухнули, потеряв за одну ночь $600 миллиардов рыночной капитализации — крупнейший
Социализация и здоровье мозга
В 2019 году в журнале New England Journal of Medicine была опубликована ошеломляющая статья. Исследователи отслеживали изменения в мозге у 9 ученых после 14 месяцев изоляции на отдаленной станции в Антарктиде. Данные выявили поразительные структурные изменения мозга, при этом ряд важнейших областей фактически сократились за время, проведенное ими в одиночестве в дали от мира.
Loss Landscape Analysis — новая библиотека для анализа точности обучения и оценки обобщающей способности нейросетей
Мой коллега Никита Габдуллин работает в Отделе перспективных исследований ИТ-компании «Криптонит». Он автор библиотеки Loss Landscape Analysis (LLA) и научной статьи о ней, препринт которой доступен на английском языке. Здесь мы подробнее рассказываем о самой библиотеке, в то время как научная публикация в основном посвящена исследованию разных свойств ландшафтов функций потерь. Также в русскоязычной статье мы допускаем некоторые лингвистические вольности, которые не приняты в академической среде, но упрощают восприятие текста.
Исследователи из Unsloth сжали DeepSeek R1 на 80% от оригинального размера
Исследователи из компании Unsloth, которая специализируется на обучении и файнтюнинге языковых моделей, сжали нейросеть DeepSeek R1 на 80% от оригинального размера. В итоге языковая модель занимает 131 ГБ вместо 720 ГБ, а запускать её можно на более слабом железе. При этом производительность модели всё ещё остаётся на достаточно высоком уровне.
В Adobe Premiere Pro появился визуальный поиск видеофайлов на базе нейросетей
В Adobe Premiere Pro добавили визуальный поиск видеофайлов на базе нейросетей. С его помощью пользователи могут искать нужные кадры в коллекции отснятого материала с помощью текстовых подсказок.
Учёные предлагают заставить ИИ играть в игру «боль-удовольствие» для проверки разумности
Исследователи из Google DeepMind и Лондонской школы экономики (LSE) предлагают
DeepSeek выпустила мультимодальную нейросеть Janus-Pro-7B
Китайская компания DeepSeek выпустила мультимодальную нейросеть Janus-Pro-7B. Она нужна для распознавания и генерации изображений. В бенчмарках нейросеть опережает DALL-E 3 от OpenAI и Stable Diffusion.
LLM против детских вопросов: смотрим, как GPT o1, QwenLM и DeepSeek справятся с детскими задачами
Как часто сейчас в ИТ сообществе можно услышать про невероятные успехи LLM моделей? ИИ написал диссертацию за 30 минут, ИИ пишет программы на уровне middle разработчика, ИИ диагностирует болезнь с точностью 99.99999% и много много других впечатляющих заголовков пестрят на сотнях сайтов. И это не говоря о том, что создатели таких ИИ моделей заявляют, что через 2-3 года ИИ станет умнее человека чуть ли не в каждой сфере жизниА так ли это? Давайте поищем парочку не совсем хитрых, но интересных задач, с которыми может справиться даже ребенок (немного подумав, конечно)

