DeepSeek вытесняет ChatGPT с поста топового приложения App Store
Мобильное приложение DeepSeek в эти выходные взлетело на первое место в магазинах приложений по всему миру, обогнав американский чат-бот с искусственным интеллектом ChatGPT. По данным компании Appfigures, занимающейся аналитикой мобильных приложений, DeepSeek в настоящее время является бесплатным приложением номер один в App Store в США и 51 другой стране.
Как работает модель DeepSeek-R1. Объясняем в иллюстрациях и схемах
DeepSeek-R1 — это самый громкий релиз последних дней в области искусственного интеллекта. Для сообщества исследователей и разработчиков машинного обучения (ML R&D) эта модель имеет особое значение по ряду причин:Модель обладает открытыми весами и включает уменьшенные, дистиллированные варианты.Она делится и размышляет над методом обучения, позволяющим воспроизвести модель рассуждений, подобную OpenAI O1.В этой публикации мы рассмотрим, как была создана DeepSeek-R1.Дисклеймер: это вольный перевод статьи
Аномалии DeepSeek-v3 и DeepSeek-r1: глюкнутые токены и чат, теряющий идентичность
«Аномальные», «глючные» и «непроизносимые» токены в больших языковых моделях (LLM) — это те, которые вызывают странное поведение или не функционируют как обычный текст. Явление было впервые открыто и задокументировано
Исследователи из Unsloth сжали DeepSeek R1 на 80% от оригинального размера
Исследователи из компании Unsloth, которая специализируется на обучении и файнтюнинге языковых моделей, сжали нейросеть DeepSeek R1 на 80% от оригинального размера. В итоге языковая модель занимает 131 ГБ вместо 720 ГБ, а запускать её можно на более слабом железе. При этом производительность модели всё ещё остаётся на достаточно высоком уровне.
Индустрия искусственного интеллекта в Китае или как зарождался DeepSeek
Индустрия искусственного интеллекта в КитаеКраткий дайджестКонец 1970-х - начало 2010-хКонец 2010-х - начало 2020-хОсновные цели и задачи китайского правительстваДеятельность в военной сфере
Почему DeepSeek способен конкурировать с OpenAI и как повторить их опыт
За последние два года - за время невероятной популярности Generative AI - появилось много перспективных компаний, создающих новые прорывные модели. Последний пример - это китайский стартап DeepSeek, благодаря которому у нас есть открытые аналоги OpenAI GPT-4o и o1. С теми же (что проверено бенчмарками) возможностями в плане выполнения текстовых инструкций, задач на математику, логику и кодинг.
DeepSeek против ChatGPT: Какой искусственный интеллект определит будущее?
В последние годы искусственный интеллект (ИИ) стремительно развивается, становясь центральной силой, формирующей отрасли и переосмысливающей возможности как для отдельных людей, так и для бизнеса.
Исследователи взломали модель DeepSeek-R1 для создания вредоносных выходных данных
Компания по кибербезопасности KELA рассказала, что ей удалось взломать модель DeepSeek-R1 для создания вредоносных выходных данных. Исследователи отметили, что DeepSeek R1 имеет сходство с ChatGPT, но значительно более уязвима.
Nvidia, OpenAI и Трамп прокомментировали ситуацию по поводу популярности проекта DeepSeek
Американская компания Nvidia, генеральный директор OpenAI Сэм Альтман и президент США Дональд Трамп прокомментировали
Почему DeepSeek Janus-7B — это нечто действительно невероятное
Полчаса назад вышла новость о выходе DeepSeek Janus-7B - новой мультимодальной модели от DeepSeek, которая, по заявлениям авторов, рвёт DALL-E 3, Stable Diffusion XL и Stable Diffusion 3 (Medium) в бенчмарках.В этой статье я не буду дублировать новость, а хочу подробнее рассмотреть, что именно в этой модели такого уникального, из-за чего многие связанные с AI медиа сегодня захлебываются от восторга.

