Инженер-программист Ананай Арора приобрёл домен «OGOpenAI.com» и перенаправил его на DeepSeek — китайскую лабораторию искусственного интеллекта, которая выпускает мощные языковые модели с открытым исходным кодом, соревнуясь с OpenAI.

Арора рассказал TechCrunch, что он купил доменное имя «дешевле, чем платит за обед в сети Chipotle». Он планирует продать его дороже.
Этот шаг инженера расценили как намёк на то, что DeepSeek выпускает передовые открытые модели искусственного интеллекта, как это делала OpenAI в первые годы работы. Модели DeepSeek можно использовать офлайн и бесплатно даже в коммерческих целях подобно старым моделям OpenAI, таким как Point-E и Jukebox.
Теперь же за исключением таких моделей, как Whisper, OpenAI не выпускает флагманские модели ИИ в «открытом» формате.
Арора говорит, что его вдохновил удалённый пост на X от генерального директора Perplexity Аравинда Шриниваса, в котором он сравнивал DeepSeek с OpenAI в ранние годы. «Я подумал, эй, было бы круто, если бы этот домен перешел на DeepSeek ради развлечения», — отметил инженер.
В декабре DeepSeek представила новую языковую модель DeepSeek-V3, которая продемонстрировала впечатляющие результаты в работе с кодом. Модель имеет 685 млрд параметров, а в основе её архитектуры лежит подход Mixture of Experts (MoE) с 256 «экспертами», из которых восемь активируются для каждого токена.
По данным Deepseek, V3 демонстрирует производительность, сопоставимую с ведущими проприетарными моделями, такими как GPT-4o и Claude-3.5-Sonnet, во многих тестах, при этом предлагая лучшее соотношение цены и производительности на рынке.
Также DeepSeek выпустила открытую версию модели рассуждений DeepSeek-R1, которая, по её утверждению, работает наравне с o1 от OpenAI в определённых тестах. Это уже подтвердили независимые бенчмарки.
Автор: maybe_elf