deepseek.

DeepSeek утверждает, что его модель рассуждений превосходит o1 от OpenAI по некоторым показателям

Китайская лаборатория искусственного интеллекта DeepSeek выпустила открытую версию DeepSeek-R1, своей так называемой модели рассуждений, которая, по её утверждению, работает так же хорошо, как o1 от OpenAI в определённых тестах AI.

продолжить чтение

Оставлено в

Мечтают ли электроовцы об андроидах?

В научном журнале Society вышло исследование

продолжить чтение

Оставлено в

Deepseek V3 становится самой мощной открытой языковой моделью в Китае на сегодня

Китайская компания Deepseek только что выпустила свою самую мощную языковую модель. Первые тесты показывают, что новая модель V3 может конкурировать с ведущими проприетарными моделями в отрасли и демонстрирует значительное улучшение в задачах логического мышления.Модель, доступная на Github, использует архитектуру Mixture-of-Experts (MoE) с общим количеством параметров 671 миллиард, из которых 37 миллиардов активируются для каждого токена. Это значительное увеличение по сравнению с V2, которая имеет 236 миллиардов параметров, из которых 21 миллиард активен во время вывода.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

deepseek.

DeepSeek утверждает, что его модель рассуждений превосходит o1 от OpenAI по некоторым показателям

Мечтают ли электроовцы об андроидах?

Deepseek V3 становится самой мощной открытой языковой моделью в Китае на сегодня

Меню навигации

Рекомендуем

На главную

Главное

Рубрики

Методики

Информация

Из архивов

deepseek.

DeepSeek утверждает, что его модель рассуждений превосходит o1 от OpenAI по некоторым показателям

Мечтают ли электроовцы об андроидах?

Deepseek V3 становится самой мощной открытой языковой моделью в Китае на сегодня