Отчёт о запуске DeepSeek-R1 на Xeon 6132 c 768 ГБ памяти
Спойлер для экономии времени читающих — я просто скачаю DeepSeek и запущу его через llama.cpp, на какую-либо научную новизну этот пост совершенно не претендует. Зачем это на хабре, если там всего одна команда? Просто в комментариях к посту «Мануал по запуску полной модели DeepSeek-R1 локально
Китайские специалисты по ИИ избегают Кремниевой долины
В издании Rest of World решили проанализировать, как строят свою карьеру молодые китайские инженеры, которые работают в сфере ИИ, обратившись к опыту DeepSeek. Выяснилось, что местные таланты выбирают КНР из-за отсутствия визовых барьеров и возможности заниматься серьёзными задачами.
DeepSeek: инвестиции, вычислительные мощности и недостатки технологии
В конце января 2025 года фондовый рынок США потерял свыше 1 трлн $. Особенно пострадала NVIDIA, чьи акции упали
DeepSeek vs Mixtral: что безопаснее использовать для корпоративного чат-бота?
Языковая модель DeepSeek R1 наделала много шума в начале этого года. Сначала в AI-сообществе с восхищением обсуждали, как китайцам удалось получить качество генерации текста на уровне передовых западных моделей при меньших затратах на обучение. Затем восторг сменился жёсткой критикой о политической предвзятости, копировании моделей OpenAI и доступности истории запросов
Помочь искусственному интеллекту «погулять» по Интернету
Дело было вечером - делать было нечегоТехнологии искусственного интеллекта (далее - ИИ) стремительно развиваются. Эта сфера является для меня новой и Я ещё не успел в ней глубоко разобраться. Меня в основном интересуют текстовые генеративные модели - то есть чаты, с которыми можно поговорить как с человеком. Количество предложений в мире постепенно увеличивается и скоро закончатся пальцы на руках чтобы их перечислить. Так, недавно появившийся DeepSeek (далее -
ИИ простыми словами, часть 1. Архитектура Mixture of Experts (MoE)
Когда я пишу новости про ИИ, то часто сталкиваюсь с проблемой: они пестрят техническими терминами, которые не всегда понятны даже людям использующим ИИ регулярно. SFT, MoE, RL/RLHF/DPO, миллионы их.Я захотел описать самые популярные термины простым русским языком, чтобы каждый, даже нетехнический человек, мог разобраться в самой главной технологии современности. Чтобы, когда я пишу на Хабр или куда-то ещё, для сложных терминов я сразу мог бы дать ссылку на понятное и простое объяснение.
В Австралии запретили использовать DeepSeek в госсистемах и рабочих ПК чиновников по соображениям нацбезопасности
4 февраля 2025 года МВД Австралии запретило чиновником

