R1.
DeepSeek: обучение модели R1 обошлось всего в $294 тысяч
Китайская компания в сфере искусственного интеллекта DeepSeek отчиталась, что потратила $294 тыс. на обучение своей модели R1 — это значительно меньше расходов, которые озвучили американские конкуренты по поводу своих разработок. Для этого DeepSeek задействовала 512 ускорителей Nvidia H800.
Китайская компания Unitree представила нового гуманоидного робота за $6000
Китайская компания Unitree Robotics выводит на рынок одного из первых в мире гуманоидных роботов по цене менее $6000 (~480 000 руб.), что значительно снижает входной порог для этой перспективной технологии.
Сотрудникам Microsoft запрещено использовать приложение DeepSeek
Во время слушаний в Сенате США президент и главный юрисконсульт Microsoft Брэд Смит сообщил, что сотрудникам американской корпорации запрещено пользоваться приложением китайской модели искусственного интеллекта от DeepSeek. Решение связано с безопасностью данных и проблемой пропаганды, признался Смит.
DeepSeek обновляет свою математическую модель искусственного интеллекта Prover
Китайская лаборатория искусственного интеллекта DeepSeek без лишнего шума обновила Prover — свою модель искусственного интеллекта, предназначенную для решения математических доказательств и поиска теорем. По данным South China Morning Post, DeepSeek загрузил последнюю версию Prover, V2, на платформу разработки AI Hugging Face поздно вечером в среду. Похоже, что она построена поверх модели V3 стартапа, которая имеет 671 миллиард параметров и использует архитектуру смешанного эксперта (MoE).
DeepSeek сообщил о «теоретической» марже в 545%
Китайский стартап в сфере искусственного интеллекта DeepSeek сообщил, что теоретическая доходность его моделей V3 и R1 достигает 545% в сутки, хотя фактические доходы компании существенно ниже.
Скандал вокруг DeepSeek: страны мира усиливают защиту от китайского AI-чатбота
Китайский чатбот DeepSeek произвел фурор в мировой индустрии, вызвав обвал акций американских технологических компаний на миллиарды долларов, когда представил свою программу R1. Примечательно, что она была создана на более дешевых и менее сложных полупроводниках Nvidia.
ИИ простыми словами, часть 1. Архитектура Mixture of Experts (MoE)
Когда я пишу новости про ИИ, то часто сталкиваюсь с проблемой: они пестрят техническими терминами, которые не всегда понятны даже людям использующим ИИ регулярно. SFT, MoE, RL/RLHF/DPO, миллионы их.Я захотел описать самые популярные термины простым русским языком, чтобы каждый, даже нетехнический человек, мог разобраться в самой главной технологии современности. Чтобы, когда я пишу на Хабр или куда-то ещё, для сложных терминов я сразу мог бы дать ссылку на понятное и простое объяснение.
DeepSeek vs OpenAI: кто сильнее?
Китайский стартап представил модель искусственного интеллекта R1, соперничающую с технологиями OpenAI. Однако они сильно различаются. DeepSeek позиционирует свою последнюю модель искусственного интеллекта R1 как особенно эффективную для решения сложных задач, сравнимую по возможностям с моделью рассуждений o1 от OpenAI, но работающую при значительно меньших затратах на один запрос. Невозможно рассматривать новую модель искусственного интеллекта китайского стартапа DeepSeek без сравнения с OpenAI — его главным американским конкурентом.

