Китайская компания в сфере искусственного интеллекта DeepSeek отчиталась, что потратила $294 тыс. на обучение своей модели R1 — это значительно меньше расходов, которые озвучили американские конкуренты по поводу своих разработок. Для этого DeepSeek задействовала 512 ускорителей Nvidia H800.

Оставлено в

Китайская компания Unitree представила нового гуманоидного робота за $6000

Китайская компания Unitree Robotics выводит на рынок одного из первых в мире гуманоидных роботов по цене менее $6000 (~480 000 руб.), что значительно снижает входной порог для этой перспективной технологии.

продолжить чтение

Оставлено в

Сотрудникам Microsoft запрещено использовать приложение DeepSeek

Во время слушаний в Сенате США президент и главный юрисконсульт Microsoft Брэд Смит сообщил, что сотрудникам американской корпорации запрещено пользоваться приложением китайской модели искусственного интеллекта от DeepSeek. Решение связано с безопасностью данных и проблемой пропаганды, признался Смит.

продолжить чтение

Оставлено в

DeepSeek обновляет свою математическую модель искусственного интеллекта Prover

Китайская лаборатория искусственного интеллекта DeepSeek без лишнего шума обновила Prover — свою модель искусственного интеллекта, предназначенную для решения математических доказательств и поиска теорем. По данным South China Morning Post, DeepSeek загрузил последнюю версию Prover, V2, на платформу разработки AI Hugging Face поздно вечером в среду. Похоже, что она построена поверх модели V3 стартапа, которая имеет 671 миллиард параметров и использует архитектуру смешанного эксперта (MoE).

продолжить чтение

Оставлено в

DeepSeek сообщил о «теоретической» марже в 545%

Китайский стартап в сфере искусственного интеллекта DeepSeek сообщил, что теоретическая доходность его моделей V3 и R1 достигает 545% в сутки, хотя фактические доходы компании существенно ниже.

продолжить чтение

Оставлено в

Скандал вокруг DeepSeek: страны мира усиливают защиту от китайского AI-чатбота

Китайский чатбот DeepSeek произвел фурор в мировой индустрии, вызвав обвал акций американских технологических компаний на миллиарды долларов, когда представил свою программу R1. Примечательно, что она была создана на более дешевых и менее сложных полупроводниках Nvidia.

продолжить чтение

Оставлено в

ИИ простыми словами, часть 1. Архитектура Mixture of Experts (MoE)

Когда я пишу новости про ИИ, то часто сталкиваюсь с проблемой: они пестрят техническими терминами, которые не всегда понятны даже людям использующим ИИ регулярно. SFT, MoE, RL/RLHF/DPO, миллионы их.Я захотел описать самые популярные термины простым русским языком, чтобы каждый, даже нетехнический человек, мог разобраться в самой главной технологии современности. Чтобы, когда я пишу на Хабр или куда-то ещё, для сложных терминов я сразу мог бы дать ссылку на понятное и простое объяснение.

продолжить чтение

Оставлено в

DeepSeek vs OpenAI: кто сильнее?

Китайский стартап представил модель искусственного интеллекта R1, соперничающую с технологиями OpenAI. Однако они сильно различаются. DeepSeek позиционирует свою последнюю модель искусственного интеллекта R1 как особенно эффективную для решения сложных задач, сравнимую по возможностям с моделью рассуждений o1 от OpenAI, но работающую при значительно меньших затратах на один запрос. Невозможно рассматривать новую модель искусственного интеллекта китайского стартапа DeepSeek без сравнения с OpenAI — его главным американским конкурентом.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

R1.

После провального ИИ-гаджета Rabbit готовит ИИ-ноутбук Cyberdeck для вайб-кодинга

DeepSeek: обучение модели R1 обошлось всего в $294 тысяч

Китайская компания Unitree представила нового гуманоидного робота за $6000

Сотрудникам Microsoft запрещено использовать приложение DeepSeek

DeepSeek обновляет свою математическую модель искусственного интеллекта Prover

DeepSeek сообщил о «теоретической» марже в 545%

Скандал вокруг DeepSeek: страны мира усиливают защиту от китайского AI-чатбота

ИИ простыми словами, часть 1. Архитектура Mixture of Experts (MoE)

DeepSeek vs OpenAI: кто сильнее?

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

R1.