DeepSeek и сын ошибок трудных: китайский стартап, в котором всё не как у «нормальных» людей
DeepSeek начал открывать кофейни, в меню LatteGPT (на самом деле нет). Источник
Новая DeepSeek V3: рекорды в бенчах, кодинг лучше Claude и GPT-4.5
Позавчера DeepSeek загадочно и молчаливо залили новую модель на HuggingFace, даже не написав ничего не в блоге, ни в README файле.Сегодня, наконец, вышел анонс с подробным описанием характеристик новой модели (а точнее, крутого обновления старой модели). Давайте разбираться, что в этот раз нам подогнали китайские исследователи.
Китайский технологический гигант заявил, что сократил расходы на AI, используя только китайские чипы
Ранее в этом году DeepSeek ненадолго обрушил акции Nvidia из-за слухов о том, что ее моделям требуется гораздо меньше чипов. Теперь китайский финтех-гигант Ant Group, которого поддерживает основатель Alibaba Джек Ма, заявляет о крупном прорыве в области искусственного интеллекта.
Кай-Фу Ли переориентирует 01.AI на решения Deepseek, называя их экзистенциальной угрозой для OpenAI
Бывший глава Google China Кай-Фу Ли переориентирует свой стартап в сфере искусственного интеллекта 01.AI на полное внедрение моделей Deepseek с открытым исходным кодом, описывая их как экзистенциальный вызов бизнес-модели OpenAI.
ИИ – армагеддон или революция?
В последнее время все чаще звучат апокалиптические прогнозы о будущем искусственного интеллекта в стиле «Терминатора»: скоро нас всех поработят роботы и мы все умрем! Если бы такие идеи исходили только от писателей‑фантастов, в этом не было бы ничего удивительного — жанр научной фантастики часто строится на попытках запугать читателя. Однако в дело вступают не только писатели, но и серьезные исследователи. Вот например Ник Бостром в его «Суперразум: пути, опасности, стратегии» (2014), где он обсуждает возможные риски искусственного интеллекта:
Тестирование платформы DeepSeek для проверки гипотез по анализу данных
Привет, Хабр!Мы, ребята из Центра эксплуатации Блока ИТ Страхового Дома ВСК, занимаемся управлением автоматизации ИТ-процессов. И у нас, как у всех —
Мультимодальные языковые модели: как нейросети учатся видеть и слышать
Мультимодальные языковые модели представляют собой самый прогрессивный класс нейросетевых архитектур, объединяющих способность воспринимать и обрабатывать различные типы данных одновременно - текст, изображения, аудио и видео. Это похоже на то, как наш мозг интегрирует информацию из разных органов чувств, чтобы создать полную картину мира. Как сказал философ Марсель Пруст, “Настоящее открытие не в том, чтобы увидеть новые земли, а в том, чтобы иметь новые глаза”.▍ Фундаментальные принципы мультимодальных моделей
«Ошибка на миллиард» в ИИ: боремся с галлюцинациями в LLM по аналогии с NullPointerException
Привет! Меня зовут Денис Березуцкий, я старший инженер по разработке ПО искусственного интеллекта в YADRO. В ML-команде мы разрабатываем системы, которые облегчают работу нашим заказчикам с помощью текстовых генеративных нейросетей: реализуем
Baidu утверждает, что их Ernie X1 сопоставим с Deepseek-R1, но в два раза дешевле
Компания Baidu представила две новые модели искусственного интеллекта, которые нацелены на западных конкурентов с помощью агрессивного ценообразования и планов выпуска с открытым исходным кодом.
Сатья Наделла о будущем языковых моделей: товар вместо технологий
По мере развития языковых моделей генеральный директор Microsoft Сатья Наделла считает, что они станут товаром. Этот сдвиг знаменует собой изменение подхода компаний к разработке ИИ: на первый план выходят системная интеграция и разработка продуктов. В недавнем подкасте

