DeepSeek V3-0324. Что изменилось?
Все пишут, что Deep Seek V3-0324 ВНЕЗАПНО СТАЛ СИЛЬНО ЛУЧШЕ. И в чем именно?Ночью, без объявления войны, DeepSeek вырос на 19.8 баллов в математике и 10 баллов в кодировании. Также официально заявлены некоторые улучшения в понимании фронтенда и вызова тулов. Напоминаю, речь идет о нерассуждающей версии - она не рассказывает о своих мыслях как DeepSeek R1, зато работает более быстро и стабильно.Попробовать самостоятельно можно
DeepSeek и сын ошибок трудных: китайский стартап, в котором всё не как у «нормальных» людей
DeepSeek начал открывать кофейни, в меню LatteGPT (на самом деле нет). Источник
Новая DeepSeek V3: рекорды в бенчах, кодинг лучше Claude и GPT-4.5
Позавчера DeepSeek загадочно и молчаливо залили новую модель на HuggingFace, даже не написав ничего не в блоге, ни в README файле.Сегодня, наконец, вышел анонс с подробным описанием характеристик новой модели (а точнее, крутого обновления старой модели). Давайте разбираться, что в этот раз нам подогнали китайские исследователи.
Китайский технологический гигант заявил, что сократил расходы на AI, используя только китайские чипы
Ранее в этом году DeepSeek ненадолго обрушил акции Nvidia из-за слухов о том, что ее моделям требуется гораздо меньше чипов. Теперь китайский финтех-гигант Ant Group, которого поддерживает основатель Alibaba Джек Ма, заявляет о крупном прорыве в области искусственного интеллекта.
Кай-Фу Ли переориентирует 01.AI на решения Deepseek, называя их экзистенциальной угрозой для OpenAI
Бывший глава Google China Кай-Фу Ли переориентирует свой стартап в сфере искусственного интеллекта 01.AI на полное внедрение моделей Deepseek с открытым исходным кодом, описывая их как экзистенциальный вызов бизнес-модели OpenAI.
ИИ – армагеддон или революция?
В последнее время все чаще звучат апокалиптические прогнозы о будущем искусственного интеллекта в стиле «Терминатора»: скоро нас всех поработят роботы и мы все умрем! Если бы такие идеи исходили только от писателей‑фантастов, в этом не было бы ничего удивительного — жанр научной фантастики часто строится на попытках запугать читателя. Однако в дело вступают не только писатели, но и серьезные исследователи. Вот например Ник Бостром в его «Суперразум: пути, опасности, стратегии» (2014), где он обсуждает возможные риски искусственного интеллекта:
Тестирование платформы DeepSeek для проверки гипотез по анализу данных
Привет, Хабр!Мы, ребята из Центра эксплуатации Блока ИТ Страхового Дома ВСК, занимаемся управлением автоматизации ИТ-процессов. И у нас, как у всех —
Мультимодальные языковые модели: как нейросети учатся видеть и слышать
Мультимодальные языковые модели представляют собой самый прогрессивный класс нейросетевых архитектур, объединяющих способность воспринимать и обрабатывать различные типы данных одновременно - текст, изображения, аудио и видео. Это похоже на то, как наш мозг интегрирует информацию из разных органов чувств, чтобы создать полную картину мира. Как сказал философ Марсель Пруст, “Настоящее открытие не в том, чтобы увидеть новые земли, а в том, чтобы иметь новые глаза”.▍ Фундаментальные принципы мультимодальных моделей
«Ошибка на миллиард» в ИИ: боремся с галлюцинациями в LLM по аналогии с NullPointerException
Привет! Меня зовут Денис Березуцкий, я старший инженер по разработке ПО искусственного интеллекта в YADRO. В ML-команде мы разрабатываем системы, которые облегчают работу нашим заказчикам с помощью текстовых генеративных нейросетей: реализуем

