Почему DeepSeek Janus-7B — это нечто действительно невероятное
Полчаса назад вышла новость о выходе DeepSeek Janus-7B - новой мультимодальной модели от DeepSeek, которая, по заявлениям авторов, рвёт DALL-E 3, Stable Diffusion XL и Stable Diffusion 3 (Medium) в бенчмарках.В этой статье я не буду дублировать новость, а хочу подробнее рассмотреть, что именно в этой модели такого уникального, из-за чего многие связанные с AI медиа сегодня захлебываются от восторга.
DeepSeek выпустила мультимодальную нейросеть Janus-Pro-7B
Китайская компания DeepSeek выпустила мультимодальную нейросеть Janus-Pro-7B. Она нужна для распознавания и генерации изображений. В бенчмарках нейросеть опережает DALL-E 3 от OpenAI и Stable Diffusion.
Революция в математическом мышлении малых языковых моделей с rStar-Math
Математическая революция глубокого мышления: как rStar-Math превращает небольшие языковые модели в мастера математических рассужденийАннотация
Хакатон «Цифровой прорыв»: как команда валидации Альфа-Банка разработала решение для РЖД
Привет, Хабр! На связи команда «Чёрная уточка» из управления валидации Альфа-Банка (Светлана Хлыбова, Сергей Комаров, Буда Вампилов, Камиль Шакиров и Алексей Безручко). И сегодня мы расскажем о нашем первом (да ещё и вполне успешном) опыте участия в Дальневосточном федеральном окружном хакатоне проекта «Цифровой прорыв. Сезон: Искусственный интеллект. 2024». Нам приглянулся кейс от РЖД на тему компьютерного зрения, в котором было необходимо научить компьютер выявлять технологические нарушения по видеозаписям.
DeepSeek и её модель рассуждений R1: что говорят эксперты и потребители
С тех пор как китайская компания DeepSeek, занимающаяся искусственным интеллектом, выпустила открытую версию своей модели рассуждений R1 в начале этой недели, многие представители технологической отрасли делают громкие заявления о том, чего добилась компания и что это значит для развития AI.
Используем HTTP API Gemini 2.0 thinking бесплатно
Давно не писал статей на хабр, потому что редко находится что-то действительно полезное.Я подписан в Telegram на десяток новостных каналов про ИИ, но только недавно с удивлением для себя обнаружил, что гугл даёт делать 1500 бесплатных запросов в сутки на свои модели Gemini, что вполне достаточно для создания прототипа или даже небольшого pet-проекта. Как по мне так это неплохой способ начать экспериментировать с gpt-моделями, при этом ничего не платить и не возиться с банковской картой.На ai.google.dev
Что такое интерпретируемость машинного обучения?
Насколько интерпретируемость важна для машинного обучения? Зачем она вообще нужна? Для чего она в информационной безопасности?Меня эти вопросы начали интересуют уже около полугода, и в фоновом режиме я собирал источники, читал исследования, и искал применимость этого направления для ИБ.Я Борис Захир, автор канала «Борис_ь с ml
Бизнес-проект: как я написал больше 500 рефератов с ClaudAI и ChatGPT, заработал 600.000 рублей
Ребята, вы издеваетесь? Я создал лучший сервис по написанию курсовых, а вы все еще не на Бали? На Ютубе уже миллионы видео по ИИ-организации магазинов на Shopify, нейросетевому прогреву аккаунтов под перегон трафика на ютубе, дизайну карточек на махровые носки с Озона…

