Машинное обучение. - страница 313

Почему DeepSeek Janus-7B — это нечто действительно невероятное

Полчаса назад вышла новость о выходе DeepSeek Janus-7B - новой мультимодальной модели от DeepSeek, которая, по заявлениям авторов, рвёт DALL-E 3, Stable Diffusion XL и Stable Diffusion 3 (Medium) в бенчмарках.В этой статье я не буду дублировать новость, а хочу подробнее рассмотреть, что именно в этой модели такого уникального, из-за чего многие связанные с AI медиа сегодня захлебываются от восторга.

продолжить чтение

DeepSeek выпустила мультимодальную нейросеть Janus-Pro-7B

Китайская компания DeepSeek выпустила мультимодальную нейросеть Janus-Pro-7B. Она нужна для распознавания и генерации изображений. В бенчмарках нейросеть опережает DALL-E 3 от OpenAI и Stable Diffusion.

продолжить чтение

Революция в математическом мышлении малых языковых моделей с rStar-Math

Математическая революция глубокого мышления: как rStar-Math превращает небольшие языковые модели в мастера математических рассужденийАннотация

продолжить чтение

Хакатон «Цифровой прорыв»: как команда валидации Альфа-Банка разработала решение для РЖД

Привет, Хабр! На связи команда «Чёрная уточка» из управления валидации Альфа-Банка (Светлана Хлыбова, Сергей Комаров, Буда Вампилов, Камиль Шакиров и Алексей Безручко). И сегодня мы расскажем о нашем первом (да ещё и вполне успешном) опыте участия в Дальневосточном федеральном окружном хакатоне проекта «Цифровой прорыв. Сезон: Искусственный интеллект. 2024». Нам приглянулся кейс от РЖД на тему компьютерного зрения, в котором было необходимо научить компьютер выявлять технологические нарушения по видеозаписям.

продолжить чтение

DeepSeek и её модель рассуждений R1: что говорят эксперты и потребители

С тех пор как китайская компания DeepSeek, занимающаяся искусственным интеллектом, выпустила открытую версию своей модели рассуждений R1 в начале этой недели, многие представители технологической отрасли делают громкие заявления о том, чего добилась компания и что это значит для развития AI.

продолжить чтение

Промпт-инжиниринг: как разговаривать с нейросетью на одном языке

продолжить чтение

Используем HTTP API Gemini 2.0 thinking бесплатно

Давно не писал статей на хабр, потому что редко находится что-то действительно полезное.Я подписан в Telegram на десяток новостных каналов про ИИ, но только недавно с удивлением для себя обнаружил, что гугл даёт делать 1500 бесплатных запросов в сутки на свои модели Gemini, что вполне достаточно для создания прототипа или даже небольшого pet-проекта. Как по мне так это неплохой способ начать экспериментировать с gpt-моделями, при этом ничего не платить и не возиться с банковской картой.На ai.google.dev

продолжить чтение

Что такое интерпретируемость машинного обучения?

Насколько интерпретируемость важна для машинного обучения? Зачем она вообще нужна? Для чего она в информационной безопасности?Меня эти вопросы начали интересуют уже около полугода, и в фоновом режиме я собирал источники, читал исследования, и искал применимость этого направления для ИБ.Я Борис Захир, автор канала «Борис_ь с ml

продолжить чтение

Исследование: нейросеть Devin, которую позиционируют как «ИИ-программиста», плохо справляется со своей работой

продолжить чтение

Бизнес-проект: как я написал больше 500 рефератов с ClaudAI и ChatGPT, заработал 600.000 рублей

Ребята, вы издеваетесь? Я создал лучший сервис по написанию курсовых, а вы все еще не на Бали? На Ютубе уже миллионы видео по ИИ-организации магазинов на Shopify, нейросетевому прогреву аккаунтов под перегон трафика на ютубе, дизайну карточек на махровые носки с Озона… 

продолжить чтение

Rambler's Top100