Как мы научили GigaChat слышать: погружение в аудиомодальность
В конце прошлого года мы рассказывали про эксперименты с аудиомодальностью GigaChat, эксклюзивно показывали стенд на нашей конференции. Теперь аудиомодальность GigaChat доступна всем — в веб-интерфейсе giga.chat и Telegram-боте!Сегодня мы расскажем, почему ушли от классической схемы ASR (Automatic Speech Recognition) + LLM и построили end-to-end модель, которая понимает речь; как устроена наша новая модель; на каких данных мы её обучали; и что из этого получилось.
Бинарная классификация одним простым искусственным нейроном. Личный опыт
Оказывается, всего одного простого искусственного нейрона достаточно, чтобы провести бинарную классификацию линейно-разделимого множества объектов. Исходные данныеВозьмем учебное множество "жуков" и "гусениц"
Чат-бот Perplexity стал доступен в WhatsApp
Разработчики нейропоисковика Perplexity запустили фирменного чат-бота в мессенджере WhatsApp. Он отвечает на вопросы пользователей, приводит источники к своим ответам и генерирует изображения. Чат-бот доступен бесплатно и работает в России.
Разработчики Devin выпустили DeepWiki — сервис, который превращает GitHub-репозитории в подробную документацию
Разработчики нейросети Devin, предназначенной для программистов, выпустили DeepWiki — нейросетевой инструмент, который генерирует подробную документацию на основе GitHub-репозиториев. Также в сервисе доступна функция Deep Research для поиска по данным проекта.
Медицинские, образовательные и IT-компании России подписали Кодекс этики в сфере ИИ
Ведущие российские медицинские организации, образовательные и исследовательские институты подписали Кодекс этики в сфере искусственного интеллекта, предназначенного для использования в медицине и здравоохранении. К соглашению также присоединились крупные IT-компании, включая «Сбер» и «Яндекс».
«Яндекс Браузер» научился передавать оригинальные голоса и интонации при переводе видео
«Яндекс Браузер» обновил перевод видео нового поколения. Теперь нейросети, которые задействуются в закадровом переводе, могут воспроизводить уникальные особенности голосов и интонации персонажей.Теперь видео на английском языке, обработанные «Яндекс Браузером», звучат так, будто герои свободно говорят по-русски. ИИ-модель, которая применяется в «Браузере», анализирует английскую речь, определяет тембр, ритм и интонации, а затем переносит их в перевод.
Хочешь умного агента? Научись оценивать его правильно
В середине 2024 года AI-агенты стали главной темой обсуждений в технологическом сообществе — с помощью них теперь выполняют множество задач от заказа ингредиентов для ужина до бронирования билетов и записи на прием к врачу. Затем появились вертикальные AI-агенты — узкоспециализированные системы, о которых заговорили как о потенциальной замене привычных SaaS-решений. Но по мере роста влияния агентов увеличиваются и риски, связанные с их преждевременным внедрением.
Microsoft сделала рекламу при помощи генеративного ИИ, и никто этого не заметил
Компания Microsoft сообщила, что создала минутную рекламу для своих устройств Surface Pro и Surface Laptop с использованием генеративного искусственного интеллекта. Но есть одна загвоздка: реклама была выпущена почти три месяца назад, и никто, похоже, не заметил элементов искусственного интеллекта.

