аудио.

Google представила умные очки с доступом к ИИ

На конференции Google I/O компания объявила о партнёрстве с Warby Parker и Gentle Monster для производства новой линейки очков с поддержкой искусственного интеллекта. Они позиционируются как «аудиоочки», которые воспринимают голосовые команды и позволяют выполнять действия через экосистему приложений и сервисов, включая Gemini. 

продолжить чтение

В России запустили бесплатный сервис для проверки дипфейков

Компания «Архитех ИИ» представила KodikScan

продолжить чтение

Нейросеть для аудио: Топ-4 нейросетей для генерации аудио

Аудиомодели за последние пару лет заметно разошлись в разные стороны.Под одним и тем же термином «генерация аудио» сейчас скрываются как минимум два разных класса задач:

продолжить чтение

Как я написал Qt-приложение, почти не написав код

Всё началось с эксперимента. На основной работе руководство довольно настойчиво рекомендовало использовать ИИ в разработке. В какой-то момент мне стало интересно, насколько далеко можно зайти в этом направлении. Можно ли написать реальное десктопное приложение так, чтобы основную часть кода писал ИИ?Не в смысле «иногда подсказать синтаксис» или «помочь найти ошибку». А именно в буквальном смысле — чтобы код писал ИИ, а человек формулировал задачи и проверял результат.

продолжить чтение

Gen-A стала первой отечественной платформой в России для нейросетевого улучшения видео, фото и аудио

продолжить чтение

Как мы разрабатывали интеллектуальное устройство SberBoom Micro

Салют, Хабр!

продолжить чтение

Microsoft выпустила VibeVoice — открытую TTS-модель для генерации диалогов и подкастов продолжительностью до 90 минут

Исследователи Microsoft Research представили VibeVoice — модель для генерации диалогов из текста. Главная особенность TTS-системы в том, что она может создавать диалоги продолжительностью до 90 минут с четырьмя действующими лицами.

продолжить чтение

Google Docs теперь читает документы вслух с помощью Gemini

В Google Docs появилась функция воспроизведения написанного через помощника на базе искусственного интеллекта Gemini. Можно выбирать разные голоса и скорость воспроизведения.

продолжить чтение

Google внедрила функцию создания иллюстрированных книг в Gemini

Новейшая функция ИИ-приложения Google Gemini позволяет создавать персонализированные иллюстрированные сборники рассказов с озвучкой для детей. Искусственному интеллекту можно поручить создание любой истории на основе текстового запроса. В качестве «вдохновения» для рассказов ИИ способен использовать фотографии, изображения и файлы пользователя.

продолжить чтение

Как телеграм-каналы похоронят новостное радио

Да, теперь телеграм-каналы можно слушать. В дороге, на тренировке, вместе с другими делами. И без ИИ здесь, конечно же, не обошлось.Контента много, а времени мало

продолжить чтение

12