аудио.

Google представила умные очки с доступом к ИИ

На конференции Google I/O компания объявила о партнёрстве с Warby Parker и Gentle Monster для производства новой линейки очков с поддержкой искусственного интеллекта. Они позиционируются как «аудиоочки», которые воспринимают голосовые команды и позволяют выполнять действия через экосистему приложений и сервисов, включая Gemini.

продолжить чтение

Оставлено в

В России запустили бесплатный сервис для проверки дипфейков

Компания «Архитех ИИ» представила KodikScan

продолжить чтение

Оставлено в

Нейросеть для аудио: Топ-4 нейросетей для генерации аудио

Аудиомодели за последние пару лет заметно разошлись в разные стороны.Под одним и тем же термином «генерация аудио» сейчас скрываются как минимум два разных класса задач:

продолжить чтение

Оставлено в

Как я написал Qt-приложение, почти не написав код

Всё началось с эксперимента. На основной работе руководство довольно настойчиво рекомендовало использовать ИИ в разработке. В какой-то момент мне стало интересно, насколько далеко можно зайти в этом направлении. Можно ли написать реальное десктопное приложение так, чтобы основную часть кода писал ИИ?Не в смысле «иногда подсказать синтаксис» или «помочь найти ошибку». А именно в буквальном смысле — чтобы код писал ИИ, а человек формулировал задачи и проверял результат.

продолжить чтение

Оставлено в

Gen-A стала первой отечественной платформой в России для нейросетевого улучшения видео, фото и аудио

продолжить чтение

Оставлено в

Как мы разрабатывали интеллектуальное устройство SberBoom Micro

Салют, Хабр!

продолжить чтение

Оставлено в

Microsoft выпустила VibeVoice — открытую TTS-модель для генерации диалогов и подкастов продолжительностью до 90 минут

Исследователи Microsoft Research представили VibeVoice — модель для генерации диалогов из текста. Главная особенность TTS-системы в том, что она может создавать диалоги продолжительностью до 90 минут с четырьмя действующими лицами.

продолжить чтение

Оставлено в

Google Docs теперь читает документы вслух с помощью Gemini

В Google Docs появилась функция воспроизведения написанного через помощника на базе искусственного интеллекта Gemini. Можно выбирать разные голоса и скорость воспроизведения.

продолжить чтение

Оставлено в

Google внедрила функцию создания иллюстрированных книг в Gemini

Новейшая функция ИИ-приложения Google Gemini позволяет создавать персонализированные иллюстрированные сборники рассказов с озвучкой для детей. Искусственному интеллекту можно поручить создание любой истории на основе текстового запроса. В качестве «вдохновения» для рассказов ИИ способен использовать фотографии, изображения и файлы пользователя.

продолжить чтение

Оставлено в

Как телеграм-каналы похоронят новостное радио

Да, теперь телеграм-каналы можно слушать. В дороге, на тренировке, вместе с другими делами. И без ИИ здесь, конечно же, не обошлось.Контента много, а времени мало

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

аудио.

Google представила умные очки с доступом к ИИ

В России запустили бесплатный сервис для проверки дипфейков

Нейросеть для аудио: Топ-4 нейросетей для генерации аудио

Как я написал Qt-приложение, почти не написав код

Gen-A стала первой отечественной платформой в России для нейросетевого улучшения видео, фото и аудио

Как мы разрабатывали интеллектуальное устройство SberBoom Micro

Microsoft выпустила VibeVoice — открытую TTS-модель для генерации диалогов и подкастов продолжительностью до 90 минут

Google Docs теперь читает документы вслух с помощью Gemini

Google внедрила функцию создания иллюстрированных книг в Gemini

Как телеграм-каналы похоронят новостное радио

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

аудио.