elevenlabs.

Монтаж видео через Claude Code

Разбираю архитектуру открытого проекта от browser-use: как заставить LLM монтировать без необходимости «смотреть» видеоКогда речь заходит про обработку видео нейросетями, у большинства из нас в голове всплывает одна и та же картина: модель смотрит на кадры, что-то понимает на основе изображения, режет по визуальным признакам. На практике это упирается в простую арифметику. Часовое видео в 30 fps — это 108 000 кадров. Если каждый кадр стоит хотя бы 1500 токенов, получаем 162 миллиона токенов на одно видео. Никакая модель столько не возьмёт за один проход, а если резать на куски — теряется глобальный контекст.

продолжить чтение

Люди скупают Mac Mini M4, а SpaceX покупает Cursor за $60 млрд: ML-дайджест

продолжить чтение

Голосовой агент — это не чатбот с телефоном: 40 часов экономии и $100, сожженные на ботах

Я однажды примерно за сутки сжег около $100 на голосовом агенте.Не на большом запуске. Не на огромной базе. Не на хитрой рекламной кампании. Просто на небольшом пуле холодных контактов, где агент периодически попадал на voicemail, IVR, секретарей и других ботов.В какой-то момент два не очень умных голосовых процесса могли довольно долго вежливо говорить друг другу что-то в духе:Здравствуйте.Здравствуйте, чем могу помочь?Я звоню, чтобы…Здравствуйте, чем могу помочь?Конечно, подскажите, пожалуйста…

продолжить чтение

Я протестировал 30+ голосовых AI-движков и собрал переводчик быстрее Google Meet. Бенчмарки, цены, грабли

30+ движков за две недели, реальные замеры на Apple M4, и почему ElevenLabs за $5.57/час - это приговор для бизнесаСижу на очередном рабочем созвоне. Обсуждаем архитектуру нового сервиса. Технически я всё понимаю - документацию на английском читаю без словаря, код ревьюю, в слаке переписываюсь нормально. А вот когда надо открыть рот и сказать что-то сложнее "I agree" - начинается цирк. Пауза. Подбираю слова. Коллега уже ответил за меня.Знакомо?

продолжить чтение

Elevenlabs запустил маркетплейс AI-музыки

ElevenLabs запустила маркетплейс музыки, где пользователи могут публиковать и продавать треки, созданные с помощью музыкальной ИИ-модели ElevenCreative.

продолжить чтение

ElevenLabs выпустила крупное обновление ElevenAgents

Новый режим Expressive Mode позволяет ботам динамически управлять интонацией и эмоциональной окраской речи. Теперь агент может адаптироваться под собеседника в реальном времени: говорить мягче и спокойнее в напряжённой ситуации или, наоборот, добавить уверенности и темпа, когда нужно донести информацию максимально ясно.

продолжить чтение

ElevenLabs выпустила в релиз модель v3

Флагманская Text-to-Speech модель Eleven v3 официально вышла из стадии альфа-тестирования и стала доступной для коммерческого использования. Основной упор в финальной версии сделан на точность интерпретации сложных данных, где чтение символов критически зависит от окружения.

продолжить чтение

ElevenLabs выпустила сгенерированный ИИ музыкальный альбом ради рекламы

ElevenLabs выпустила музыкальный альбом, сгенерированный искусственным интеллектом. Как отметили в компании, альбом Eleven призван продемонстрировать, «как артисты могут использовать ИИ для расширения своего творческого диапазона, сохраняя при этом полные авторские и коммерческие права».

продолжить чтение

ElevenLabs готовится к новому раунду при оценке $11 млрд

продолжить чтение

Кейс: НейроДудь

Осенью я давал интервью для документального фильма Высшей школы экономики "После промпта". В сам фильм попал небольшой фрагмент, и я долго думал что делать с остальным материалом. Так появился НейроДудь.ВК версияЕсли не считать монтажа самого интервью, работа над роликом заняла около трёх дней. Расскажу о ключевых этапах.Визуал

продолжить чтение

123