Foundation Models.

GigaAM-v3: открытая SOTA-модель распознавания речи на русском

В прошлой статье мы рассказывали о GigaAM — семействе открытых акустических моделей для русского языка и их дообученных вариантах под распознавание речи и эмоций. Сейчас мы представляем GigaAM-v3 — новую версию модели, которая ещё сильнее поднимает планку качества open source-моделей распознавания речи (Automatic Speech Recognition, ASR) на русском языке.В этом посте расскажем:что такое HuBERT-CTC и почему он даёт прирост качества минимум 10 % даже по сравнению с распространёнными в индустрии методами предобучения;

продолжить чтение

Вышла библиотека Any Language Model, с её помощью можно использовать любые LLM в Foundation Models

Разработчик Мэтт Тиссен (Matt Thiessen) выпустил библиотеку Any Language Model для Swift. Она полностью совместима со стандартной Foundation Models, и с ней можно использовать любые LLM, а не только решения от Apple.

продолжить чтение

Apple продолжает терять ведущих инженеров в сфере AI

продолжить чтение

Новый фреймворк Apple Foundation Models добавляет в приложения ИИ с помощью трёх строк кода на Swift

Apple представляет новые инструменты ИИ для разработчиков, встраивая генеративные модели непосредственно в Xcode и приложения для iOS с упором на конфиденциальность и контроль со стороны пользователя.

продолжить чтение

Rambler's Top100