huggingface.

Higgsfield привлек $130 млн и стал единорогом на волне AI-генерации видео

продолжить чтение

Hugging Face запускает “чат со статьями” и меняет способ чтения науки

продолжить чтение

Hugging Face открыл бесплатный доступ к 11 курсам по ИИ перед новогодними праздниками

Платформа Hugging Face запустила подборку из 11 бесплатных образовательных курсов

продолжить чтение

GigaAM-v3: открытая SOTA-модель распознавания речи на русском

В прошлой статье мы рассказывали о GigaAM — семействе открытых акустических моделей для русского языка и их дообученных вариантах под распознавание речи и эмоций. Сейчас мы представляем GigaAM-v3 — новую версию модели, которая ещё сильнее поднимает планку качества open source-моделей распознавания речи (Automatic Speech Recognition, ASR) на русском языке.В этом посте расскажем:что такое HuBERT-CTC и почему он даёт прирост качества минимум 10 % даже по сравнению с распространёнными в индустрии методами предобучения;

продолжить чтение

«Господин Говорунъ: как я обучил маленькую модель разговаривать на дореформенном русском»

Немного контекстаПоследние месяцы мы в команде развиваем проект Manuscript OCR - открытую библиотеку, которая учит нейросети читать рукописные документы XIX века. Это сложный материал: дореформенная орфография, нестабильный почерк, архивные артефакты.Кому интересны технические детали - отдельная статья про Manuscript OCR уже есть на Хабре.Работая над этим проектом, я всё больше погружался в дореформенный язык: тестировал модели, прогонял страницы, сравнивал орфографические варианты. И в какой-то момент возник вполне естественный вопрос:

продолжить чтение

Краткий обзор 10 локальных UI для LLM

Если вы хотите поиграться с LLM у вас есть несколько вариантов: можно задействовать LLM через код, можно воспользоваться чатом одного из облачных провайдеров, а можно развернуть у себя UI-клиента для работы с LLM. Их довольно много. И функционал у них может сильно различаться. В самом простом виде есть только чат. У наиболее продвинутых есть встроенные базы знаний, работа с изображениями и много других функций.Ниже краткий обзор 9 таких клиентов (отсортированы по предпочтению автора):Open WebUILM StudioMsty StudioLibrechat

продолжить чтение

Tencent представила открытую ИИ-модель для генерации трёхмерных видео по картинке

Китайская компания Tencent презентовала открытую модель искусственного интеллекта HunyuanWorld-Voyager, способную генерировать видеоряд с эффектом трёхмерного пространства на основе одного изображения.

продолжить чтение

Gemini наступает на пятки ChatGPT: свежий топ AI-сервисов от Andreessen Horowitz

Не так давно венчурный фонд Andreessen Horowitz опубликовал пятое издание рейтинга Top 100 AI Apps. Главный вывод аналитиков — рынок генеративных приложений постепенно выходит на стадию равновесия. Новых имён в списке становится меньше: в веб-сегменте добавилось лишь 11 проектов, что заметно ниже мартовских показателей, тогда как в мобильном сегменте — 14. Эксперты связывают это с тем, что App Store активно очищает площадку от многочисленных клонов ChatGPT, освобождая место для оригинальных решений.

продолжить чтение

Как OpenAI передаёт ИИ «голос общества»: итоги коллективного эксперимента

продолжить чтение

LFM2-VL: компактный ИИ от Liquid AI, который помещается в смартфон

Компания Liquid AI представила LFM2-VL

продолжить чтение

123
Rambler's Top100