модели. - страница 2

Андрей Карпатый представил nanochat — проект полного цикла создания LLM всего за 100 долларов

ML-инженер и бывший разработчик OpenAI Андрей Карпатый представил nanochat — это открытый проект полного цикла создания LLM. Обучение модели обойдётся примерно в 100 долларов, если арендовать мощности у облачного провайдера.

продолжить чтение

Исчезнувший агент

Вот так Алиса нарисовала ситуацию. Недавно прошла конференция Яндекса по ИИ и облачным технологиям. Впечатлила работа с AI Studio, демонстрирующая возможность создавать агентов "на лету", даже не используя программирования.

продолжить чтение

Web Agent: автономная ИИ-экосистема от Alibaba — новый этап развития веб-агентов

Индустрия искусственного интеллекта продолжает удивлять инновационными решениями, и появление Web Agent от лаборатории Alibaba NLP's Tawni Lab представляет собой значительный шаг вперед в области автономных систем. Данная экосистема демонстрирует качественно новый подход к созданию ИИ-агентов, способных самостоятельно навигировать, анализировать и действовать в веб-пространстве.Архитектурная революция в мире веб-агентов

продолжить чтение

SLAVA — бенчмарк социально‑политического ландшафта и ценностного анализа

Большой обзор: от идеи и структуры — до неожиданных выводов и практических сценариев применения SLAVA — это открытый русскоязычный бенчмарк, разработанный экспертами РАНХиГС и ИСП РАН для проверки, как большие языковые модели справляются с фактологическими и ценностно нагруженными вопросами по истории, обществознанию, географии и политологии. 

продолжить чтение

ML-обработка видео в web-браузере для видеоконференций SaluteJazz

Нейросеть, сегментирующая изображение человека в кадре: как ускорить её в четыре раза? Привет, Хабр! Это Дмитрий Балиев из SberDevices. В этой статье, написанной по докладу с речь пойдёт о том, как мы обрабатываем алгоритмами видео в Web-браузерах для сервиса конференции SaluteJazz.Расскажу про контекст и ограничения, сам движок и особенности его реализации. Раскрою тайну, как мы работаем с графами вычислений, как инферим нейросети, и как затем всё это собираем, оптимизируем и тестируем. В конце — несколько полезных советов, как делать нейросети удобнее для встраивания.

продолжить чтение

Nari Labs выпустила компактную модель Dia для генерации диалогов из текста

Разработчики Nari Labs выпустили компактную нейросеть Dia для генерации диалогов из текста. Также пользователи могут управлять эмоциями собеседников и невербальной коммуникацией: смехом, кашлем и вздохами.

продолжить чтение

Disrupt по делу: как внедрять AI-продукты без розовых очков — опыт продакшена

Как не утонуть в инновациях: от стабильного AI-продакшена до смелых прорывов.

продолжить чтение

«Ошибка на миллиард» в ИИ: боремся с галлюцинациями в LLM по аналогии с NullPointerException

Привет! Меня зовут Денис Березуцкий, я старший инженер по разработке ПО искусственного интеллекта в YADRO. В ML-команде мы разрабатываем системы, которые облегчают работу нашим заказчикам с помощью текстовых генеративных нейросетей: реализуем

продолжить чтение

Пайплайн каскадных онлайн-моделей: как не запутаться в модулях и обрести дзен при внедрении многомодульных моделей

Привет, Хабр! На связи команда ML-инженеров из Департамента продвинутой аналитики Альфа-Банка (Лазаричева Екатерина, Дмитрий Гончаров, Николай Рябков, Илья Мясников и Асадян Гевонд), а также наши замечательные коллеги из «Глоубайт» (Альфия Харламова, Ростислав Изимов, Александр Малиновский

продолжить чтение

Распознавание текста в банке: трудности и решения

Привет, Хабр. Я Александр Иванов, техлид команды компьютерного зрения. У любого банка очень много задач, связанных с документами. Особенно важна задача по оцифровке. Ее можно решить, скормив скан мощной мультимодальной LLM, но это работает не всегда. Поэтому мы разрабатываем специализированные решения по оцифровке разных текстов, о чем я и расскажу.

продолжить чтение

Rambler's Top100