Обработка изображений. - страница 7

Qwen Image Edit — новый шаг к умному и смысловому редактированию фото

Компания Alibaba обновила свою модель Qwen для работы с изображениями, добавив в неё новые инструменты редактирования — теперь они охватывают как визуальные правки, так и семантические преобразования.

продолжить чтение

Самообучающаяся DINOv3✶ от Meta✶ обгоняет конкурентов в анализе изображений

продолжить чтение

X-Omni от Tencent бросает вызов GPT-4o в генерации изображений, опираясь на опенсорс

X‑Omni хорошо справляется с отрисовкой текста, хотя при длинных абзацах точность падает

продолжить чтение

Krea AI: подробный обзор нейросети для генерации изображений и видео по тексту

Доброго времени суток, «Хабр»!Сегодня мы поговорим о Krea AI — агрегаторе нейросетей, объединяющем популярные модели ИИ, что позволяет создавать и пошагово редактировать изображения и видео, строить сложные 3D‑сцены с помощью текстовых промтов и существенно повышать качество картинок или видеоматериалов.Здесь постараюсь раскрыть функциональность данного сервиса. Присаживайтесь удобнее, приступаем к статье.

продолжить чтение

Как изменить эмоции на фото с помощью нейросети онлайн бесплатно

Подробное руководство для начинающихЧто такое Multi-Expression Portrait Generator?Multi-Expression Portrait Generator - это специальный workflow (рабочий процесс) на платформе TensorArt, который позволяет изменять выражение лица на портретах с помощью искусственного интеллекта. Простыми словами: вы загружаете фотографию человека, а система может сделать его грустным, веселым, удивленным или изменить положение головы и глаз.Кому это нужно?Создателям контента — для генерации разных эмоций персонажейХудожникам — для экспериментов с выражениями лицГеймдизайнерам

продолжить чтение

Docling in Working with Texts, Languages, and Knowledge

Docling in Working with Texts, Languages, and KnowledgeHi everyone. In the context of our research project, we were solving the problem of automating academic submission workflows, which led us to discover a platform called Docling.Together, we explore the role of Docling in reshaping how research data can be represented, reused, and reasoned over in both human and machine-readable formats.

продолжить чтение

Microsoft добавила в Bing Image Creator бесплатный доступ к GPT-4o

Microsoft теперь предоставляет бесплатный доступ к GPT-4o через Bing Image Creator, позволяя каждому пользователю создавать изображения с помощью ИИ. Это та же технология, которую OpenAI интегрировала в ChatGPT в начале текущего года.

продолжить чтение

Российский ИИ для распознавания доступен на всех отечественных платформах. Завершено портирование на RISC-V

Ученые Smart Engines первыми в России перенесли передовые технологии распознавания штрихкодов, паспортов и других документов на микропроцессоры архитектуры RISC-V. Теперь системы компьютерного зрения доступны на всех без исключения отечественных и основных международных аппаратных платформах: Elbrus, RISC-V, MIPS (КОМДИВ), SPARC, х86, ARM. Это позволяет внедрить распознавание в различных областях – от интернета вещей до ракетостроения – и осуществлять его фактически на любом микроконтроллере, без необходимости в видеокартах и мощных процессорах.

продолжить чтение

Qwen выпустил генератор изображений с открытым кодом Qwen‑Image

Alibaba представила новую модель генерации изображений Qwen‑Image с открытым исходным кодом. Она доступна в чат-боте Qwen, а также на GitHub, Hugging Face и ModelScope.

продолжить чтение

Как я влюбилась в работу с нейросетями: Мой путь к промпт-инжинирингу

Привет, Хабр!Меня зовут Ольга, и я офис-менеджер в московской IT-компании. Каждое утро мы встречаемся с коллегами: я завариваю себе кофе на нашей кухне, и слышу со всех сторон слова «нейросети», «искусственный интеллект», «ассистенты». Чувствуешь себя гостем на чужой тусовке. 

продолжить чтение

1...5678910...15
Rambler's Top100