X‑Omni хорошо справляется с отрисовкой текста, хотя при длинных абзацах точность падает

Оставлено в

Krea AI: подробный обзор нейросети для генерации изображений и видео по тексту

Доброго времени суток, «Хабр»!Сегодня мы поговорим о Krea AI — агрегаторе нейросетей, объединяющем популярные модели ИИ, что позволяет создавать и пошагово редактировать изображения и видео, строить сложные 3D‑сцены с помощью текстовых промтов и существенно повышать качество картинок или видеоматериалов.Здесь постараюсь раскрыть функциональность данного сервиса. Присаживайтесь удобнее, приступаем к статье.

продолжить чтение

Оставлено в

Как изменить эмоции на фото с помощью нейросети онлайн бесплатно

Подробное руководство для начинающихЧто такое Multi-Expression Portrait Generator?Multi-Expression Portrait Generator - это специальный workflow (рабочий процесс) на платформе TensorArt, который позволяет изменять выражение лица на портретах с помощью искусственного интеллекта. Простыми словами: вы загружаете фотографию человека, а система может сделать его грустным, веселым, удивленным или изменить положение головы и глаз.Кому это нужно?Создателям контента — для генерации разных эмоций персонажейХудожникам — для экспериментов с выражениями лицГеймдизайнерам

продолжить чтение

Оставлено в

Docling in Working with Texts, Languages, and Knowledge

Docling in Working with Texts, Languages, and KnowledgeHi everyone. In the context of our research project, we were solving the problem of automating academic submission workflows, which led us to discover a platform called Docling.Together, we explore the role of Docling in reshaping how research data can be represented, reused, and reasoned over in both human and machine-readable formats.

продолжить чтение

Оставлено в

Microsoft добавила в Bing Image Creator бесплатный доступ к GPT-4o

Microsoft теперь предоставляет бесплатный доступ к GPT-4o через Bing Image Creator, позволяя каждому пользователю создавать изображения с помощью ИИ. Это та же технология, которую OpenAI интегрировала в ChatGPT в начале текущего года.

продолжить чтение

Оставлено в

Российский ИИ для распознавания доступен на всех отечественных платформах. Завершено портирование на RISC-V

Ученые Smart Engines первыми в России перенесли передовые технологии распознавания штрихкодов, паспортов и других документов на микропроцессоры архитектуры RISC-V. Теперь системы компьютерного зрения доступны на всех без исключения отечественных и основных международных аппаратных платформах: Elbrus, RISC-V, MIPS (КОМДИВ), SPARC, х86, ARM. Это позволяет внедрить распознавание в различных областях – от интернета вещей до ракетостроения – и осуществлять его фактически на любом микроконтроллере, без необходимости в видеокартах и мощных процессорах.

продолжить чтение

Оставлено в

Qwen выпустил генератор изображений с открытым кодом Qwen‑Image

Alibaba представила новую модель генерации изображений Qwen‑Image с открытым исходным кодом. Она доступна в чат-боте Qwen, а также на GitHub, Hugging Face и ModelScope.

продолжить чтение

Оставлено в

Как я влюбилась в работу с нейросетями: Мой путь к промпт-инжинирингу

Привет, Хабр!Меня зовут Ольга, и я офис-менеджер в московской IT-компании. Каждое утро мы встречаемся с коллегами: я завариваю себе кофе на нашей кухне, и слышу со всех сторон слова «нейросети», «искусственный интеллект», «ассистенты». Чувствуешь себя гостем на чужой тусовке.

продолжить чтение

Оставлено в

Как писать промт для генерации изображения-видео и получить лучший результат?

Вслед за текстовыми нейросетями появились модели, которые могут генерировать фотографии и видео. Что одно, что другое — инструмент, которым нужно уметь управлять. Сегодня разберем вопрос: как правильно писать промт для успешной генерации изображения или видео?Кстати, в своей предыдущей статье я рассказывал о промтах для текстовых моделей, если вам интересно — можете глянуть тут.Занимайте позицию поудобнее, наливайте чай или кофе, если вы его больше предпочитаете, ну а я начну свое повествование.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Обработка изображений.

Самообучающаяся DINOv3✶ от Meta✶ обгоняет конкурентов в анализе изображений

X-Omni от Tencent бросает вызов GPT-4o в генерации изображений, опираясь на опенсорс

Krea AI: подробный обзор нейросети для генерации изображений и видео по тексту

Как изменить эмоции на фото с помощью нейросети онлайн бесплатно

Docling in Working with Texts, Languages, and Knowledge

Microsoft добавила в Bing Image Creator бесплатный доступ к GPT-4o

Российский ИИ для распознавания доступен на всех отечественных платформах. Завершено портирование на RISC-V

Qwen выпустил генератор изображений с открытым кодом Qwen‑Image

Как я влюбилась в работу с нейросетями: Мой путь к промпт-инжинирингу

Как писать промт для генерации изображения-видео и получить лучший результат?

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

Обработка изображений.