Нативная генерация изображений в GPT-4o: как получить доступ, примеры генерации и редактирования изображений
Когда Google представила Gemini 2.0 Flash
OpenAI позволяет создавать собственные изображения в ChatGPT
Компания OpenAI интегрировала возможности создания изображений непосредственно в ChatGPT, заменив предыдущую интеграцию с DALL-E. Новая система призвана обеспечивать более стабильные результаты и меньшее количество ограничений по контенту.Компания OpenAI начала внедрять
Как интегрировать Gemini 2.0 Flash в ваше веб-приложение
Как интегрировать редактирование изображений с помощью Gemini 2.0 Flash в ваше веб-приложение
Спикеры AiConf 2025 получат бонусы
Представьте недалёкое будущее. ИИ везде и во всём помогает человеку. Коллеги разговаривают в офисе перед обедом. Автоматическая кухня на основе их предпочтений, интенсивности тренировок, особенностей повседневной жизни и эмоционального состояния готовит им подходящий набор блюд. Виртуальные помощники отбирают и сообщают только нужные и полезные новости, а рабочие консультанты суммаризируют данные по проектам и выстраивают прогноз занятости и нагрузок. Коллеги ведут неспешный small talk, чтобы отвлечься от рабочего процесса.—
xAI запускает API для генерации изображений
Компания xAI Илона Маска, занимающаяся разработкой искусственного интеллекта, добавила в свой API возможности генерации изображений. На данный момент в API доступна только одна модель: «grok-2-image-1212». При наличии подписи модель может генерировать до 10 изображений за один запрос (ограничено пятью запросами в секунду) в формате JPG по цене $0,07 за изображение.
DiffSplat: генерация 3D-объектов с помощью диффузионных моделей изображений
Полезно было бы уметь генерировать по текстовому описанию не только картинки, а полноценный 3D-объект, который можно рассмотреть со всех сторон. Это открывает огромные возможности для дизайна, игр, виртуальной реальности. Однако генерация 3D-контента — задача непростая. Современные методы требуют огромных объемов данных для обучения и страдают от несогласованности между разными ракурсами.
5 причин, почему лучше не использовать ИИ-арт для своей статьи
Плох тот хабраюзер, который не мечтает написать пост. По крайней мере, так было до появления режима read&comment. Однако даже сейчас самые уважаемые люди на этом сайте — авторы, создатели контента (в идеале — качественного, но попытка тоже засчитывается). Сегодня поговорим о том, как сделать свои посты лучше. Или, по крайней мере, как не сделать хуже.
Gemini 2.0 Flash от Google теперь позволяет редактировать изображения с использованием естественного языка
Модель Gemini 2.0 Flash
Bria получает новое финансирование для моделей AI, обученных на лицензированных данных
Генераторы изображений на базе AI, которые находятся в центре ряда исков против компаний, занимающихся авторскими правами, часто обучаются на огромных объемах данных с публичных веб-сайтов. Большинство этих компаний утверждают, что доктрина добросовестного использования защищает их практику сбора данных и обучения. Но многие владельцы авторских прав не согласны.
Погружение в мир диффузионных моделей — путеводитель для новичков
Диффузионные модели перевернули мир генеративного искусственного интеллекта, вытеснив GAN'ы и вариационные автоэнкодеры. Но как они работают? Чем отличаются друг от друга? И как научиться их использовать?Эта статья — путеводитель для тех, кто хочет разобраться в диффузионных моделях с нуля. В ней вы найдете

