Обзор мировых AI-платформ на конец марта 2025 (сгруппировано по странам и категориям) + ссылки на официальные сайты
США1. Генеративные AI (NLP, текст, изображения)OpenAI – https://openai.comСайт: https://openai.comМодели: ChatGPT, GPT-4, DALL-E.Особенности: Лидер в генеративном ИИ, высокая точность в обработке естественного языка и генерации текста.Применение: Чат-боты, генерация контента, создание изображений.Установка: Через API (платно) или облачные сервисы.Преимущества: Высокое качество генерации, широкий спектр применений.Недостатки
xAI запускает API для генерации изображений
Компания xAI Илона Маска, занимающаяся разработкой искусственного интеллекта, добавила в свой API возможности генерации изображений. На данный момент в API доступна только одна модель: «grok-2-image-1212». При наличии подписи модель может генерировать до 10 изображений за один запрос (ограничено пятью запросами в секунду) в формате JPG по цене $0,07 за изображение.
Сообщается, что Nvidia приобретает стартап по синтетическим данным Gretel
Сообщается, что Nvidia приобрела Gretel, стартап из Сан-Диего, который разработал платформу для генерации данных для обучения искусственного интеллекта. Условия приобретения неизвестны. Сообщается, что цена составит девятизначную сумму, что превышает последнюю оценку Gretel в 320 миллионов долларов, согласно Wired.
SoftBank приобретает разработчика полупроводников Ampere за $6,5 млрд
Японский холдинг объявил о приобретении компании-разработчика микросхем Ampere Computing за $6,5 млрд как часть инициативы по расширению инвестиций в инфраструктуру искусственного интеллекта. В приобретаемой компании работают около 1 тыс. высококвалифицированных инженеров по полупроводникам.
Open-Sora 2.0: новая система в видео-AI снижает стоимость обучения при сохранении качества
Компания HPC-AI Tech разработала новую систему видео искусственного интеллекта, которая позволяет достичь качества коммерческого уровня примерно за одну десятую от типичной стоимости обучения за счет использования новых методов сжатия.Хотя
Влияние LLM на людей, процессы, продукты и общество в разработке ПО: исследование с ранними пользователями
В начале марта вышло любопытное исследование от PhD студентов in Computer Science университета Северной Каролины: «Влияние больших языковых моделей на людей, процессы, продукты и общество в разработке программного обеспечения: комплексное исследование с ранними пользователями».Исследование базируется на 16 глубинных интервью разработчиков – ранних адептов LLM. Структура организована вокруг четырёх измерений – разработчики, процессы, продукты и общество и посвященно влиянию больших языковых моделей (LLMs) — таких как ChatGPT, Gemini и GitHub Copilot — на разработку программного обеспечения.
Поиск с использованием ИИ начинает убивать «десять синих ссылок» Google
Модели искусственного интеллекта меняют мышление пользователей интернета: все чаще люди обращаются к поиску информации с помощью генеративного ИИ, и такой метод поиска вытесняет классические «десять синих ссылок» Google и других поисковиков,
O1-pro от OpenAI — самая дорогая модель искусственного интеллекта компании на сегодняшний день
Компания OpenAI выпустила более мощную версию своей модели искусственного интеллекта «разума» o1, o1-pro, в своем API для разработчиков. По данным OpenAI, o1-pro использует больше вычислений, чем o1, чтобы постоянно предоставлять лучшие ответы. В настоящее время он доступен только избранным разработчикам — тем, кто потратил не менее 5 долларов на услуги API OpenAI.
SoftBank приобретает Ampere за $6,5 млрд
В среду SoftBank Group объявила о приобретении Ampere Computing, разработчика микросхем, основанного бывшим руководителем Intel Рене Джеймс, в рамках сделки на сумму $6,5 млрд в качестве стратегического шага по расширению инвестиций в инфраструктуру искусственного интеллекта. После сделки, закрытие которой ожидается во второй половине 2025 года, Ampere будет функционировать как дочерняя компания SoftBank, полностью принадлежащая ей.
Reasoning-LLM: архитектура и обзор передовых моделей
Reasoning-LLM — это большие языковые модели, нацеленные на логическое рассуждение при решении сложных задач. В отличие от обычных LLM, которые часто выдавали ответы сразу, такие модели способны «думать» пошагово — как человек, анализируя задачу и выстраивая цепочку вывода. Появление reasoning-LLM связано с тем, что традиционные LLM (например, GPT-4 или Llama 3.1) хотя и хорошо справляются с языковыми и энциклопедическими запросами, нередко ошибались в задачах, требующих сложных вычислений, планирования или логического вывода. В этой статье мы подробно разберем, как работают reasoning-LLM, их внутреннее устройство (Transformer, self-attention, механизмы «мышления»). А еще — рассмотрим передовые модели (OpenAI o1, DeepSeek R1 и Claude 3.7 Sonnet), факторы, влияющие на их точность, и дадим практические рекомендации по применению.

