Сообщается, что Nvidia приобретает стартап по синтетическим данным Gretel
Сообщается, что Nvidia приобрела Gretel, стартап из Сан-Диего, который разработал платформу для генерации данных для обучения искусственного интеллекта. Условия приобретения неизвестны. Сообщается, что цена составит девятизначную сумму, что превышает последнюю оценку Gretel в 320 миллионов долларов, согласно Wired.
SoftBank приобретает разработчика полупроводников Ampere за $6,5 млрд
Японский холдинг объявил о приобретении компании-разработчика микросхем Ampere Computing за $6,5 млрд как часть инициативы по расширению инвестиций в инфраструктуру искусственного интеллекта. В приобретаемой компании работают около 1 тыс. высококвалифицированных инженеров по полупроводникам.
Open-Sora 2.0: новая система в видео-AI снижает стоимость обучения при сохранении качества
Компания HPC-AI Tech разработала новую систему видео искусственного интеллекта, которая позволяет достичь качества коммерческого уровня примерно за одну десятую от типичной стоимости обучения за счет использования новых методов сжатия.Хотя
Влияние LLM на людей, процессы, продукты и общество в разработке ПО: исследование с ранними пользователями
В начале марта вышло любопытное исследование от PhD студентов in Computer Science университета Северной Каролины: «Влияние больших языковых моделей на людей, процессы, продукты и общество в разработке программного обеспечения: комплексное исследование с ранними пользователями».Исследование базируется на 16 глубинных интервью разработчиков – ранних адептов LLM. Структура организована вокруг четырёх измерений – разработчики, процессы, продукты и общество и посвященно влиянию больших языковых моделей (LLMs) — таких как ChatGPT, Gemini и GitHub Copilot — на разработку программного обеспечения.
Неблокирующий вызов внешнего сервиса в процессе
Довольно часто из процесса приходится обращаться по API к различным внешним сервисам. По сути, это стандартный сценарий оркестрации систем или даже микросервисов (пардон за модное слово). На BPMN диаграмме это выглядит просто и логично – постучались куда-то по API, получили ответ и перешли к следующей задаче. Для моделей аналитического уровня это нормально.
Поиск с использованием ИИ начинает убивать «десять синих ссылок» Google
Модели искусственного интеллекта меняют мышление пользователей интернета: все чаще люди обращаются к поиску информации с помощью генеративного ИИ, и такой метод поиска вытесняет классические «десять синих ссылок» Google и других поисковиков,
O1-pro от OpenAI — самая дорогая модель искусственного интеллекта компании на сегодняшний день
Компания OpenAI выпустила более мощную версию своей модели искусственного интеллекта «разума» o1, o1-pro, в своем API для разработчиков. По данным OpenAI, o1-pro использует больше вычислений, чем o1, чтобы постоянно предоставлять лучшие ответы. В настоящее время он доступен только избранным разработчикам — тем, кто потратил не менее 5 долларов на услуги API OpenAI.
SoftBank приобретает Ampere за $6,5 млрд
В среду SoftBank Group объявила о приобретении Ampere Computing, разработчика микросхем, основанного бывшим руководителем Intel Рене Джеймс, в рамках сделки на сумму $6,5 млрд в качестве стратегического шага по расширению инвестиций в инфраструктуру искусственного интеллекта. После сделки, закрытие которой ожидается во второй половине 2025 года, Ampere будет функционировать как дочерняя компания SoftBank, полностью принадлежащая ей.
Reasoning-LLM: архитектура и обзор передовых моделей
Reasoning-LLM — это большие языковые модели, нацеленные на логическое рассуждение при решении сложных задач. В отличие от обычных LLM, которые часто выдавали ответы сразу, такие модели способны «думать» пошагово — как человек, анализируя задачу и выстраивая цепочку вывода. Появление reasoning-LLM связано с тем, что традиционные LLM (например, GPT-4 или Llama 3.1) хотя и хорошо справляются с языковыми и энциклопедическими запросами, нередко ошибались в задачах, требующих сложных вычислений, планирования или логического вывода. В этой статье мы подробно разберем, как работают reasoning-LLM, их внутреннее устройство (Transformer, self-attention, механизмы «мышления»). А еще — рассмотрим передовые модели (OpenAI o1, DeepSeek R1 и Claude 3.7 Sonnet), факторы, влияющие на их точность, и дадим практические рекомендации по применению.
Pruna AI создает свой фреймворк оптимизации открытым исходным кодом
Pruna AI, европейский стартап, работающий над алгоритмами сжатия для моделей искусственного интеллекта, создает свой фреймворк оптимизации открытым исходным кодом.
