BrainTools - Методики для развития мозга

Сообщается, что Nvidia приобретает стартап по синтетическим данным Gretel

Сообщается, что Nvidia приобрела Gretel, стартап из Сан-Диего, который разработал платформу для генерации данных для обучения искусственного интеллекта. Условия приобретения неизвестны. Сообщается, что цена составит девятизначную сумму, что превышает последнюю оценку Gretel в 320 миллионов долларов, согласно Wired.

продолжить чтение

Оставлено в

SoftBank приобретает разработчика полупроводников Ampere за $6,5 млрд

Японский холдинг объявил о приобретении компании-разработчика микросхем Ampere Computing за $6,5 млрд как часть инициативы по расширению инвестиций в инфраструктуру искусственного интеллекта. В приобретаемой компании работают около 1 тыс. высококвалифицированных инженеров по полупроводникам.

продолжить чтение

Оставлено в

Open-Sora 2.0: новая система в видео-AI снижает стоимость обучения при сохранении качества

Компания HPC-AI Tech разработала новую систему видео искусственного интеллекта, которая позволяет достичь качества коммерческого уровня примерно за одну десятую от типичной стоимости обучения за счет использования новых методов сжатия.Хотя

продолжить чтение

Оставлено в

Влияние LLM на людей, процессы, продукты и общество в разработке ПО: исследование с ранними пользователями

В начале марта вышло любопытное исследование от PhD студентов in Computer Science университета Северной Каролины: «Влияние больших языковых моделей на людей, процессы, продукты и общество в разработке программного обеспечения: комплексное исследование с ранними пользователями».Исследование базируется на 16 глубинных интервью разработчиков – ранних адептов LLM. Структура организована вокруг четырёх измерений – разработчики, процессы, продукты и общество и посвященно влиянию больших языковых моделей (LLMs) — таких как ChatGPT, Gemini и GitHub Copilot — на разработку программного обеспечения.

продолжить чтение

Оставлено в

Неблокирующий вызов внешнего сервиса в процессе

Довольно часто из процесса приходится обращаться по API к различным внешним сервисам. По сути, это стандартный сценарий оркестрации систем или даже микросервисов (пардон за модное слово). На BPMN диаграмме это выглядит просто и логично – постучались куда-то по API, получили ответ и перешли к следующей задаче. Для моделей аналитического уровня это нормально.

продолжить чтение

Оставлено в

Поиск с использованием ИИ начинает убивать «десять синих ссылок» Google

Модели искусственного интеллекта меняют мышление пользователей интернета: все чаще люди обращаются к поиску информации с помощью генеративного ИИ, и такой метод поиска вытесняет классические «десять синих ссылок» Google и других поисковиков,

продолжить чтение

Оставлено в

O1-pro от OpenAI — самая дорогая модель искусственного интеллекта компании на сегодняшний день

Компания OpenAI выпустила более мощную версию своей модели искусственного интеллекта «разума» o1, o1-pro, в своем API для разработчиков. По данным OpenAI, o1-pro использует больше вычислений, чем o1, чтобы постоянно предоставлять лучшие ответы. В настоящее время он доступен только избранным разработчикам — тем, кто потратил не менее 5 долларов на услуги API OpenAI.

продолжить чтение

Оставлено в

SoftBank приобретает Ampere за $6,5 млрд

В среду SoftBank Group объявила о приобретении Ampere Computing, разработчика микросхем, основанного бывшим руководителем Intel Рене Джеймс, в рамках сделки на сумму $6,5 млрд в качестве стратегического шага по расширению инвестиций в инфраструктуру искусственного интеллекта. После сделки, закрытие которой ожидается во второй половине 2025 года, Ampere будет функционировать как дочерняя компания SoftBank, полностью принадлежащая ей.

продолжить чтение

Оставлено в

Reasoning-LLM: архитектура и обзор передовых моделей

Reasoning-LLM — это большие языковые модели, нацеленные на логическое рассуждение при решении сложных задач. В отличие от обычных LLM, которые часто выдавали ответы сразу, такие модели способны «думать» пошагово — как человек, анализируя задачу и выстраивая цепочку вывода. Появление reasoning-LLM связано с тем, что традиционные LLM (например, GPT-4 или Llama 3.1) хотя и хорошо справляются с языковыми и энциклопедическими запросами, нередко ошибались в задачах, требующих сложных вычислений, планирования или логического вывода. В этой статье мы подробно разберем, как работают reasoning-LLM, их внутреннее устройство (Transformer, self-attention, механизмы «мышления»). А еще — рассмотрим передовые модели (OpenAI o1, DeepSeek R1 и Claude 3.7 Sonnet), факторы, влияющие на их точность, и дадим практические рекомендации по применению.

продолжить чтение

Оставлено в

Pruna AI создает свой фреймворк оптимизации открытым исходным кодом

Pruna AI, европейский стартап, работающий над алгоритмами сжатия для моделей искусственного интеллекта, создает свой фреймворк оптимизации открытым исходным кодом.

продолжить чтение

Оставлено в

Меню навигации

Главное

Рубрики

Методики

Информация

Из архивов

Сообщается, что Nvidia приобретает стартап по синтетическим данным Gretel

SoftBank приобретает разработчика полупроводников Ampere за $6,5 млрд

Open-Sora 2.0: новая система в видео-AI снижает стоимость обучения при сохранении качества

Влияние LLM на людей, процессы, продукты и общество в разработке ПО: исследование с ранними пользователями

Неблокирующий вызов внешнего сервиса в процессе

Поиск с использованием ИИ начинает убивать «десять синих ссылок» Google

O1-pro от OpenAI — самая дорогая модель искусственного интеллекта компании на сегодняшний день

SoftBank приобретает Ampere за $6,5 млрд

Reasoning-LLM: архитектура и обзор передовых моделей

Pruna AI создает свой фреймворк оптимизации открытым исходным кодом

Меню навигации

Главное

Рубрики

Методики

Информация

Из архивов

Рекомендуем

Друзья сайта