Машинное обучение. - страница 291

Как масштабирование во время тестирования раскрывает скрытые способности к рассуждению в небольших языковых моделях

Согласно новому исследованию Шанхайской лаборатории искусственного интеллекта, очень маленькие языковые модели (SLM) могут превзойти ведущие большие языковые модели (LLM) в задачах рассуждения. Авторы показывают, что при наличии правильных инструментов и методов масштабирования во время тестирования SLM с 1 миллиардом параметров может превзойти LLM 405B в сложных математических тестах.

продолжить чтение

Nvidia запускает платформу искусственного интеллекта для обучения языку жестов

Nvidia представила новую платформу искусственного интеллекта для обучения людей использованию американского языка жестов, чтобы помочь преодолеть барьеры в общении. Платформа Signs создаёт проверенный набор данных для изучающих язык жестов и разработчиков приложений на основе ASL.

продолжить чтение

Ставка ИИ на $305 миллионов: модели логического вывода увеличивают спрос на графические процессоры

Когда DeepSeek-R1 только вышел на рынок, в отрасли преобладал страх, что сложные вычисления можно будет производить с использованием менее сложной инфраструктуры.

продолжить чтение

Инновационный подход NYU Langone Health к медицинскому образованию с использованием искусственного интеллекта

Записи данных о пациентах могут быть запутанными, а иногда и неполными, а это значит, что у врачей не всегда есть под рукой вся необходимая информация. К этому следует добавить тот факт, что медицинские работники не могут уследить за потоком тематических исследований, научных работ, испытаний и других передовых разработок, появляющихся в отрасли.

продолжить чтение

Партнёрство Voltron Data и Accenture: ускорение обработки данных для внедрения генеративного ИИ

По мере того, как искусственный интеллект создаёт беспрецедентный спрос на обработку данных, стартап Voltron Data из Маунтин-Вью предлагает решение одной из наименее обсуждаемых, но наиболее важных проблем ИИ: перемещение и преобразование больших массивов данных достаточно быстро, чтобы не отставать от темпов развития.

продолжить чтение

Вот уж действительно революция… Нейросети добрались до Minecraft

Совсем недавно, 31 октября 2024 года, миру была представлена новая версия Minecraft. Это та самая песочница из детства, которую все так любят, но только мир генерируется нейросетью в реальном времени.Разработка принадлежит компании Decart, ИИ-модель была названа Oasis. Особенностью игры является отсутствие кода и памяти. Нейросеть не использует привычное нам программирование для создания игры. Вместо этого, она обучается на видеороликах, и пытается прогнозировать следующий кадр. То есть ИИ буквально пытается угадать, что будет видеть игрок после движения мышью или нажатия на клавиатуру.

продолжить чтение

MarketNet: Применение компьютерного зрения на финансовых рынках

У нас уже есть WordNet и ImageNet

продолжить чтение

Большой обзор больших языковых моделей

Большая языковая модель — что это такое?LLM (Large Language Model, большая языковая модель) — это тип модели машинного обучения (или тип модели глубокого обучения), основанный на больших объёмах данных, который может выполнять любые задачи по обработке естественного языка (Natural Language Processing, NLP).Более простыми словами это нейронная сеть с крайне большим количеством изменяемых параметров, которая позволяет решать задачи по обработке и генерации текста. Чаще всего реализована в виде диалогового агента, с которым можно общаться в разговорной форме.NLP

продолжить чтение

Google удаляет Gemini из основного поискового приложения на iOS

Google удаляет своего ИИ-помощника Gemini из основного приложения Google для устройств iOS. Этот шаг призван побудить пользователей вместо этого загрузить отдельное приложение Gemini, что позволит Google напрямую конкурировать с другими чат-ботами, ориентированными на потребителей, такими как ChatGPT, Claude или Perplexity. Однако это изменение может привести к сокращению охвата Gemini, поскольку приложением Google уже пользуются миллионы людей, и многие из них недостаточно мотивированы для загрузки других новых мобильных приложений.

продолжить чтение

Нет, ваша генеративная модель меня не заменит

ВведениеЗа последние три недели я устранил пару проблем с производительностью, что потенциально сэкономило компании несколько сотен тысяч долларов (я подрядчик, поэтому, к сожалению, не получаю никаких премий).

продолжить чтение

Rambler's Top100