Машинное обучение. - страница 257

Apple не будет использовать DeepSeek в ИИ-помощнике Apple Intelligence в Китае

По информации профильных источников, Apple не будет использовать системы нейросети DeepSeek в ИИ-помощнике Apple Intelligence в материковом Китае.

продолжить чтение

«Вспомнить всё»: исследователи предложили архитектуру языковых моделей с большой памятью

9 февраля на arXiv была опубликована новая научная работа "LM2: Large Memory Models", в которой исследователи описали обновление классической архитектуры LLM на базе трансформеров. LM2 превосходит как модель RMT с дополненной памятью на 37.1%, так и базовую модель Llama-3.2 на 86,3% в среднем по задачам.В чем суть?Исследователи из Convergence Labs представили Large Memory Model (LM2) – новую архитектуру языковых моделей, которая преодолевает ограничения традиционных трансформеров в обработке длинного контекста.LM2 дополняет стандартный механизм внимания отдельным модулем памяти

продолжить чтение

Модели Goku от ByteDance могут создавать реалистичные видеоролики о продуктах без участия людей-актеров

Последние модели искусственного интеллекта китайской технологической компании могут генерировать реалистичные видеоролики, на которых люди взаимодействуют с продуктами, потенциально меняя подход компаний к созданию рекламного контента.

продолжить чтение

Google расширяет возможности NotebookLM Plus для индивидуальных пользователей

Google расширил NotebookLM Plus, платную версию своего помощника для создания заметок и проведения исследований на основе искусственного интеллекта, для индивидуальных пользователей, подписавшихся на план Google One AI Premium, спустя почти два месяца после его дебюта для предприятий в Google Cloud и через Google Workspace.

продолжить чтение

Венчурные инвесторы предпочитают стартапы в сфере искусственного интеллекта другим технологиям

Венчурные инвесторы охотно вкладывают средства в стартапы, занимающиеся искусственным интеллектом, но остаются разборчивыми, когда дело доходит до финансирования более широкого спектра технологий.

продолжить чтение

Нейронкам делегируют многое, но остаются сложности — LLM в научной деятельности и работе с кодом

Недавно мы провели обзор исследований, посвященных работе с большими языковыми моделями в ЦОД. Обсудили, почему происходят сбои при обучении моделей и применимость LLM в кибербезопасности.

продолжить чтение

Автоматизация разведочного анализа данных (EDA) с помощью Python

Всем привет! Меня зовут Константин Некрасов, я работаю дата-сайентистом в Газпромбанке. Хочу рассказать про инструмент, который серьезно упростил мою повседневную работу с данными, и поделиться им.Если вы когда-нибудь занимались машинным обучением, то знаете — перед тем как строить модель, нужно как следует изучить свои данные. Этот этап называется EDA (Exploratory Data Analysis), или разведочный анализ данных (РАД). Он критически важен — именно здесь мы находим скрытые закономерности, выдвигаем первые гипотезы и понимаем, как лучше обработать данные для будущей модели.

продолжить чтение

Руководитель DeepMind опроверг прорыв DeepSeek в области ИИ

Генеральный директор Google DeepMind Демис Хассабис заявил, что модель искусственного интеллекта DeepSeek «вероятно, стала лучшей работой» исследователей из Китая, но добавил, что компания не продемонстрировала никаких новых научных достижений. 

продолжить чтение

Учебник — всё, что вам нужно

Немного вызывающее название статьи отсылает к известной работе Внимание - всё, что вам нужно. На этот раз речь пойдет о качестве данных, на которых обучают LLM. Оказывается, качественный учебник (как концентрат знаний в любой сфере) в разы сокращает потребность и в памяти, и в мощности GPU, и в деньгах инвесторов...

продолжить чтение

Европейские компании объединяются, чтобы ускорить внедрение искусственного интеллекта

В понедельник, когда в Париже начался саммит по искусственному интеллекту, около 60 европейских компаний — от действующих промышленных гигантов до стартапов в сфере AI (в том числе французский производитель больших языковых моделей Mistral) — присоединились к инициативе, призванной помочь Европе стать лидером в области AI. Но тот факт, что они вообще сочли необходимым присоединиться, подчёркивает широко распространённое мнение о том, что в нынешних условиях Европа далека от того, чтобы стать лидером в области AI.

продолжить чтение

Rambler's Top100