OpenAI приобретёт компанию Neptune, известную своими инструментами, которые помогают исследователям отслеживать эксперименты, контролировать обучение и понимать поведение моделей в режиме реального времени.

Оставлено в

Визуально-языковые модели: следующий шаг эволюции LLM

Ранее мы разбирали методы самосупервизируемого обучения в компьютерном зрении, которые преобразуют изображения и видео в информативные векторные представления (эмбеддинги). Несмотря на их мощь, такие представления обычно требуют дообучения последующих моделей под конкретные задачи. В отличие от этого, большие языковые модели (LLM) блестяще справляются с zero-shot- и few-shot-задачами без какого-либо дообучения. Мы хотим добиться таких же возможностей для визуальных данных.

продолжить чтение

Оставлено в

Новый Kling 2.6 научился генерировать видео с озвучкой

продолжить чтение

Оставлено в

Исследователи Яндекса представили RATE — новый метод для оценки и улучшения машинного перевода

Наши исследователи разработали новый метод оценки качества машинного перевода. Эту разработку можно использовать для совершенствования моделей, которые уже переводят тексты довольно точно, но делают это не всегда естественно. Например, в неформальном диалоге модель может перевести «sorry, my bad» как «приношу извинения, это моя вина» вместо «извини, ошиблась». Пользователь заметит, что нейросеть выбрала излишне официальный тон, но существующие системы оценки перевода такие ошибки игнорируют. Новый метод помогает обращать внимание нейросетей на такие недочёты.Новая система оценки Яндекса называется

продолжить чтение

Оставлено в

Стартап UMA выводит роботов для промышленности и сервисных сфер

продолжить чтение

Оставлено в

ИИ убил не литературу. Он убил иллюзию, что каждый может быть писателем

продолжить чтение

Оставлено в

AWS открывает путь к корпоративному ИИ: создавайте свои модели на облаке

продолжить чтение

Оставлено в

Дифференциальная приватность в ML

Привет, Хабр! Сегодня поговорим в коротком формате о защите данных при обучении моделей, а именно в процессе обучения. Никому не понравится, если ваша нейросеть вдруг выдаст чужие паспортные данные или медицинские записи, правда? А ведь модели машинного обучения иногда склонны запоминать кусочки обучающего набора. Бывали случчаи, где из языковой модели вытаскивали строки с номерами телефонов и email тех людей, чьи данные были в тренировочном датасете. Стоит ли нам вообще кормить модель конфиденциальной информацией

продолжить чтение