Машинное обучение.

Ответ ChatGPT длиннее, если пообещать чаевые

@voooooogel Микроблогер поделилась забавным наблюдением про работу ChatGPT: языковая модель реагирует на обещание дать чаевые и отвечает чуть подробнее. Хотя чат-бот не имеет возможности получить оплату, размер ответа всё равно незначительно вырастает.

продолжить чтение

Оставлено в

Microsoft Research выпустила Orca 2 LLM, способную сравниться по производительности с крупными моделями

Microsoft Research объявила о выпуске Orca 2, второй версии своей языковой модели Orca. В своём блоге Microsoft заявила, что Orca 2 была разработана как LM меньшего размера, но её всё равно можно использовать для ответов на сложные вопросы наравне с LLM.

продолжить чтение

Оставлено в

Разработчик выпустил llm.js — библиотеку для запуска больших языковых моделей в браузере

Разработчик под никнеймом rahuldshetty опубликовал на GitHub библиотеку llm.js, предназначенную для запуска больших языковых моделей в браузере. Заявлена поддержка GPT-2, LLaMa 2 и других популярных решений.

продолжить чтение

Оставлено в

Контекстное окно в 200 тыс. токенов Claude 2.1 подвергли проверке

Anthropic Компания Anthropic представила Claude 2.1, следующую версию своей языковой модели. В 2.1 заявлены разнообразные улучшения точности и 50-процентное сокращение частоты галлюцинаций. Новая модель удваивает размер контекстного окна со 100 тыс. токенов до 200 тыс. Грег Камрадт протестировал эффективность памяти Claude 2.1 в зависимости от длины контекста и выдал несколько рекомендаций.

продолжить чтение

Оставлено в

IBM представила аналоговый чип ИИ по образцу человеческого мозга

Исследователи IBM Research рассказали, как они использовали человеческий мозг в качестве модели при создании аналогового чипа для задач, связанных с искусственным интеллектом. Они опубликовали

продолжить чтение

Оставлено в

Как сделать Stable Diffusion XL ещё умнее, используя отрицательные подсказки

В прошлом месяце Stability AI выпустила Stable Diffusion XL 1.0 (SDXL) и дала открытый доступ к его исходному коду всем желающим. Пример изображений SDXL 1.0Релиз прошел практически незамеченным, потому что шумиха вокруг генеративного искусственного интеллекта немного поутихла. Все слишком заняты

продолжить чтение

Оставлено в

В OpenAI изучили работу GPT-2 при помощи GPT-4 и попытались объяснить поведение нейронов

Специалисты из OpenAI опубликовали исследование, в котором описали, как при помощи языковой модели GPT-4 они пытались объяснить работу нейронов её предшественницы, GPT-2. Сейчас разработчики компании стремятся продвинуться в «интерпретируемости» нейросетей и понять, почему те создают именно тот контент, который мы получаем.

продолжить чтение

Оставлено в

OpenAI перестала использовать данные клиентов для обучения языковых моделей

Генеральный директор OpenAI Сэм Альтман заявил, что компания больше не использует данные клиентов для обучения своих больших языковых моделей. OpenAI обновила свои Условия обслуживания, чтобы отразить эти изменения.

продолжить чтение

Оставлено в

Какой метод генерации аудио лучший? Сравнение GAN, VAE и Diffusion

В прошлой статье я затронул тему генерации звука с помощью диффузионной модели. Но какие методы существуют вообще и какой из них сейчас наиболее перспективен? Сегодня мы рассмотрим долгий путь этого направления в машинном обучении. Послушаем результаты, посмотрим метрики и просто взглянем на новые технологии, применяемые в совершенно разных нейросетях для аудиосинтеза.

продолжить чтение

Оставлено в

Пылесосы следят за тобой, анон! Скандал с Roomba из-за фото женщины в туалете и новый взгляд на разработку ИИ

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Машинное обучение.

Ответ ChatGPT длиннее, если пообещать чаевые

Microsoft Research выпустила Orca 2 LLM, способную сравниться по производительности с крупными моделями

Разработчик выпустил llm.js — библиотеку для запуска больших языковых моделей в браузере

Контекстное окно в 200 тыс. токенов Claude 2.1 подвергли проверке

IBM представила аналоговый чип ИИ по образцу человеческого мозга

Как сделать Stable Diffusion XL ещё умнее, используя отрицательные подсказки

В OpenAI изучили работу GPT-2 при помощи GPT-4 и попытались объяснить поведение нейронов

OpenAI перестала использовать данные клиентов для обучения языковых моделей

Какой метод генерации аудио лучший? Сравнение GAN, VAE и Diffusion

Пылесосы следят за тобой, анон! Скандал с Roomba из-за фото женщины в туалете и новый взгляд на разработку ИИ

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

Машинное обучение.