искусственный интеллект.

Даже если случайно переставить буквы в словах, GPT-4 понимает текст

Цветом выделена токенизация Для представления внутри трансформеров слова или их небольшие части преобразуются в токены. Кажется, что если перемешать в каждом слове буквы, то языковая модель на трансформерах потеряет всякую способность понимать текст. Авторы научной работы «Unnatural Error Correction: GPT-4 Can Almost Perfectly Handle Unnatural Scrambled Text» (arXiv:2311.18805) показали, что это не так. Как выяснилось, GPT-4 без проблем оперирует текстом, где в каждом слове все буквы случайно переставлены.

продолжить чтение

Оставлено в

Ответ ChatGPT длиннее, если пообещать чаевые

@voooooogel Микроблогер поделилась забавным наблюдением про работу ChatGPT: языковая модель реагирует на обещание дать чаевые и отвечает чуть подробнее. Хотя чат-бот не имеет возможности получить оплату, размер ответа всё равно незначительно вырастает.

продолжить чтение

Оставлено в

Microsoft Research выпустила Orca 2 LLM, способную сравниться по производительности с крупными моделями

Microsoft Research объявила о выпуске Orca 2, второй версии своей языковой модели Orca. В своём блоге Microsoft заявила, что Orca 2 была разработана как LM меньшего размера, но её всё равно можно использовать для ответов на сложные вопросы наравне с LLM.

продолжить чтение

Оставлено в

Разработчик выпустил llm.js — библиотеку для запуска больших языковых моделей в браузере

Разработчик под никнеймом rahuldshetty опубликовал на GitHub библиотеку llm.js, предназначенную для запуска больших языковых моделей в браузере. Заявлена поддержка GPT-2, LLaMa 2 и других популярных решений.

продолжить чтение

Оставлено в

Контекстное окно в 200 тыс. токенов Claude 2.1 подвергли проверке

Anthropic Компания Anthropic представила Claude 2.1, следующую версию своей языковой модели. В 2.1 заявлены разнообразные улучшения точности и 50-процентное сокращение частоты галлюцинаций. Новая модель удваивает размер контекстного окна со 100 тыс. токенов до 200 тыс. Грег Камрадт протестировал эффективность памяти Claude 2.1 в зависимости от длины контекста и выдал несколько рекомендаций.

продолжить чтение

Оставлено в

Трансформация сферы разработки Программного Обеспечения под влиянием Искусственного Интеллекта (AI)

продолжить чтение

Оставлено в

IBM представила аналоговый чип ИИ по образцу человеческого мозга

Исследователи IBM Research рассказали, как они использовали человеческий мозг в качестве модели при создании аналогового чипа для задач, связанных с искусственным интеллектом. Они опубликовали

продолжить чтение

Оставлено в

Как сделать Stable Diffusion XL ещё умнее, используя отрицательные подсказки

В прошлом месяце Stability AI выпустила Stable Diffusion XL 1.0 (SDXL) и дала открытый доступ к его исходному коду всем желающим. Пример изображений SDXL 1.0Релиз прошел практически незамеченным, потому что шумиха вокруг генеративного искусственного интеллекта немного поутихла. Все слишком заняты

продолжить чтение

Оставлено в

Быть особенным

продолжить чтение

Оставлено в