- BrainTools - https://www.braintools.ru -

Платформа для ИИ-агентов Backboard достигла впечатляющего результата 90,1 % в бенчмарке LoCoMo, который предназначен для оценки долговременной диалоговой памяти [1]. Ранее популярные библиотеки показывали показатели в диапазоне 67–69 %, поэтому новый результат значительно повышает планку.

LoCoMo проверяет способность системы запоминать, обновлять и извлекать факты о пользователе и контексте диалога на протяжении множества сессий. Высокий балл означает, что виртуальные ассистенты могут лучше следовать инструкциям, реже переспрашивать пользователя и требовать меньше пояснений, что снижает расход токенов и повышает эффективность взаимодействия.
Backboard предоставляет API для долгосрочной памяти, мультимодельный API для роутинга между более чем 2200 LLM, а также RAG-слой для интеграции внешних знаний. Все результаты теста воспроизводимы — компания опубликовала скрипты, логи и промпты на GitHub, что позволяет другим исследователям проверять и использовать достижения Backboard в своих проектах.
Высокий показатель долговременной памяти [2] открывает новые возможности для создания персонализированных ИИ-ассистентов, способных адаптироваться к пользователю и сохранять контекст на протяжении длительных взаимодействий.
Делегируйте часть рутинных задач вместе с BotHub! [3] Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [4] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Автор: cognitronn
Источник [5]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/21821
URLs in this post:
[1] памяти: http://www.braintools.ru/article/4140
[2] долговременной памяти: http://www.braintools.ru/article/9500
[3] BotHub!: https://bothub.chat/?utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_source=contentmarketing&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_medium=habr&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_campaign=news&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_content=ELEVENLABS%20INTRODUCES%20STT%20MODEL%20WITH%20LESS%20THAN%20150%20MS%20LATENCY
[4] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7
[5] Источник: https://habr.com/ru/companies/bothub/news/965620/?utm_source=habrahabr&utm_medium=rss&utm_campaign=965620
Нажмите здесь для печати.